data-analyst
data-analyst copied to clipboard
Bootcamp Data Analyst avec Python: Des bases de Python à l'analyse et visualisation de données pour l'extraction de connaissances et storytelling
Bootcamp Analyse de données avec Python 🐍 📉
Ce dépôt contient le code de la 1ère édition du Bootcamp Analyse de Données avec Python enseigné par Kevin Degila .
Ce bootcamp vous apprend les bases du langage de programmation Python🐍 et l'Analyse de données 📉, de l'import à la visualisation.
Nous utilisons Google Colab dans ce bootcamp. Accédez à tous les notebooks sur Colab en cliquant ici : . Certains notebooks sont encore en cours d'écriture.
Les vidéos de ce bootcamp seront disponibles gratuitement sur la chaîne YouTube Kevin Degila : https://www.youtube.com/c/KevinDegila
A la fin de ce bootcamp, vous serez en mesure de :
- Importer des données sous format csv, sql json, html et autres pour de l'analyse
- Nettoyer, transformer et explorer les données avec Pandas et Numpy
- Utiliser des notions statistiques pour répondre à des questions utiles à propos de vos données
- Appliquer les principes de la Visualisation pour découvrir des informations utiles et faire du storytelling
📜 Plan du bootcamp
Module 0: Introduction à Jupyter notebook 📓
- Coder dans le cloud avec Google Colab : Lien Vidéo
- Installer Jupyter notebook en local : Lien Vidéo
Module 1 : Les bases de Python 🐍
- Les Variables et opérateurs
- Les Types de données en Python (int, float, str, list, tuples, dict, set)
- Recevoir des données de l'utilisateur avec la fonction input
- Les conditions (if else elif)
- Les boucles (for, while)
- Les fonctions et Modules
- Manipuler les fichiers en Python
- La programmation orientée objet en Python
Module 2 : Introduction au calcul numérique avec Numpy 🧱
- Les bases d'un tableau Numpy
- Les fonctions Numpy: alternative plus rapide aux boucles
- Filtrage et indexation des tableaux Numpy
- Le concept de broadcasting: diffusion de vecteur
Module 3 : Manipuler les données avec Pandas ⚙️
- Les bases d'un dataframe Pandas
- Sélection, Filtrage et Indexation des données avec Pandas
- Gestion des valeurs manquantes avec Pandas
- Combiner et Merger des datasets avec Pandas
- Opérations et aggrégation de données avec Pandas
- Nettoyage et ordonnement des données avec Pandas
- Analyse des séries temporelles
- Introduction à la visualisation avec Pandas
Module 4 : Visualization des données avec Matplotlib et Seaborn 📊
- Guide pour la visualisation des données
- Les bases de Matplotlib
- De meilleures visualisations avec Seaborn
Module 5 : Projet Analyse de données ⚒️
- Projet 1 : Analyse des données du Titanic
- Projet 2: Analyse de données de vente d'un supermarché sur une année
- Projet 3 : Analyse des données du Covid 19 dans le monde
Format du bootcamp 🛡️
- Chaque module est accompagné d'un ou plusieurs notebooks explicatifs
- Chaque sous-module est accompagné d'exercices pour pratiquer les notions apprises
- On fera plusieurs erreurs lors des séances live ou vidéos afin d'apprendre comment chercher des solutions à chaque erreur
- Ce bootcamp n'enseignera pas tout ce qu'il faut mais le strict nécéssaire. Les apprenants seront appélés à complèter quelques notions par eux-mêmes grâce aux différentes ressources partagées. Savoir apprendre de nouvelles notions tout seul est une qualité chez un data analyst.
Apprendre en Communauté 🤝
L'un des avantages du format Bootcamp est d'apprendre des autres apprenants. Nous utiliserons Discord pour la communication hors séance live. Voici le lien du serveur : https://discord.gg/sHE5exZ . N'hésitez pas à poser des questions et à répondre quand vous avez les réponses aux questions posées.
Ressources supplémentaires 📚
- Site pour apprendre et s'exercer en Python : https://www.w3schools.com/python/
- Visualiser l'éxecution de votre code Python avec Python Tutor : http://pythontutor.com/
- Livre gratuit pour apprendre Numpy, Pandas, Matplotlib et Seaborn : https://jakevdp.github.io/PythonDataScienceHandbook/
- Site pour s'exercer en Python en s'amusant : https://www.codingame.com/start
Site pour télécharger des données 📖
- Kaggle Datasets : https://www.kaggle.com/datasets
- fivethirtyeight : https://data.fivethirtyeight.com/
- Google Dataset Search : https://datasetsearch.research.google.com/
- UCI Machine Learning Repository : https://archive.ics.uci.edu/ml/datasets.php
- BuzzFeed News : https://github.com/BuzzFeedNews
- Banque mondiale : https://data.worldbank.org/
Soutenir ce bootcamp 🙌
Vous pouvez soutenir ce bootcamp à travers le partage à des personnes qui en profiteraient et en faisant un don à https://paypal.me/kevindegila . Les fonds recueillies permettront d'augmenter la qualité des vidéos qui accompagnent le code.
Me contacter 📩
Vous pouvez m'envoyer un mail à [email protected]