python-datascientist
python-datascientist copied to clipboard
Dépôt associé au cours Python pour data scientists (ENSAE 2e année)
https://www.ft.com/content/4788beae-9035-4449-b5cd-200dc7b6ea9d https://twitter.com/mclucal/status/1531260934022365185 https://twitter.com/JulesGrandin/status/1531631375505399809
Petite liste de refs utiles pour un futur chapitre sur cette question: - [package `shap`](https://shap.readthedocs.io/en/latest/example_notebooks/overviews/An%20introduction%20to%20explainable%20AI%20with%20Shapley%20values.html) - https://christophm.github.io/interpretable-ml-book/shapley.html - https://github.com/interpretml/interpret - https://arxiv.org/abs/2203.03729 ce type de chapitre fera plaisir à @oliviermeslin
Proposer un template de projet sur un repo annexe qui illustre une belle structure de projet, que les élèves peuvent forker comme base de départ : - un notebook main.ipynb...
- Follow-up de #203 - [ ] Comparaison performance entre modèles grâce aux pipelines - [ ] Intégration d'une étape de sélection de variable dans un pipeline - [ ]...
Il y a une partie sur l'intégration continue [ici](https://linogaliana-teaching.netlify.app/pythonci/). Elle mériterait d'être mise à jour pour évoquer les github actions plutôt que travis
https://aeturrell.github.io/coding-for-economists/intro.html
La méthode à l'heure actuelle pour contribuer est pas très pratique avec la branche `dev` en passe plat. Cela a du sens pour les grosses contributions mais les relectures (par...
Quelques remarques des élèves: * parfois des temps morts en classe: trouver une manière d'éviter d'être bloqué (cf. #137) * proposer des exercices complémentaires pour s'entraîner * passer moins de...
Voici un plan un peu enrichi pour la future version 2 du cours # Manipulation 1. Numpy puis Pandas 2. Geopandas 3. Données plus volumineuses: postgre, dask, spark 4. Import...