COGugaison icon indicating copy to clipboard operation
COGugaison copied to clipboard

Difference between insee and COGugaison

Open paul-carteron opened this issue 1 year ago • 2 comments

Hi,

Is there somewhere you explain the difference between your dataset and th official insee dataset ?

For 2023 your dataset has 34945 row and insee dataset has 37563.

paul-carteron avatar Jun 06 '23 07:06 paul-carteron

Bonjour, Certaines tables de passage de l'Insee dont probablement celle dont vous faites référence listent l'ensemble des communes qui ont existé depuis plusieurs dizaines d'années. C'est pourquoi il y a + 37000 communes alors qu'aujourd'hui le nombre de communes est davantage proche de 35000.

antuki avatar Jun 08 '23 07:06 antuki

Je vois, il y a donc un traitement de la donnée brute par vos soins pour obtenir le dataset final ?

Si c'est le cas, il pourrait être intéressant d'intégrer les données brutes et le script de traitement dans le package ou alors préciser les étapes de nettoyage dans la documentation.

Dans tous les cas, merci pour votre travail !

paul-carteron avatar Jun 08 '23 07:06 paul-carteron

Je repars d'autres tables de passage présentes sur Insee.fr que j'héberge dans les RData du package avec peu de retraitement :

https://www.insee.fr/fr/information/7671867 => table_passage_annuelle_2024.zip https://www.insee.fr/fr/information/7671844 => table-appartenance-geo-communes-24.zip

Mais en effet, ce peu de retraitement est assez manuel et ne figure pas dans ce répertoire de code.

Merci pour votre retour !

antuki avatar Jul 01 '24 17:07 antuki