bano icon indicating copy to clipboard operation
bano copied to clipboard

Reprise par la BANO de la confusion de rues de mêmes noms de la BAN

Open frodrigo opened this issue 10 months ago • 10 comments

Je rencontre un problème avec certaines rues de Bordeaux qui ont des noms identiques dans des quartiers différents ainsi que des codes postaux différents.

Chacune des rues est correcte dans OSM, avec son code ref:FR:FANTOIR :

  • https://www.openstreetmap.org/relation/3250133#map=17/44.827737/-0.570163
  • https://www.openstreetmap.org/relation/3508017#map=17/44.846407/-0.607413

Le problème est que dans la BAN, il n'y en a qu'un pour les deux : 33063_4900. La 33063_4901 est manquante. J'ai signalé ce jour le problème sur https://signalement.adresse.data.gouv.fr

Actuellement BANO sort 3 rues :

{"id":"330634901","citycode":"33063","type":"street","name":"Rue Kléber","postcode":"33200"
{"id":"330634901","citycode":"33063","type":"street","name":"Rue Kléber","postcode":"33800"
{"id":"330634900","citycode":"33063","type":"street","name":"Rue Kléber","postcode":"33800"

J'ai pris cet exemple, mais il y en a d'autres, c'est peut-être le cas de toutes les rues à noms dupliqués de la ville.

Y-a-t’il un moyen de faire en sorte que BANO distingue correctement les deux rues en sortie ?

frodrigo avatar Feb 10 '25 18:02 frodrigo

Ça concerne cette liste de voies.

select code_insee, array_agg(distinct nom_ancienne_commune) as nom_ancienne_commune, fantoir, array_agg(distinct nom_voie) as nom_voie, array_agg(distinct code_postal) as code_postal, count(distinct cluster) from (select *, ST_ClusterWithinWin(ST_Transform(geometrie, 2154), 1000) over (PARTITION BY code_insee, fantoir, nom_voie) as cluster from ban where code_insee='33063') as t group by code_insee, fantoir, nom_voie having count(distinct cluster) >= 2;
 code_insee | nom_ancienne_commune |  fantoir  |           nom_voie            | code_postal | count 
------------+----------------------+-----------+-------------------------------+-------------+-------
 33063      | {Caudéran,NULL}      | 330631450 | {"Rue Camille Saint-Saëns"}   | {33000}     |     2
 33063      | {Caudéran,NULL}      | 330632325 | {"Rue Corot"}                 | {33100}     |     2
 33063      | {Caudéran,NULL}      | 330634645 | {"Rue Jean-Jacques Rousseau"} | {33000}     |     2
 33063      | {Caudéran,NULL}      | 330634900 | {"Rue Kléber"}                | {33800}     |     2
 33063      | {Caudéran,NULL}      | 330634955 | {"Rue de Lacanau"}            | {33000}     |     2
 33063      | {Caudéran,NULL}      | 330635995 | {"Rue Maréchal Joffre"}       | {33000}     |     2
 33063      | {Caudéran,NULL}      | 330637300 | {"Rue Pierre Loti"}           | {33800}     |     2

Les données diffusées par la Métropole de Bordeaux sont elles correctes https://datahub.bordeaux-metropole.fr/explore/dataset/met_adresse-format-bal/information/

Les données de la BAL sur adresse.data.gouv.fr contiennet également le problème.

frodrigo avatar Feb 12 '25 12:02 frodrigo

Y-a-t’il un moyen de faire en sorte que BANO distingue correctement les deux rues en sortie ?

Tu voudrais quelle sortie à la place de l'actuelle ? Aujourd'hui il y a une ligne par combinaison de rue et code postal

vdct avatar Feb 12 '25 16:02 vdct

Tu voudrais quelle sortie à la place de l'actuelle ? Aujourd'hui il y a une ligne par combinaison de rue et code postal

J'aimerais qu’en sortie ce soit juste :-). C'est à dire qu'il y ait deux lignes, une ligne pour chacune des rues. Chaque rue à son propre fantoir et utilise un code postal.

Le problème ici, c'est que la BAN induit la BANO en erreur, alors que c'est juste dans OSM.

frodrigo avatar Feb 12 '25 16:02 frodrigo

Si j'en crois OSM les données dans Caudéran devraient toutes avoir le CP 33200 or dans ton tableau on voit d'autres valeurs mais pas 33200. Normalement les CPs. Pour les rues Kleber toutes les données BAN ont 33800. Possible que ce soit la source de la ligne en trop dans ton résultat. Il faudrait faire un test dans OSM en ajoutant le tag addr:postcode aux numeros de Cauderan avec la valeur 33200 pour voir si ça suffit à rectifier ça

vdct avatar Feb 12 '25 21:02 vdct

Si j'en crois OSM les données dans Caudéran devraient toutes avoir le CP 33200

Pour Caudéran il y a plusieurs codes postaux enchevêtrés.

Il faudrait faire un test dans OSM en ajoutant le tag addr:postcode aux numeros de Cauderan avec la valeur 33200

Ok. J'ai ajouté addr:postcode aux deux.

frodrigo avatar Feb 12 '25 22:02 frodrigo

Ça n'a rien changé dans l'export BANO dispo aujoud'hui.

frodrigo avatar Feb 14 '25 10:02 frodrigo

Ok. J'ai ajouté addr:postcode aux deux.

Je proposais de l'ajouter aux numéros, mais tu l'as ajouté aux relations (https://www.openstreetmap.org/changeset/162446663) C'est sur les numéros que le cp est pris s'il existe : https://github.com/osm-fr/bano/blob/bano_v3/bano/sql/charge_numeros_OSM.sql#L48

vdct avatar Feb 14 '25 12:02 vdct

En effet. J'ai mis les tags sur les nodes.

À noter au passage, qu’il y a quand même 10% des relations en France qui ont ce tag sur la relation associatedStreet.

La demande de correction coté fournisseur de données BAL avance également.

frodrigo avatar Feb 14 '25 16:02 frodrigo

On m'a remonté que ce problème est un problème général de la BAN depuis plusieurs semaines avec les voies homonymes sur une même commune et les communes avec plusieurs codes postaux.

frodrigo avatar Feb 17 '25 10:02 frodrigo

En effet. J'ai mis les tags sur les nodes.

À noter au passage, qu’il y a quand même 10% des relations en France qui ont ce tag sur la relation associatedStreet.

La demande de correction coté fournisseur de données BAL avance également.

Ça toujours rien changé au résultat.

frodrigo avatar Feb 17 '25 12:02 frodrigo