GTFS-Issues icon indicating copy to clipboard operation
GTFS-Issues copied to clipboard

DELFI: agency_url nicht angegeben

Open hbruch opened this issue 5 years ago • 9 comments

Nach GTFS API-Spezifikation ist das Feld agency_url der agency.txt verpflichtend anzugeben (required).

Für alle Einträge der agency.txt des Feeds ist die URL leer (""). Dies ist nach Standard nicht vorgesehen und führt bei einigen GTFS-Tools zu Verarbeitungsfehlern und Abbrüchen.

Aktualisierungszeitpunkt der GTFS-Daten:

  1. April 2020

Downloadlink der GTFS-Daten: https://cms.opendata-oepnv.de/fileadmin/datasets/delfi/20200401_fahrplaene_gesamtdeutschland_gtfs.zip

hbruch avatar Apr 03 '20 10:04 hbruch

Tritt in Datensatz mit Veröffentlichungszeitpunkt 3. April 2020 weiterhin auf.

hbruch avatar Apr 04 '20 15:04 hbruch

Antwort von DELFI e.V. am 6.4.:

Da der DELFI-Datensatz im GTFS-Format ein eigenes DELFI-Produkt ist und als vollständiger Datensatz geliefert wird, bitten wir Sie bei der Weiterverwendung um Quellenangabe „DELFI e.V.“. Das Feld „agency url“ ist daher im DELFI-Datensatz nicht gefüllt.

hbruch avatar Apr 07 '20 15:04 hbruch

Die Quellenangabe kann auch direkt innerhalb des GTFS-Feeds in der seit einiger Zeit spezifizierten attributions.txt ergänzt werden, so dass entsprechend vorbereitete Systeme diese automatisch korrekt anzeigen können. Unabhängig davon ist das Nichtfüllen des Feldes agency_url nicht konform zur Spezifikation und verursacht Fehler in verarbeitenden Systemen. Üblicherweise lösen Datenbereitsteller dies dadurch, dass sie die eigene URL (also z.B. https://www.delfi.de/) angegeben.

hbruch avatar Apr 07 '20 15:04 hbruch

Problem besteht im Datensatz vom 30.4.2020 weiterhin:

select agency_url, count(*) from gtfs.agency group by agency_url;
      agency_url       | count
-----------------------+-------
                       |   858
 www.von-rahden.de     |     1
 https://www.delfi.de/ |     1

hbruch avatar May 02 '20 21:05 hbruch

Problem besteht in Datensatz vom 08.05.2020 weiterhin:

select agency_url, count(*) from gtfs.agency group by agency_url;
      agency_url       | count
-----------------------+-------
                       |   822
 www.von-rahden.de     |     1
 https://www.delfi.de/ |     1
(3 rows)

hbruch avatar May 09 '20 20:05 hbruch

Für die meisten agencies ist Stand heute https://www.delfi.de/ als agency angegeben.

Im Datensatz vom 26.11.2021 jedoch für die folgenden Eintrag nicht:

13426,"Karlsruher Verkehrsberbund","","Europe/Berlin","",""
13451,"ARGE SFB","","Europe/Berlin","",""
13452,"Frölich Linie","","Europe/Berlin","",""
13601,"Stadtbus Bad Wildungen","","Europe/Berlin","",""

Zudem ist die Schreibweise ist des KVV fehlerhaft (Verkehrsberbund)

Um sicherzustellen, dass GTFS-Veröffentlichungen des DELFI e.V. den GTFS-Spezifikation entsprechen, empfehle ich den Einsatz eines Validators, z.B. GTFSVTOR oder MobilityData-GTFS-Validator

hbruch avatar Dec 02 '21 11:12 hbruch

Vielen Dank für den Hinweis. In den Daten vom 03.12. sind die URLs vollständig hinterlegt. Der Rechtschreibfehler wurde leider für heute vergessen zu korrigieren. Das ist dann in der nächsten Bereitstellung korrigiert.

Busfahrer795 avatar Dec 03 '21 15:12 Busfahrer795

Mit dem Datensatz vom 21.03.2022 enthalten zwar alle agencies eine agency_url, allerdings wird empfohlen,

  • für die agencies ihre jeweiligen Websites als agency_urls zu verwenden,
  • und für die den Feed erstellende Organisation die Felder feed_publisher_url bzw. feed_contact_url in feed_info.txt zu verwenden.

Darüber hinaus gilt der Hinweis zuvor bzgl. attributions.txt, mit der sich sehr detailliert ausdrücken lässt, von wem welche Daten stammen:

Die Quellenangabe kann auch direkt innerhalb des GTFS-Feeds in der seit einiger Zeit spezifizierten attributions.txt ergänzt werden, so dass entsprechend vorbereitete Systeme diese automatisch korrekt anzeigen können. Unabhängig davon ist das Nichtfüllen des Feldes agency_url nicht konform zur Spezifikation und verursacht Fehler in verarbeitenden Systemen. Üblicherweise lösen Datenbereitsteller dies dadurch, dass sie die eigene URL (also z.B. https://www.delfi.de/) angegeben.

derhuerst avatar Mar 24 '22 12:03 derhuerst

Mit dem neuesten Datensatz vom 8.4. (Last-Modified: Mon, 08 Apr 2024 11:02:27 GMT) enthalten 3 Einträge wieder keine agency_url.

qsv search -s agency_url '^$' agency.txt
# agency_id,agency_name,agency_url,agency_timezone,agency_lang,agency_phone
# 14582,Sonstige Eisenbahnen1,,Europe/Berlin,,
# 14587,AK Autokraft Projekt Smile24,,Europe/Berlin,,
# 14588,Omnibusverkehr Fischer,,Europe/Berlin,,

Wann stellt der DELFI endlich durch automatisierte Überprüfungen der eingehenden und ausgehenden Daten sicher, das Fehler nicht wiederholt passieren, die seit Jahren bekannt sind?

derhuerst avatar Apr 09 '24 11:04 derhuerst

Im Datensatz vom 12.08.2024 enthalten alle 1154 Agencies die agency_url https://www.delfi.de:

select agency_url, count(*) from gtfs.agency group by agency_url;
┌──────────────────────┬──────────────┐
│      agency_url      │ count_star() │
│       varchar        │    int64     │
├──────────────────────┼──────────────┤
│ https://www.delfi.de │         1154 │
└──────────────────────┴──────────────┘

Auch wenn für die Agencies sinnvollerweise die tatsächlich ihnen zugehörigen URLs eingetragen sein sollten, schließe ich den Eintrag, da derzeit immerhin kein syntaktischer Fehler mehr vorliegt.

hbruch avatar Aug 16 '24 20:08 hbruch