sofortmassnahmen
sofortmassnahmen copied to clipboard
Schulverzeichnisse der Länder als JSON für die OpenData-Portale der Länder, auf welches das OpenData-Portal des Bundes zugreift.
Das Ministerium für Schule und Bildung des Landes Nordrhein-Westfalen (MSB NRW) stellt unter https://www.schulministerium.nrw.de/BiPo/SchuleSuchen/pages/schulsuche/schule_formular.xhtml eine Möglichkeit bereit, Schulstammdaten über eine (in meinen Augen keiner intuitiven) grafischen Weboberfläche anzufragen. Ich habe bisher keine Möglichkeit gefunden, da eine API ansprechen zu können.
Wenn es eine Möglichkeit gäbe, eine API anzusprechen und einen JSON-File zu generieren mit dem Inhalt, könnte man diese ins OpenData-Portal des Land NRW (open.nrw) über einen automatischen Prozess, der die API abfragen würde und in das OpenData-Portal einspeisen könnte.
Ähnliche Plattformen wird es wohl in anderen Bundesländern geben.
Hey @Lukas2112, sehr cool, möchtest Du die dokumentieren? Dann lege ich Dir ein Repo an.
Ich kann es gerne versuchen zu dokumentieren.
Auf den ersten Blick scheint es mir die Herangehensweise vom Handelsregister (in Teilen) übernehmen zu können.
Ich bin bei einer erweiterten Interrecherche auf das Online-Portal "ChoiceLab" aufmerksam geworden, was vielleicht spannend sein könnte: https://www.choicelab.de/schools
@Lukas2112 das werden wir vmtl nicht als Quelle benutzen können. Weil in privater Hand.
Könnte eine IFG-Anfrage, an die Kultusministerien der Länder helfen?
Arbeit in Richtung Scraper gibt es schon unter https://github.com/Datenschule/jedeschule-scraper
Der jedeschule-scraper benutzt als Datenquelle https://www.schulministerium.nrw.de/BiPo/OpenData/Schuldaten/schuldaten.csv.
Ich hab mal nen kleinen Scraper für die oben verlinkte Website geschrieben. Beides gibt eine unterschiedliche Anzahl an Ergebnissen zurück, das CSV enthält 5507 Zeilen, die Website 5412 Ergebnisse. Die Differenz gibt sich aber, wenn man alle Schulämter (Schulnummner 6xxxxx) sowie alle Schulen mit den Schulbetriebsschlüsseln (https://www.schulministerium.nrw.de/BiPo/OpenData/Schuldaten/key_schulbetriebsschluessel.csv) 6 (nur bestimmte Erhebung) und 9 (Löschung zum Jahresende) rausnimmt. Wahrscheinlich wird einfach nach Schulbetriebsschlüssel == 2 (in Betrieb) gefiltert.
Die Datenquelle ist auch schon im OpenData Portal von NRW: https://open.nrw/dataset/schulgrunddaten_nrw_1572515479 und wird dort als XML angeboten. Es gibt sie zudem als CSV, wenn man die Endung ersetzt, als JSON leider nicht.
Eine API, um die nur die Infos einer einzigen Schule abzurufen, wäre trotzdem sehr praktisch.
Scraper: https://github.com/auchtetraborat/nrw-school-scraper-compare