MServer
MServer copied to clipboard
ARD: Vorab-Folgen von Serien nicht verfügbar
In der ARD-Mediathek werden meist die Folgen für die kommende Woche vorab zur Verfügung gestellt.
Der Crawler findet diese Folgen seit einiger Zeit nicht mehr, sie tauchen erst mit der Ausstrahlung auf.
Beispiel: Dahoam is Dahoam
betrifft nicht nur Vorab-Folgen sondern auch andere Bereiche, z.B. die Weltspiegel-Dokus
Die ARD-Webseite verwendet mittlerweile andere APIs als der Crawler, um aus den Sendungsübersichten die einzelnen Folgen zu ermitteln.
@pidoubleyou sagte: Die ARD-Webseite verwendet mittlerweile andere APIs als der Crawler, um aus den Sendungsübersichten die einzelnen Folgen zu ermitteln.
Ist das auch der Grund, weshalb bei der Kafka-Folge 2 die Standard-Variante (statt AD-Variante) über diese API-Seite nicht gefunden wird? Wenn ich beim Aufrufen der Webseite zur Folge den Netzwerkverkehr studiere, sehe ich, dass nach Aufruf der obigen API-Seite diese API-Seite aufgerufen wird, wo sich dann auch die Standard-Variante findet (kind: "standard")…
… jedoch auch korrekt gelabelt die AD-Variante (kind: "audio-description"; alles getestet für die Full-HD-Version):
yt-dlp scheint diese zweite API-Seite aufzurufen, denn die Links dort sind korrekt gelabelt und vollständig.
Das Kafka Problem konnte ich finden und versuche mal einen minimal fix… Ob das auch das Vorschau Problem löst, ist mir unklar.
Adding more food
Die Änderungen haben leider nicht das Vorab-Problem gelöst:
Heute Montag finde ich auf der Seite von Dahoam is Dahoam die Vorab-Folgen bis Donnerstag, in der Filmliste ist nur die vom Montag enthalten.
Ich habe die Ursache gefunden, warum die Vorabfolgen fehlen:
die Topics werden bei der Suche nicht gefunden. Ich habe in einem temporären Workaround die mir bekannten Topics hinzugefügt (siehe https://github.com/mediathekview/MServer/pull/1002/commits/f207d5998559873b15b39c5835a1654d536408ff).
In der Mediathek sind für diese Topics spezifische Seiten verlinkt, die nicht dem üblichen Schema entsprechen. Könnte der Grund sein, warum die Topics nicht automatisch gefunden werden.