Ein Import für die Five-Nations-League

Verfasst am von enum | Schlagwörter: data, import

Schon seit Beginn dieses Projektes hatte ich geplant, Importer zu schreiben, die zumindest Bruchstücke der Daten von anderen Quellen importieren. Die Five-Nations-League hatte dabei oberste Prio, denn deren Seite ist ähnlich strukturiert wie meine, ist recht vollständig, und hält ebenfalls Spielorte und Uhrzeiten bereit. Und darüber hinaus ist der Import auch noch relativ einfach, denn die Seite bietet eine JSON-API an.

Inzwischen ist es vollbracht: Im ersten Schritt wurden alle Teams importiert (Duplikate mit vorher eingetragenen britischen und irischen Teams musste ich entfernen), im zweiten dann die kommenden und vergangenen Spieltage.

Das klappt an sich auch relativ gut. Leider ist mir erst hinterher aufgefallen, dass die Datenlage eben doch leider ziemlich unvollständig ist. Die Five-Nations-League stellt krasse Daten wie Jammer-Leistungen und Sanktionsstatistiken zur Verfügung, aber die Venue und Uhrzeiten fehlen oft genug.

Schlimmer - sie sind sogar teilweise falsch:

Instagram-Post, auf dem Liverpool gegen Stoke am 6.6. spielt
Der 7.6. auf der Seite von 5Nations-Rollerderby, mit dabei fälschlicherweise das Spiel Liverpool gegen Stoke
Und das gleiche durch den Import hier auf rollerderby.jetzt

Wem es noch nicht direkt auffällt: Der Insta-Post (dem ich am meisten Glauben schenke, da er vom veranstaltenden Verein direkt kommt und am meisten Infos mitliefert), kündigt das Spiel Liverpool gegen Stoke am Samstag, den 6.6. an, die Five-Nations-League hingegen am 7.6. - wo laut Insta-Post stattdessen ein Rookie-Scrimmage stattfindet.

Ergo: Ich muss jetzt einen Weg finden, importierte Spiele sinnvoll nachzubearbeiten, ohne dass die Änderungen beim nächsten Import wieder überschrieben werden. Ansonsten lässt die Datenqualität auch hier auf Dauer nach.