Finto-data
Finto-data copied to clipboard
Linkkitarkistimen parannukset
Tehty nyt:
- versio, joka tarkistaa LCSH response headeriden avulla, onko käsite olemassa tai onko se vanhentunut (Downside: valtava määrä kyselyitä verkon yli)
- tuottaa listan tripleistä, joissa on ongelma
Tarvittavia muutoksia/parannuksia:
- Pitää koodata uudestaan Javalla, koska Pythonin rdflib on aivan liian hidas isoilla datamäärillä. Jena on monta kertaa nopeampi.
- Täytyy toteuttaa niin, että haetaan kerralla kaikki tarvittava LCSH-data tiedostona, jota vasten tehdään itse tarkistukset.
- Olisi hyvä, jos rikkinäisten mäppäysten yhteyteen lisättäisiin sanastokehittäjille uusi property, joka osoittaa virheen