Finto-data
Finto-data copied to clipboard
Hierarkisointiperiaatteet ja ryhmittelevät käsitteet
Osassa YSOn hierarkisointiuudistuksista lähtökohta on ollut temaattinen; esim. ominaisuudet ja tapahtumat on tällä hetkellä hierarkisoitu pääosin temaattisten yläkäsitteiden alle:
- ominaisuudet ks: issue #412
- tapahtumat ks: issue #496
Tämänkaltainen hierarkisointi on ehkä jossain määrin vastoin ontologisoinnin "alkuperäistä" ideaa ominaisuuksien periyttämisestä ja konepäättelystä. Onko esimerkiksi olemassa mitään yhteistä ominaisuutta joka voitaisiin periyttää kaikille yhteyskunnallisille ominaisuuksille? (Toki temaattista hierarkisointia on ollut YSOssa aiemminkin, esim. ilmiöissä, järjestelmissä, tuotoksissa ym.)
Lisäksi kun YSOon nykyisellään sisältyy jo YSAsta tulleet temaattiset ryhmät, voidaan kysyä mitä lisäarvoa temaattisella hierarkisoinnilla saadaan ontologiaan.
Yksi ratkaisu voisi olla ryhmittelevien käsitteiden käytön laajentaminen. Sellaisissa laajempien ontologianhaarojen hierarkisointitapauksissa, joissa käsitteille on vaikeaa löytää "ontologisia" yläkäsitteitä, voitaisiin ehkä varsinainen hierarkia pitää litteämpänä, mutta tuoda struktuuria massaan käsitteiden ryhmittelyllä.
Esimerkiksi nykyisten ominaisuudet-käsitteen alakäsitteet kuten yhteiskunnalliset ominaisuudet, kielelliset ominaisuudet, kulttuuriset ominaisuudet jne. voitaisiin nähdä pikemminkin rymittelevinä kuin hierarkisoivina käsitteinä. Tämänkaltainen idea voisi tuoda tiukan is-a -suhteen varaan perustuvan ontologian rakentamiseen tiettyä joustoa, ilman että poikettaisiin ontologioiden alkuperäisestä ideasta.
Olisiko TSK:n suunnasta kommenttia tällaiselle ajatukselle? @kseppala
Toisaalta on ehdotettu ryhmittelevien käsitteiden poistamista YSOsta, koska niiden käyttö on melko epäjohdonmukaista. Tämän asian edistämisen suuntaan tai toiseen voisi ehkä kirjata toimintasuunnitelmaan muutaman vuoden päästä?
Ehdotetaan ryhmittelevien käsitteiden poistoa, koska
- niitä on käytetty YSOssa vain satunnaisesti
- niissäkin käsitteissä, joissa niitä on käytetty, ne eivät kata kaikkia alakäsitteitä
- usein käsitteen alakäsitteet sopisivat useampaan kuin yhteen ryhmään
- osa niilläkin järjestetyistä joukoista on epäjohdonmukaisia (eli sisarkäsitteillä ei ole varsinaisesti yhteisiä piirteitä)
- osa ryhmittelevien käsitteiden nimistä on epäselviä
- näiden käyttötarkoitus on epäselvä, onko se ainoastaan tietyn käsitteen alakäsitteiden järjestäminen Finton käsitenäkymässä
Yasgui haku: https://api.triplydb.com/s/0uxomh2p7 tulos taulukkona: https://docs.google.com/spreadsheets/d/1cTqDEYTxc-pXfSfC8IkKC_vqByfO0xEhJ67rHNdyR9k/edit?usp=sharing
Mirja etsii esimerkit bulletteihin ja sen jälkeen viedään asia viikkopalaveriin ja ehdotetaan sen ottamista OY-kokoukseen.
Ehdotetaan ryhmittelevien käsitteiden poistoa, koska
- niitä on käytetty YSOssa vain satunnaisesti (YSOssa on paljon käsitteitä, joilla on suuri määrä alakäsitteitä, mutta niitä ei ole jaoteltu, esim. menetelmät, muutos, ominaisuudet (yleiskäsitteitä) tai yhteiskunnalliset objektit (hierarkisoiva käsite). Toisaalta etsintä-käsitteellä on vain neljä alakäsitettä, mutta ne on ryhmitelty kahteen ryhmään, joista toisessa on yksi käsite. Sienet-käsitteen alla on suoraan enemmän käsitteitä kuin ryhmissä jne.)
- niissäkin käsitteissä, joissa ryhmitteleviä käsitteitä on käytetty, ne eivät usein kata kaikkia alakäsitteitä (esim. vaatteet, aine, elintarvikkeet. Toisaalta energialla on yksi ryhmittelevä alakäsite, jonka alle sopisivat lähes kaikki energian alakäsitteet.)
- usein käsitteen alakäsitteet sopisivat useampaan kuin yhteen ryhmään (esim. yksi toimivimpia kokonaisuuksia, "tutkimus": kuitenkin kehittävä työntutkimus, mikroskopia tai taiteellinen tutkimus voisivat olla myös ryhmässä tutkimus menetelmän mukaan ja kuluttajatutkimus, käyttäjätutkimus, mielipidetutkimus jne. ryhmässä tutkimus kohteen mukaan. Aine käytön mukaan ja aine vaikutuksen mukaan -ryhmien ero puolestaan on kokonaisuutena epäselvä, samoin vaikutukset ilmenemistavan mukaan vs. vaikutukset vaikutustavan mukaan. Kestävä käyttö on ryhmässä käyttö käyttötarkoituksen mukaan, koekäyttö käyttö käyttötavan mukaan.)
- osa ryhmittelevillä käsitteillä järjestetyistä joukoista on epäjohdonmukaisia (eli sisarkäsitteillä ei ole varsinaisesti yhteisiä piirteitä) (esim. aine rakenteen mukaan -ryhmässä ovat mm. alkuaineet, atomit, hiutaleet, paperisavi ja vapaat radikaalit. Tilat rakenteellisen jaon mukaan -ryhmässä ovat mm. käytävät, sisätilat ja viherhuoneet. Työ työn luonteen mukaan -ryhmässä on mm. istumatyö, kriisityö, palkaton työ, puhdetyöt, yhteistyö)
- osa ryhmittelevien käsitteiden nimistä on epäselviä (esim. eläimet pesimistavan mukaan: yhdyskuntahyönteiset tai eläimet käytön mukaan: löytöeläimet tai eläimet elinkaaren mukaan: muinaiseläimet tai tekstiilit olomuodon mukaan: langat, tekonahka tai vaatteet syntypaikan mukaan: kansallispuvut, vaatteet käyttötavan mukaan: housut - onko housut "käyttötapa". Synnytys eläinlajin mukaan tai eläimet sukupuolen mukaan ovat periaatteessa melko loogisia ryhmiä, mutta nimitykset ovat kyllä vähän kulmia kohottavia ja hakija todennäköisesti pitäisi loogisempana kokonaisuutena hevonen > tammat kuin joukkoa koiraat-naaraat-oriit-ruunat-tammat - eikä ruuna edes ole erillinen sukupuoli.)
- osittain ilmeisesti jo purettu: lämmitysjärjestelmä lämmitinten sijainnin mukaan -ryhmässä ei ole lainkaan käsitteitä
- eivät näy Fintossa yläkäsitteensä alla, jos niiden alakäsitteellä on tuplahierarkia (?) (esim. tilat käyttötarkoituksen mukaan, taudit aiheuttajan mukaan)
- näiden käyttötarkoitus on epäselvä, onko se ainoastaan tietyn käsitteen alakäsitteiden järjestäminen Finton käsitenäkymässä?
Omasta mielestäni ryhmittelevien ("jonkin mukaan") käsitteiden käytön ei tarvitse välttämättä olla kokonaisvaltaista, vaan niitä voitaisiin käyttää niiltä osin kun tarkempi käsitteiden esittäminen katsotaan mahdolliseksi ja tarpeelliseksi. Eihän ontologiassa muutenkaan käsitellä kaikkia aihealueita/käsiteryhmiä yhtä tarkasti. Ryhmittelevät käsitteet toimivat vastaavalla tavalla hierarkian tarkentamisessa kuin yläkäsitteet, ne ohjaavat valitsemaan asiasanoja eri näkökulmista (jotka ovat ryhmittelyn perusteena).
Niiltä osin kuin ryhmitteleviä käsitteitä käytetään, ryhmien tulisi kuitenkin olla poissulkevuusperiatteen mukaan tarkistettuja. On hyvä tavoite, että ryhmittelevät käsitteet nimetään mahdollisimman selkeästi, mutta aina ei päästä kovin tarkalle tasolle ja tämä on ihan normaaliaa, eiväthän kaikki yksittäiset termitkään anna yksiselittäistä kuvaa käsitteestä.
Jos on niin, että ryhmitteleviä käsitteitä ei pidetä lainkaan tarpeellisina tai mahdollisina ylläpitää YSOssa, tällaiset kannattaisi kuitenkin sallia erikoisontologioissa, joissa niillekin voi muiden tarkkuutta lisäävien keinojen (kuten useampien hierarkkisten alakäsitteiden) lisäksi olla tarvetta. Tästä syystä olisi toivottavaa, että myös näiden esittäminen Fintossa saataisiin jatkossa kuntoon.
Pyydetään Jarmolta listaus sen mukaan, montako käsitettä ryhmään kuuluu.
Lähdetään purkamaan seuraavasti:
- poistetaan ryhmät, joihin ei kuulu käsitteitä
- poistetaan ryhmittelyt, jos tietyn käsitteen ryhmiin yhteensä kuuluu alle 10 käsitettä, eikä säilyttämiselle ole erityistä syytä
- katsotaan tilannetta uudestaan tämän jälkeen
Näistä myös toinen issue: https://github.com/NatLibFi/Finto-data/issues/554 Ja https://github.com/NatLibFi/Finto-data/issues/734
Huom. selkärankaiset-käsitteen RT-käsitteet voisivat olla myös alakäsitteitä, jos ryhmittelevä käsite eläimet taksonin mukaan poistuu, tai jos tekninen ongelma näiden näyttämisessä ratkeaa.
Statistiikkaa: YSOssa on 166 ryhmittelevää käsitettä. Näistä 95 on sellaista, joilla on alle kymmenen alakäsitettä. Ryhmittelevistä käsitteistä 15 on sellaista, joilla on yli sata alakäsitettä. Eniten alakäsitteitä on ryhmittelevällä käsitteellä "eläimet taksonin mukaan" (1176 kpl).
Linkin tiedostossa listattuna YSOn ryhmittelevät käsitteet ja kunkin kohdalla ilmoitettu alakäsitteiden lukumäärä. YSOn ryhmittelevät käsitteet ja alakäsitteiden lukumäärä 2023-11-30.xlsx
Lisää statistiikkaa: Tämä on jalostettu taulukko edellisestä. Tässä on listattu sekä a) ryhmittelevän käsitteen suorien alakäsitteiden lukumäärä että b) ryhmittelevän käsitteen kaikkien alakäsitteiden lukumäärä. Taulukosta selviää aiempaa paremmin esim. se, että musiikki etnisen ryhmän mukaan -käsitteellä on vain yksi suora alakäsite (afroamerikkalainen musiikki) ja tämän alla 30 käsitettä. Samoin esim. aine kemiallisen koostumuksen mukaan -käsitteellä on vain kaksi suoraa alakäsitettä, mutta yhteensä alakäsitteitä on 696. YSO - ryhmittelevien suorat alakäsitteet ja kaikki alakäsitteet - 180424.xlsx