Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen...

66
Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011, Kotus, Helsinki Eero Hyvönen professori, tutkimusjohtaja Semantic Computing Research Group (SeCo) Aalto-yliopisto ja Helsingin yliopisto http://www.seco.tkk.fi/

Transcript of Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen...

Page 1: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data)

Ontologiaseminaari 1.3.2011, Kotus, Helsinki

Eero Hyvönenprofessori, tutkimusjohtaja

Semantic Computing Research Group (SeCo)Aalto-yliopisto ja Helsingin yliopisto

http://www.seco.tkk.fi/

Page 2: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Esityksen sanoma

Tietosisällöt avoimiksi ja yhdistetyiksi!– Linked Open Data –periaatteiden mukaisesti

Kotimaisia ja kansainvälisiä avauksia julkisella sektorilla Hyödyntämiseen tarvitaan kansallinen merkitysten infrastruktuuri!

– FinnONTO-hankkeen tuloksia Esimerkki soveltamisesta: Kulttuurisampo.fi Kutsu kansallisiin talkoisiin: Linked Data Finland -hanke

Page 3: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Open Data:Tieto vapaaksi ja avoimeksi! Tiedon arvo monistuu sitä jakamalla

– Päinvastoin kuin useimmilla hyödykkeillä Mutta: yhden pieni etu voi estää muiden ison edun Tuotannon tehokkuus kasvaa avoimuudella

– Miksi tuottaa uudelleen jo tuotettua tietoa? Avoimelle tiedolle syntyy hyötysovelluksia Avoimuus parantaa yhteistyötä ja työnjakoa

– Esim. Wikipedia Avoimuus edistää yhteentoimivuutta (interoperability)

– Keskeinen kustannustekijä tietotekniikassa (>50%) Avoimuus asettaa haasteita mm. lainsäädännölle

– Henkilösuoja, tekijänoikeudet,…– Maksuperustelaki, vapaa kilpailu, …

Kansalaisilla on oikeus avoimeen tietoon Avoin tieto =/= Wikileaks

Page 4: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Esimerkkiartikkeli Helsingin Sanomista 16.2.2011(Laaja kirjaesittely ”Sosiaalinen media muuttaa kaiken”, Esa Mäkinen)

Otsikko: ”Vain avoimuus pelastaa Suomen”– ”Valtion Otakantaa.fi –palvelu on lähinnä vitsi.”– ”Suomessa avoimen julkisen tiedon käyttöönotto on

lapsenkengissä.”– ”Valtion julkaisemien tilastotietojen pohjatiedot pitäisi

julkaista, jotta kuka tahansa voisi laskea omia tilastoja.”– ”Jos oikeasti haluasi hypätä kehityksen eturiviin, pitäisi

puhua semanttisesta verkosta, joka tuntee käyttäjien tarpeet ja muuttuu niiden mukaan.”

– …

Page 5: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Tietoa vapautetaan MUTTA …

Page 6: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Vangin vapauttaminen ei yksin riitä

Open Data ei ota kantaa julkaisutapaan– Tietotekninen näkökulma puuttuu

Open Data ei ota kantaa yhteistyöhön– Web 2.0 -näkökulma puuttuu– Yhteisöllinen tietotyön koordinointi

Open Data avaa tiedon vain ihmiskäyttäjälle– Semanttisen webin näkökulma puuttuu– Keskeinen tekijä yhteentoimivuudelle– Keskeinen tekijä sovelluskehitykselle

Linked Data on moderni ratkaisumalli– Kehitysyhteisö http://linkeddata.org– Tukijoina mm. W3C– Perustuu semanttisen webin teknologioihin

Page 7: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Linked Data: Idea

Nykyinen web on verkko joka linkittää sivuja: Web of Pages– Voidaan hakea/selailla perinteisellä selaimelle

Linked Data linkittää käsitteitä: Web of Data– Voidaan hakea/selailla myös semanttisella sovelluksella

Uusi semanttinen web koostuu molemmista verkoista– Web of Pages (ihmiselle)– Web of Data (koneelle) – konekin voi ”ymmärtää” webiä!

Hyödyt– Tiedo saadaan yhteentoimivaksi– Verkon palveluiden älykkyysosamäärä nousee

Linked Data on webin ”isän” Tim Berners-Leen lempilapsi

Page 8: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Linked Data + Open Data = Linked Open Data

Page 9: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Linked Open Datan kehittyminen

(Tim Berners-Lee)

Page 10: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

(Tim Berners-Lee)

Page 11: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

(Tim Berners-Lee)

Page 12: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Linked Open Data -verkossa jo miljardeja kaaria (RDF triple)

(linkeddata.org, 2009)

Page 13: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Linked Open Data Cloud 2010: http://linkeddata.org

Page 14: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Perinteinen malli: tiedon siiloja + hankala käyttö

Page 15: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

1 +1 > 2M.O.T.

Page 16: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Britanniassa: http://data.gov.uk

Page 17: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Runsaasti sovelluksia verkossa

Page 18: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Linked Open Data esimerkkisovellus: BBC

Page 19: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

USA:ssa http://www.data.gov

Page 20: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

San Franciscon kaupungissa

Page 21: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Opengov.XX portaalit:opengov.fi, opengov.se, ...

Page 22: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Semantic Interoperability Centre of Europe

Page 23: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Suomalaisia hankkeita

Page 24: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

FinnONTO – Suomalaiset semanttisen webin ontologiat

Tahtotila– Tarvitaan kansallinen semanttisen webin infrastruktuuri!– Kuin tieverkosto, sähkö/puhelinverkko, Internet, ...

Tutkimushankkeiden jatkumo 2003-2012 (Tekes) Kansallinen yhteisö

– Aalto-yliopiston TKK:n, HY:n ja 35 julkisen organisaation ja yrityksen tutkimuskonsortio (tällä hetkellä)

Semanttisen webin infrastruktuurin pilottijärjestelmä– Pilottivaiheessa oleva kansallisten käsitteistöjen

ontologiainfrastruktuuri ja -palvelu Mukana useissa pilottisovelluksissa

– MuseoSuomi, Kulttuurisampo, TerveSuomi, ToimintaSuomi, YritysSuomi, Kirjasampo, ...

Page 25: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

FinONTO Industrial & Public Organization Consortium

FinnONTO– 2003-2004

» 14 funding organizations– 2004-2005

» 16 funding organizations– 2005-2006

» 30 funding organizations– 2006-2007

» 37 funding organizations FinnONTO 2.0

– 2008-2010» 38 funding organizations

– 2010-2012» 35 funding org.

1.52 MEUR

Semantic UBICOM-services17 funding org., 2010-20110,55MEUR

Linked Data Finland (LDF)30+ funding org., 2012-20131-2MEUR

?

Page 26: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Results

Major demonstrator systems– MuseumFinland: www.museosuomi.fi– HealthFinland: www.tervesuomi.fi– CultureSampo: www.kulttuurisampo.fi– National Ontology Library Service ONKI: www.onki.fi

Major awards– Semantic Web Challenge Award 2004– Prime Minister’s Innovation Acknowledgement 2004– Semantic Web Challenge Award 2008– Apps4Finland – Doing Good with Data 2010– (World Summit Award (WSA) Mobile 2010)

Academic– Lots of refereed publications www.seco.tkk.f/publications– 4 PhD works 2010– Lots of MSc thesis

Page 27: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

”Julkinen data – johdatus tietovarantojen avaamiseen”, 2010 Periaatepäätösluonnos tiedon avaamisesta http://www.lvm.fi/c/document_library/get_file?folderId=1591058&name=DLFE-

11755.pdf

Liikenne- ja viestintäministeriön avoin tieto -hankkeet

Page 28: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Valtiovarainministeriön valtiotason (tieto)arkkitehtuurit hanke VALTASA

Tietojen merkitysten yhteentoimivuus tärkeässä roolissa Loppuraportit valmiita

– http://www.vm.fi/yhteentoimivuus Tietoarkkitehtuurin kehittämispolkusuunnitelma tekeillä

valtiokonttorissa– Valmistuu keväällä 2011

Page 29: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Tietohallintolaki (”FinnONTO-laki”) valmisteltu valtiovarainministeriössä

Ydinongelmana julkisten tietojärjestelmien yhteentoimivuusongelmat

– Huono asiakaspalvelu– Isot kustannukset

Lain päätavoite: asetusvallan lisääminen valtiotasolle (ValtIT) konserniohjausta varten

Lakiehdotus on nyt tiettävästi eduskunnassa valiokuntakäsittelyssä

Page 30: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Linked Open Data in Finland 2010

Page 31: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Opetus- ja kulttuuriministeriö: Tutkimuksen tietoaineistot –selvityshanke ja KDK

Tutkimuksen tietoaineistot - Olennaisen käsikirja päättäjille– Ilmestyi 2010

Tiekarttaraportti jatkotoimenpiteistä valmistui 2/2011 http://www.csc.fi/sivut/e-infra/tietoaineistot/

Kansallinen Digitaalinen Kirjasto KDK– Laaja kansallinen hanke– Kirjastojen, museoiden ja arkistojen yhteinen portaali– Liitännät yleiseurooppalaiseen Europeana-järjestelmään

Page 32: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Uudempia tutkimushankkeita

Fin-CLARIN-hanke– WordNet-käännöstyö– http://www.ling.helsinki.fi/finclarin/– Helsingin yliopisto

Suomen Akatemian uusi termipankki –hanke– Tieteelliset suomenkieliset termit– http://www.helsinki.fi/sup/ajankohtaista/termipankki.html– Helsingin yliopisto, Kotus, Sanastokeskus TSK

Page 33: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

IT-alan strategisen huippuosaamisen keskittymä:Tietovarannoista kansallinen kärkihanke!

Page 34: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Tiedon yhdistäminen perustuu merkitysten verkostoihin eli ontologioihin

Page 35: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Semantic SearchLimitations of Non-semantic WebCase MuseumFinland (2002-2004)

NBA-H26069-467 :object ”cup and plate”;:material ”porcelain” ;:creationPlace ”Germany” ;:creator ”Meissen” .

This metadata cannot answer the following questions:– Find all vessels?– Find all ceramic products?– Find artifacts manufactured in Europe?– Does the city of Meissen manufacture ceramics?

Page 36: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Semantic Web Solution:Ontologies

NBA-H26069-467 :object ”cup and plate” ;:object_concept object:cup ;:object_concept object:plate ;

:material ”porcelain” ;:material_concept object:porcelain ;

:creationPlace ”Germany” ;:creationPlace_concept place:Germany ;

:creator ”Meissen”:creator_concept actor:Meissen .

NBA-H26069-467

place:Germany

object:cup

creationLocation_concept

place:Europe

loc:partOf

rdfs:subClassOfobject:vessel

object_concept

object_conceptobject:plate

rdfs:subClassOf

...

...

...

Find all vessels?Find all ceramic products?Find artifacts manufactured in Europe?Does the city of Meissen manufacture ceramics?

object ontology

place ontology

actor ontologymaterial ontology

place:Meissen

actor:Meissenmaterial:porcelain

material_concept

Page 37: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

FinnONTO:n kansallinen yhteisöllinen ontologiajärjestelmä KOKO

Page 38: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

YSO

AFOMAO

TAO

VALO

KOKO ......

Holistic Collaborative Finnish Ontology KOKO

Your ontology?

Aligning ONKI ontologies

[Hyvönen et al., ESWC 2009]

Leikkaavat ontologiat

Yhteisten ekvivalenttien käsitteiden määrä

YSO + TAO 1990YSO + MAO 2330YSO + VALO 950MAO + TAO 1190

Page 39: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

KOKO sovelluskäyttäjän näkökulmasta

Page 40: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

KOKOs Component Ontologies 2/2011

Thesaurus-based Ontologies in the KOKO Ontology System

Name Ontology domain Underlying thesaurus Size Maintaining Organization1 YSO General domain General Finnish Thesaurus, YSA, Allärs 23700 National Library, Åbo Academy2 MUSO Music Thesaurus of Music, MUSA/CILLA 1000 National Library3 MAO Museum domain Thesaurus of Museum Domain, MASA 6800 National Board of Antiquities4 AFO Agriculture, foresty Agriforest Thesaurus 5500 Viikki Science Library

5

TAO Applied arts Thesaurus of Applied Arts 2600 University of Eastern Finland andLibrary of Aalto-University

6

VALO Photography Thesaurus of Photography Literature, Thesaurus of Photography Technology

1900 Finnish Museum of Photography

7 MERO Seafaring, shipping Thesaurus of Seafaring 1400 Finnish Transport Agency8 KAUNO Literature subjects Thesaurus of Literature, Bella 4900 Finnish Public Libraries, Kirjastot.fi9 JUHO Public government Thesaurus of Finnish Government, VNAS 6400 Ministry of Finance

10 TERO Health promotion YSA, HPMulti, MeSH, Stameta 22000 Various organizations11 KITO Literature research Thesaurus of Literature Research 900 Finnish Literature Society12 KULO Culture research Thesaurus for Folk Culture Studies 1600 Finnish Literature Society13 KTO Linguistics Thesaurus of Linguistics 1000 Research Institute for the Languages

14 PUHO Defense Thesaurus of Defence Administration 2100 Finnish Defence Forces15 POIO Points of interest TGN, Geonames, LDG, SUO 1000 Various organizations

TOTAL 82800

Page 41: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Biological Namelists for ONKIvuosi alue ryhmä taksoneita joista lajeja

Catalogus Lepidopterorum. Fenniae et regionum adiacentium. 1. Macrolepidoptera. 1962 Suomi Perhoset 313 161

Suomen perhosten luettelo 1977 Suomi Perhoset 256 120

The Lepidoptera of Europe. A Distributional Checklist 1996 Skandinavia Perhoset 12256 9804

Checklist of Finnish Lepidoptera 2002 Suomi Perhoset 265 126

Suomen perhosten luettelo - päivitetty versio 2008 Suomi Perhoset 4573 2987

Norwegian Lepidoptera 2008 Norja Perhoset 3244 2210

Catalogue of the Lepidoptera of Russia (only NW parts) 2008Luoteis-Venäjä Perhoset 3251 2171

Estonian Lepidoptera. Catalogue 2008 Viro Perhoset 3477 2389

The Fly Fauna of Finland (Draft) 2008 Suomi Kärpäset 6351 4800Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 1. heimo Ichneumonidae, alaheimot Pimplinae, Poemeniinae, Rhyssinae ja Diacritinae - A check list of Finnish Hymenoptera, Parasitica. Part 1 1995 Suomi Loispistiäiset 282 210Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 2. alaheimot Tryphoninae, Eucerotinae, Adelognathinae, Xoridinae ja Agriotypinae - A check list of Finnish Hymenoptera, Parasitica. Part 2 1999 Suomi Loispistiäiset 398 311Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 3. alaheimo Cryptinae - A check list of Finnish Hymenoptera, Parasitica. Part 3 1999 Suomi Loispistiäiset 919 727Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 4. heimo Ichneumonidae, alaheimot Lycorinae, Neorhacodinae, Stilbopinae, Banchinae ja Ctenopelmatinae - A Check list of Finnish Hymenoptera, Parasitica. Part 4 2000 Suomi Loispistiäiset 786 646Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 5. heimo Ichneumonidae, alaheimot Tersilochinae, Ophioninae, Anomalinae, Paxylommatinae, Cremastinae ja Campopleginae - A check list of Finnish Hymenoptera, Parasitica. Part 5 2003 Suomi Loispistiäiset 733 587

Suomen ripsiäisten luettelo - Checklist of Finnish Thysanoptera 2008 Suomi Ripsiäiset 219 140

Suomen nivelkärsäisten luettelo - Check-list of Finnish Hemiptera 2008 Suomi Nivelkärsäiset 2690 1697

Suomen verkkosiipiset ja kärsäkorennot - The Neuroptera s.l. and Mecoptera of Finland 2008 SuomiVerkkosiipiset ja kärsäkorennot 113 72

Maailman lintujen suomenkieliset nimet (Finnish Names of the Birds of the World) 2010 Maailma Linnut 12125 9740

Nisäkkäiden nimilista (beta) 2008 Maailma Nisäkkäät 6062 4629

Suomen myrkkypistiäisten luettelo 2010 Suomi Myrkkypistiäiset 1048 664

Page 42: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Other Vocabularies and Ontologies

Traditional national thesauri– YSA, MUSA/CILLA, Stameta, etc.

International vocabularies– Art and Architecture Thesaurus (AAT) (culture)– Library of Congress Subject Headings (LCSH) (library)– UNSPSC (products and services)– IPSV (eGov)– MeSH (medical)– Iconclass (culture)– …

Page 43: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

ONKI Geo for Geo-ontologieshttp://demo.seco.tkk.fi/onkipaikka/

800,000contemporyFinnish places

[Lindroos et al., 2007]

Page 44: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Suomen ajallinen paikkaontologia SAPO

Visio: kansallinen asteittain täydentyvä historiallisten ajallisten paikkojen ja näiden muutosten ontologia

– 1989 kuntaa, 84 lääniä, 48 linnalääniä – Julkaistu ONKI:n kautta palveluna

» http://www.yso.fi/onki/sapo/?l=fi– Kehitys jatkossa yhteisöllisenä SAHA-projektina

» http://demo.seco.tkk.fi/saha/sapo/index.shtml Seuraavaksi tulossa

– Kylätaso (luovutut alueet ja nykyinen Suomi)– Point-Of-Interest-kohteet

Page 45: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

ONKI PeopleDemo with Getty ULAN Registry

120,000 Instances

[Kurki, Hyvönen, ICSD, 2010]

Page 46: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

46

Tapahtumat:Suomen historiaontologia HISTO

◼ Historiaontologian tarkoituksena on:

1)Määrittää ontologiset tunnisteet (URI) historiallisille tapahtumille samaan tapaan kuin esimerkiksi paikoille.- Sisältöjen yhdistäminen uudella tavalla

2)Kuvat täsmällisesti historiallisia tapahtumia ja narratiiveja.- Aineettoman kulttuuriperimän tallentaminen

3)Toimia linkittävänä ontologiana erilaisten kulttuuristen sisältöjen välillä.

4)Tarjota kattava ja hyvin kuvailtu semanttinen tietokanta Suomen historian tapahtumista (itseisarvo).

Page 47: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

http://demo.seco.tkk.fi/saha/historia/index.shtml

Page 48: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Kansallinen ontologiakirjastopalvelu ONKI

http://www.onki.fi/

Page 49: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

ONKI-palvelukonseptin idea

ONKI tarjoaa kansalliset keskitetyt sanastopalvelut valmiina toiminnallisuuksina, jotka voidaan integroida kustannustehokkaasti osaksi sovelluksia

– Käsitteiden haku, selailu, valinta, laajennus, kääntäminen – Hieman vastaavaan tapaan kuin esimerkiksi Google Maps

tarjoaa karttapalvelut sovellusten käyttöön

Käyttötapaukset– Tiedon indeksointi sisältöä tuotettaessa

» Museot, virastot, kirjastot, mediayritykset, kansalaiset ...– Tiedon haku

» Esim. synonyymit, kyselyn laajentaminen, monikielisyys– Sanastojen kehittämisen ja julkaisemisen tuki

Page 50: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

ONKI 3

Page 51: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

ONKI:n käyttöönottotilanne 1 / 2011

Prototyyppi Living Laboratory –ympäristössä 2009-2011– Ihmiset: n. 14 000 uniikkia käyttäjää / kk (domain)– Koneet: 223 rekiströitynyttä käyttäjää (domain)

ONKI konsortio –valmisteilla – Kansalliskirjasto vetovastuuseen? (suunnitelma)– ONKI:n ylläpito FinnONTO:n jälkeen (2012-)

ONKI mukana Valtiotason tietoarkkitehtuuri –suunnitelmissa– Valtiovarianministeriö / ValtIT – Tietohallintolaki (”FinnONTO-laki”)

Page 52: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Käytännön esimerkki mahdollisuuksista:FinnONTO:n Kulttuurisampo

Kulttuurisampo – suomalainen kulttuuri semanttisessa Web 2.0:ssa

– Kansallinen kulttuurialan yhteisöllinen julkaisukanava Linked Open Data –hengessä

– Museot, kirjastot, arkistot– Kansalaiset

http://www.kulttuurisampo.fi

Finnish Content Providers1 Agricola – Suomen historiaverkko2 Espoon kaupunginmuseo3 Helsingin kaupunginkirjasto4 Hiihtomuseo5 Jyväskylän yliopisto, musiikin laitos6 Kansallisbiografia7 Kansallismuseo8 Kuopion kulttuurihistoriallinen museo9 Laatokan-Karjalan museo

10 Lahden kaupunginmuseo11 Museovirasto12 Pohjois-Karjalan museo13 Radio- ja TV-museo14 Seurasaaren ulkomuseo15 Suomalaisen Kirjallisuuden Seura SKS16 Suomen maatalousmuseo Sarka17 Suomen merimuseo18 Taideteollisen korkeakoulun kirjasto19 Valtion taidemuseo20 Veljekset Karhumäki Oy21 Viipurin historiallinen museo22 Yleisradio Oy

International Content Providers1 Geonames2 Google (Maps)3 Iconclass (vocab.)4 Panoramio5 Paul J. Getty Foundation (vocab.)6 Wikipedia

Page 53: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Haaste 1: Kulttuurisisältöjen tuotantoHajautettu, ei yhteisöllisyyttä, ei koordinaatiota

Page 56: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Biografiakeskus ja kirjastot keräävät henkilöhistoriaa

henkilö nimi ammatti syntymapaikka ...H1 Akseli Gallen-Kallela taiteilija LemuH2 Gustaf Mannerheim marsalkka Askainen

...

H1

Lemu

taiteiijaihminen

”Akseli Gallen-Kallela”

H2

Askainen

marsalkka

”Gustaf Mannerheim”

tyyppi

tyyppi

nimi

nimi

ammatti

ammatti

s-paikka

s-paikka

Page 57: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Museo luetteloi maalauksia

...

T1

1929

maalaus

tekijä

aika

tyyppi

”Gustaf Mannerheim”nimi

aihe

nimi”Akseli Gallen-Kallela”

teos nimi tekijä aika aihe ...T1 Mannerheimin muotokuva Akseli Gallen-Kallela 1929 Gustaf MannerheimT2 Aino-triptyykki Akseli Gallen-Kallela 1891 Aino, Kalevala

...

Page 58: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Maanmittauslaitos ylläpitää paikkarekistereitä

Varsinais-Suomen lääni Suomi

Askainen

Lemu

Turku

kunta lääniAskainen Varsinais-Suomen lääniHelsinki Uudenmaan lääniLemu Varsinais-Suomen lääniTurku Varsinais-Suomen lääni...

part-ofpart-of

part-of

part-of

kunta

tyyppi

lääni

tyyppi...

tyyppi

Page 59: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

FinnONTO kehittää ontologioita

taiteiijaihminen

marsalkka

maalaus

käsite

pysyvä

paikka

ammatti kunta

yläluokka

yläluokka

yläluokka

yläluokka

yläluokka

ajanjakso

yläluokkaabstraktimuuttuva

fyysinen objekti

lääni

KOKO-ontologia

Page 60: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Semanttinen RDF-verkko yhdistää kaiken: Web of Linked Open Data

H1

Lemu

taiteiijaihminen

”Akseli Gallen-Kallela”

H2

Askainen

marsalkka

”Gustaf Mannerheim”

tyyppi

tyyppi

nimi

nimi

ammatti

ammatti

s-paikka

s-paikka

T1

1929

maalaus

tekijä

aiheaika

tyyppi

Varsinais-Suomen lääni Suomi

Turku

part-of part-of

part-of part-of

käsitteet

pysyvä

paikka

ammatti kunta

tyyppi

tyyppi

tyyppi

yläluokka

yläluokka

yläluokka

yläluokka

yläluokka

ajanjakso

yläluokkaabstraktimuuttuva

fyysinen objekti

lääni

yläluokka

...

Page 61: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,
Page 62: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Mitä seuraavaksi pitäisi tehdä?Kääriä hihat ylös.

Kutsu mukaan Linked Data Finland -hankkeeseen

Page 63: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Tavoite Kansallisten tietoaineistojen julkaiseminen Linked Open Datana

– FinnONTO:n perintöä hyödyntäen– Yhteisen open source -teknologian kehittäminen– Pilotointi käytännössä: aineistot ja sovellukset

Laaja FinnONTO-tyyppinen Tekes-rahoitteinen hanke– Mukaan sekä julkinen sektori että yrityksiä– Ministeriöitä, Kuntaliitto, Museovirasto, Kansalliskirjasto ym.

Aikataulu– Hakemus 28.2.2011 – Kesto 2012-2013

Page 64: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Sovellusalueita

Yhdistetty paikkatieto Tieteellinen yhdistetty tieto Bio- ja ympäristöalan yhdistetty tieto Valtion ja kuntien tietorekisterit

Tervetuloa mukaan yhteisöön – vielä ehtii! Lisätietoja: [email protected]

Page 65: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Lisätietoja suomeksi

Yhteenveto suomeksi FinnONTO-visiosta– Eero Hyvönen: FinnONTO-malli kansallisen semanttisen webin

sisältöinfrastruktuurin perustaksi - visio ja sen toteutus. Julkistustilaisuuden esitelmä, TKK, 12.9.2008.http://www.seco.tkk.fi/publications/2008/hyvonen-ONKI-yleisesitys-2008.pdf

Yhteenveto suomeksi Kulttuurisamposta– Eero Hyvönen: Kulttuurisampo - suomalainen kulttuuri

semanttisessa webissä. Muistiorganisaatioiden ja kansalaisten yhteisöllinen kansallinen julkaisujärjestelmä Julkistustilaisuuden esitelmä, TKK, 25.9.2008.http://www.seco.tkk.fi/publications/2008/hyvonen-Kulttuurisampo-2008.pdf

Page 66: Kansallinen ontologiainfrastruktuuri ja yhdistetty …...2011/03/01  · Kansallinen ontologiainfrastruktuuri ja yhdistetty avoin tieto (Linked Open Data) Ontologiaseminaari 1.3.2011,

Questions?

?!http://www.seco.tkk.fi

Semantic Computing Research Group:http://www.seco.tkk.fi/Try ONKI and CultureSampo yourself:http://www.onki.fi/http://www.kulttuurisampo.fi/