Praktilisi metoodilisi näpunäiteid ontoloogia loomiseks

21/04/231Koolitused ja infopäevad toimuvad Euroopa Liidu struktuurifondide programmi „Infoühiskonna teadlikkuse tõstmine“ raames, mida rahastab Euroopa Regionaalarengu Fond.Koolituste ja infopäevade tellija on Riigi Infosüsteemide Arenduskeskus ja koolitused viib läbi BCS Koolitus AS

Hele-Mai HaavKüberneetika Instituut26. august 2010 a

SF programm „Infoühiskonna teadlikkuse tõstmine“

Praktilisi metoodilisi näpunäiteid ontoloogia

loomiseks

21/04/232

Näpunäited baseeruvad äriregistri ontoloogia loomisel

Äriregister

Omab üle 70 x-tee teenuse WSDL dokumendis on üle 1000 sisend-

väljund andmevälja

Vaata [Leive Turi magistritöö “Ontoloogiate loomine Eesti äriregistri näitel”]

21/04/233

Kontseptualiseerimise starteegia Kasutati keskelt üles ja alla lähenemist.

Võttes arvesse, et ontoloogiat hakkavad tegema valdkonda tundvad inimesed olemasoleva andmebaasi põhjal, on kesksetest mõistetest struktuuri ehitamine kõige loomulikum.

Keskseteks mõisteteks on igapäevaselt kasutatavad sõnad, mida kasutatakse kui räägitakse infosüsteemi andmetest.

Ülevalt alla meetodit kasutades võib tee teenuste sisend- ja väljundandmete tasemele olla suhteliselt pikk.

Samas alt üles meetodi korral on keeruline näha ülemise astme mõisteid. Selle tulemusena on tunduvalt aeganõudvam eristada mõisteid ja atribuute, mis tähendab, et korrektse ontoloogiani jõudmiseks kulub rohkem aega.

21/04/234

Äriregistri ontoloogia loomise metoodika

[Leive Turi magistritöö “Ontoloogiate loomine äriregistri näitel”]

Alguseskesksed mõisted

Vastavalt veebiteenuste

sisend/väjundile

21/04/235

Spetsifitseerimine

Spetsifitseerimise etapis määratakse ontoloogia eesmärk ja skoop, kirjeldatakse kasutusvõimalusi ja andmeallikaid.

Arendusetapis aitab spetsifikatsioon kitsendada ülesannet ning edaspidi annab kolmandatele isikutele esmase ülevaate ontoloogiast.

21/04/236

Mõistete kogumine

Infosüsteemi andmed, millest kõige rohkem räägitakse

Milliseid andmeid soovitakse päringutena kõige rohkem

Milliseid andmeid kasutatakse statistikaks

21/04/237

Kesksete mõistete leidmine

Keskseid mõisteid võiks olla esialgu 7-10 Kesksete mõistete leidmiseks tuleks läbi

mõelda, mis eesmärgil infosüsteem on loodud, millistest andmetest räägitakse, kui teemaks on andmebaasi sisu, ja analüüsida X-tee andmete esinemissagedust.

Sellise lähenemisega on võimalik leida enamkasutatavad mõisted, millest moodustub ontoloogia tuumik.

21/04/238

Esimene mõistete kogum

Juriidiline isik, piirkond, majandusaasta aruanne, dokument, õiguslik vorm, äriregistrikood, kanne, kaart, määrus, päevik, ärinimi, kapital

21/04/239

Mõistete detailiseerimine ja üldistamineAlguses liigume üks tase üles/alla Andmete organiseerimine taksonoomiasse

Lisaandmete blokk andmete jaoks, mis kuuluvad mõnda teise ontoloogiasse (andmekogu mittepõhiandmed kuuluvad teise ontoloogiasse)

• Nt füüsiliste isikute andmed pärinevad rahvastikuregistrist ning neid andmeid äriregistri ontoloogias detailselt lahti ei kirjuta

Tuleb meeles pidada mõistete taksonoomiasse korraldamise reegleid Alamklassil on kõik ülemklassi omadused Alamklass on ülemklassi alamhulk Vältida lõikuvaid alamklasse

Klass või atribuut? Kui atribuudil on omakord atribuudid siis on tegu klassiga.

21/04/2310

Näide

Klassi Juriidiline isik hüpoteetilised atribuudid Juriidiline isik atribuutid: äriregistrikood, ärinimi, kapital, õiguslik

vorm, kaart

Kuna ärinimel, kapitalil, õiguslikul vormil on omakorda atribuudid alguse ja lõppkuupäev ning kaardil tüüp ja kehtivuse tunnus, siis on tegu

klassidega

Seega ontoloogiasse tekivad klassid: Juriidiline isik atribuut: Äriregistrikood Ärinimi Kapital Õiguslik_vorm Kaart

21/04/2311

Alamklassid

Alamklasse on reeglina rohkem kui 1 Kõigi alamklasside kohta peab saama öelda lause

konstruktsiooniga ‘alamklass on ülemklass’ Näide, olgu klass Dokument:

Dokument

• Majandusaasta aruanne -> Majandusaasta aruanne on dokument

• Kandeavaldus -> Kandeavaldus on dokument

• Muu dokument -> ‘Muu dokument on dokument’ see pole korrektne, kuna sellist dokumenti ei eksisteeri. Võib kasutada kui sellel on omakorda alamklassid

21/04/2312

Kõik üldistavad ja detailiseerivad mõisted ei pea kuuluma X-tee sisend-väljund andmete hulka, nende eesmärgiks võib olla ka valdkonna arusaadavuse parandamine kolmandate isikute jaoks.

Samas tuleks siiski silmas pidada skoopi ning piirduda vähima vajaliku hulga lisamõistetega.

21/04/2313

Peamised seosed

Kui tuumikmõisted koos võimalike üldistuste ja detailidega on olemas, võib lisada mõned peamised seosed või alustada kohe implementeerimist.

Varajase kodeerimise eeliseks on loogikavigade avastamine. Masinloetava ontoloogia loomise vahenditel

on reeglina olemas sisseehitatud või lisatavad moodulid, mis kasutades kirjeldusloogikat, võimaldavad avastada loogilisi vastuolusid (näiteks Pellet).

21/04/2314

Nimetamine kodeerimisel

Semantika juhishttp://www.riso.ee/et/files/Semantika_juhis_v1.1.pdf Kasuta: alakriipsud sõnade vahel Ei kasuta: spetsiifilised lühendid, liitsõna

sees suurtäht, täpitähed Seosed – moodustuks lause nt

‘kandeavaldus_registreeritakse_registripaevikus’

Atribuudid – algab klassinimega ning siis atribuudi nimi nt ‘Juriidiline_isik_ariregistrikood’

Kasu: Protege järjestab tähestiku järjekorda ning siis on kõik ühe klassi kohta käivad atribuudid või seosed järjest

21/04/2315

Äriregistri ontoloogia nimetamise põhimõtted:

mõisted on kirjutatud suure algustähega ning täppitähtede asemel kirjutatakse vastav täht ilma täppideta (ä -> a) . Mitmest sõnast koosnevad nimetused kirjuta tak se alakriipsuga (majandusaasta_aruanne)

seosed kirjutatakse väikese algustähega ning moodustatakse lihtlause (eraoiguslik_juriidiline_isik_esitab_majandusaasta_aruande). Seoseks on siin tegelikult sõna ’esitab’, kuid märkides terve lause, on hiljem lihtne ka masinloetavast ontoloogiast aru saada ning seda täiendada.

atribuudid kirjutatakse suure algustähega ning kõigepealt kirjutatakse klassi nimi, mille juurde atribuut kuulub või selle klassi ülemklassi nimi. Eesmärgiks on loogiliselt grupeerida sama klassi atribuudid või ülemklassi alamklasside atribuudid. Näiteks klassil Hoiatus on atribuut ’id’. Sellest tulenevalt on atribuudi nimetus ontoloogias Hoiatus_id. Näiteks klass ’Kaardivalise_isiku_andmed’ omab alam klasse ’Osaniku_andmed’ ja ’Aktisonari_andmed’ kõigi nende atribuudid (nt id) on nimetusega ’Kaardivalise_isiku_andmed_id’

21/04/2316

Iteratiivne arendus

Tuleb uuesti üle vaadata X-tee sisend- ja väljundandmed. Märgistada tasub andmeväljad, mis on kaetud juba

olemasolevate mõistetega või edaspidises etapis lisatavate mõiste atribuutidega. Selle tulemusena saab uute mõistete otsimisel keskenduda kasutamata andmeväljade analüüsile ning samas on see teetähiseks tehtud tööle.

X-tee andmete analüüsi tulemusena on mõistlik korraga ontoloogiasse lisada ja implementeerida umbes 5 mõistet ning nende seosed. See tagab, et kogu protsess on pidevalt kontrolli all ning tõenäoliselt ei teki mõisteid, mis kuskile alamklassi või seosesse ei kuulu.

Iteratiivse arendamise tulemusena jääb uute mõistete hulk järjest väiksemaks ja seda vähem on vaja lisada neid eraldi kontseptuaalsele mudelile, st võib piirduda vaid implementeerimisega.

21/04/2317

Mõistete atribuutide lisamine

Mõistete atribuudid vastavad nendele andmeväljadele X-tee teenuste kirjeldustest, millele ei ole otsest vastet mõistete hulgas.

21/04/2318

Dokumenteerimine

Kui kõik komponendid, mõisted, seosed ja atribuudid, on ontoloogias kirjas ning automaatsed kontrollid loogilisi vigu ei tuvasta, on vaja lisada masinloetavasse ontoloogiasse kõigi komponentide inimkeelsed kirjeldused (nn annotatsioonid).

Kirjeldused peavad olema vastavuses semantika juhise nõuetega.

Kui ontoloogia on masinloetaval kujul valmis, on kasutajasõbralik lisada ka inimloetaval kujul dokumentatsioon.

21/04/2319

Dokumenteerimine (visualiseerimise näide)

Joonised on tehtud IHMC COE abil

Taksonoomia esitus Seose esitus

21/04/2320

Visualiseerimine OWLViz abil

21/04/2321

Näide: atribuutide esitus

21/04/2322

Hindamine ja parendamine

... on kõigi etappide lahutamatuks osaks.

Loogilisi vigu aitavad leida tarkvara automaatsed loogikakontrollid.

Sisuliste vigade avastamiseks on tarvilik konsulteerida soovitavalt mitme valdkonda tundva spetsialistiga.

Mida varasemas faasis vead leitakse, seda vähem mõjutab nende parandamine kogu ontoloogia struktuuri.

21/04/2323

Kasutatud vahendid

OWL fail - Protege 4.0http://protege.stanford.edu/Kooskõlakontrolliks lisaks Protege’le

tuletusmootori Pellet plug-inKlassidiagrammi joonistamine Protege’s

OWLViz http://www.co-ode.org/downloads/owlviz/

OWL fail graafiliselt - IHMC COEhttp://www.ihmc.us/groups/coe/

21/04/2324

Vaatame koos Äriregistri ontoloogiat

21/04/2325

Tänan Teid!Lisainfo:

Rica Semjonovaprojektijuht

rica.semjonova@ria.ee6630295

Praktilisi metoodilisi näpunäiteid ontoloogia loomiseks

Documents

Transcript of Praktilisi metoodilisi näpunäiteid ontoloogia loomiseks

Pent Nurmekund ja turkoloogia - EAO · Sidemete loomiseks erinevate türgi-tatari rahvus-rühmade esindajatega kasutasin igasuguseid mooduseid. Peamine neist oli ... Minu käik Kaasani

Riskide kaalutlemine: praktilisi õppetunde Euroopa Liidust

K O O L · koolis ja kodus, aastaringiga looduses, tähtpäevade ja üritustega. Õppetöös rakendatakse Õppetöös rakendatakse üldõpetuslikku tööviisi, kasutatakse praktilisi

Õppematerjali koostamine töölauarakenduste loomiseks Mac ... XCTest raamistikku Objective-C keel Lisaks soovib autor tuua oma kogemuste põhjal näiteid ja soovitusi selle kohta,

ENERGIA TOOTMINE · ENERGIA TOOTMINE Keha on nagu masin, ta vajab energiat töötamiseks, liikumiseks, ainete transportimiseks ja uute rakkude loomiseks. Energiat saadakse väliskeskkonnast

ÕPPEKAVA - Tallinn · 2018. 2. 12. · Õppe- ja kasvatustegevuse valdkonnad on omavahel integreeritud tugevamate seoste loomiseks . Tegevustest moodustub üks tervik. Meie õueala

Juhend kvaliteetse e-kursuse loomiseks

Web viewIsikuandmed jätavad dokumenteeritud jälje ja neid võib kasutada sinu vastu (nt tööandjad) ja ilma sinu loata (profiilide loomiseks ja turunduses)

VIDEOKURSUS ANIMATSIOONI LOOMISEKS ADOBE FLASH BAASIL€¦ · 1.1.1 Adobe Flash Adobe Flash on murrang animatsiooni valdkonnas. Adobe Flash süsteem on ettenähtud animatsiooni bannerite

Nokia C6–00 kasutusjuhenddownload-fds.webapps.microsoft.com/supportFiles/phones/... · 2016. 6. 29. · GPS 63 Teave A-GPS-i (Assisted GPS) kohta 64 Näpunäiteid GPS-ühenduse

Alternatiivsed vahendid veebi loomiseks

Regionaalne SKP piirkondade ja majandussektorite … · Web viewInvesteeringute mahu ja tõhususe (ühe euro lisandväärtuse loomiseks tehtud investeeringud materiaalsesse põhivarasse)

Õigekirjutuse näpunäiteid - engine.koduleht.netengine.koduleht.net/templates/keelehooldekeskus/files/mdl_files.php/11... · tsitaatsõnu. Talle antakse soovitusi, milline võiks

7. MAJANDUSNÄHTUSTE MODELLEERIMINE...1 7. MAJANDUSNÄHTUSTE MODELLEERIMINE Õpetamise eesmärgid, õpitulemused ja teema olulisuse kirjeldus: Eesmärgiks on anda näpunäiteid ja

Sisukorddspace.ut.ee/bitstream/handle/10062/25840/Arvutimangud...Joonistamist Pygames kasutatakse tavaliselt maastiku loomiseks ja mitte tegelaste loomiseks. Tegelased, kes mängudes

TEABEMATERJALIDE KOOSTAMINE: KUIDAS VÄLTIDA ......annab näpunäiteid, kuidas tekstides ja kuvandites ära tunda ning vältida soo- ja vähemusgruppide suhtes levinud stereotüüpe.

Praktilisi kogemusi EVS 914:2012 ehk INSTA 800 Alt... · 2017. 6. 13. · kihid pindadel jms •Töödejuhtimine eeldab tarka tegutsemist! Sageli juhtimisahel pikk, töödejuhatajal

Andmeturve ja krüptoloogia, XII Digitaalallkirja praktilisi aspekte

ÕIGEKIRJUTUSE NÄPUNÄITEID · 2018. 8. 30. · Raamatu väljaandmist on toetanud Haridus- ja Teadusministeerium Koostaja Helika Mäekivi Toimetaja Egle Pullerits Korrektor Argo

II LIIKUMINE - Terviseinfo...teoreetilist tuge ja leiavad praktilisi ideid, mida õpilastega kasutada liikumise temaatika käsitlemisel ja õpilaste liikumisaktiivsuse suurendamisel.