Tiedonhallinnan ongelmat ja semanttisen teknologian keinot
-
Upload
heimo-haenninen -
Category
Documents
-
view
931 -
download
1
description
Transcript of Tiedonhallinnan ongelmat ja semanttisen teknologian keinot
Tiedon määrä kasvaa rajusti – keinot hallitaSemanttinen teknologia avuksi
Sisällön- & dokumenttien hallinta '13Heimo Hänninen
12.6.2013
Esittely
Talent Base
Luomme asiakkaillemme kilpailuetua suunnittelemalla parhailla menetelmillä tarkoituksenmukaisia IT-ratkaisuja.
1 Strategia
2 Prosessit
3 Ratkaisusuunnittelu
Palvelualueemme
Yksittäisestä sovelluksesta kokonaisuuden hallintaan
Avaintiedon hallinta
(MDM)
Sisällönhallinta (ECM)
Asiakkuudenhallinta (CRM)
Verkkokauppa
Sähköiset palvelut
Talent Base apuna semanttisen tiedonhallinnan kehittämisessäPerustan luominen (master data management)
• Datan profilointi, data standardit & tietomallit, business case, evaluoinnit, arkkitehtuurit, projektointi…
Sisällönhallinta• Metadatamallit, taksonomiat, verkkosisällön hallinta, strategian luonti
Semanttisen tiedonhallinnan käyttöönotto• Hallitut ensiaskeleet (esim. asiakastiedon hallinta, dokumenttien luokittelu)• 360 näkyvyyden luonti• Ontology Systems kumppani (www.ontology.com)
Faktapohjainen tiedonhallinta• Liiketoimintaontologian luonti• liiketoimintasanastot
Best place is cloud base…
Informaatio tsunamiHaaste
Tiedon määrä kasvaa
2011-02-09 9
Tiedon määrä kasvaa
2011-02-09 10
Informaation määrä tuplautuu kahdessa
vuodessa!
Mitä minä kommunikoin?Miten sinä ymmärrät?
Haaste
Semantiikan kolmio: puhumme symboleilla, ajattelemme konsepteilla, tarkoitamme aitoja asioita
2011-06-17 12
Asiakas?
• “symbol”Nimi
• “concept”Henkilökohtainen rajallinen käsitys oliosta “ajatusolio päässäsi”
• “referent”Todellinen olio
http://www.yso.fi/onto/
liito/p1332
HenkilöLeasing firma
Yritysasiakas
Myyntipäällikkö
Company CustomerClient
Asiakas = joka maksaa auton huoltolaskun
http://jhsmeta.fi/sanasto/id/
henkilö/J15152
Asiakas = joka noutaa auton
Huoltopäällikkö
Liike-elämän hengen velttous:Huomenna huomataan, että tänään ei tehty mitään päätöksiä uusista kehityshankkeista
Haaste
Ei käsitellä tänään. Kirjoittajan huomio näinä ankean talouden aikoina.
Esityksen agenda
1. Tiedonhallinnan ongelmat => liiketoiminnan haasteet
2. Ontologia ja semanttinen tiedonhallinta1. Mitä se on?
2. Miten se tehdään?
3. Yhteenveto
Tiedonhallinnan ongelmat liiketoiminnan haasteet
Tiedonhallinnan haasteet
Epäyhtenäiset käsitteet ja kuvaukset
Tiedon määrä kasvaa (nopeammin kuin käsittelykyky)
Tiedon huono laatu
Elinkaari ei ole hallinnassa (omistajuus, hyöty vs. kulut)
Tieto ei ole rakenteista
Tieto on hajallaan, usein siiloissa
Rajoittunut tietoisuus relevantista tiedosta
Liiketoiminnan tempo vaatii tietoa nopeasti
Semanttinen teknologia
auttaa
Liiketoiminnan ongelmia
Ihmiset turhautuu
Huonoja päätöksiä
Turhaa työtä / huono
tuottavuus
Väärinkäsityksiä
Huonoa palvelua
"Cognitive treshold
exeeded"
Kun kompleksisuus ylittää ymmärryksen ihminen hyppää faktoista taikauskoon päätöksenteossa (Rebecca Costa)
Liiketoiminnan ongelmia
Ihmiset turhautuu
Huonoja päätöksiä
Turhaa työtä / huono
tuottavuus
Väärinkäsityksiä
Huonoa palvelua
"Cognitive treshold
exeeded"
30% of people’s
time is spent
searching for
relevant
information
IBM 2005
$16 million/year cost of unproductive time in company size of 1000 employees IDC 2012
Semanttinen tiedonhallinta
Semanttinen teknologia - häh?
Kielitieteessä
• Fonologia = äänteet,• Morfologia = lauseiden
muodostuminen• Semantiikka = merkitykset • Pragmatiikka = sanat kontekstissa
• esim. ironia, terminologia politiikassa, piilomerkitykset
Filosofia
• Ontologia = filosofinen tiede, tutkii olemisen kategorioita
Semanttinen teknologia
• Ontologia = konseptuaalinen tietomalli tietämysrakenteelle, kohde spesifinen
• Semanttisuus = merkityksiä hyödyntävä, (kieltä ja merkityksiä rajatusti ymmärtävä)
Suunnattu graafi - peruspalikka
• RDF tripletti edustaa nimettyä suunnattua graafia. • Siten se soveltuu paremmin tietynlaisen tietämyksen
mallintamiseen kuin relaatiomalli.
Heimo
Tämä kalvo
On luonut
Subject Predicate Object
Ontologian luonti – Graafi konsepti
ASPEN, an industry-leading Advanced Service Platform for Ethernet Networks
A-2200
Access
Aspen
A-2200
Service platform
Access
is a type of product
contains a product
is a type of product
Ethernet Networks
is applicable for
Mitä on ontologia?
Yritys
@nimi Heimo
@rooli konsultti
@sivu http://link
@sposti heimo…
Työntekijä@toimiala MDM… @kaupunki Espoo
@nimi Talent Base
Listaa MDM toimialan konsultit Espoossa.
@ID 2157464-4
työsuhde
Organisaation todellinen maailma
Ontologia = Tietämyskartta Subjektiivinen kuvaus maailmasta
Valitut oliot, yhteydet, ominaisuudet
Liiketoiminnan tarpeet (sovellukset)Logiikka: päättely, haut, navigointi ym.
Faktat, informaatio
URL
Yritys
@nimi Heimo
@rooli konsultti
@sivu http://link
@sposti heimo…
Työntekijä@toimiala MDM… @kaupunki Espoo
@nimi Talent Base
Listaa MDM toimialan konsultit Espoossa.
@ID 2157464-4
työsuhde
Organisaation todellinen maailma
Ontologia = Tietämyskartta Subjektiivinen kuvaus maailmasta
Valitut oliot, yhteydet, ominaisuudet
Liiketoiminnan tarpeet (sovellukset)Logiikka: päättely, haut, navigointi ym.
Faktat, informaatio
URL
Mitä on ontologia - tietokoneelle?
Mikä on ontologiapalvelu?
Talent Basen määritelmä:Ontologiapalvelu on tiedonhallintakyvykkyys:• Luoda konseptuaalinen malli tietovarantojen päälle:
– Käsin mallintaen tai– Automaattisesti (varmistettava luotettavuustaso)
• Palvella tietointensiivisiä sovelluksia:- Muodostaa yhteinen malli olennaiselle tiedolle- Tiedon haku liiketoimintakäsitteiden avulla- Yhdistellä tietoa yli siilojen- Linkittää data ja sisältö liiketoiminnan kontekstiin- Tuo ei-rakenteisen tiedon analytiikan saataville- Koskematta tietolähteisiin (haku lähteistä tarvittaessa)
• Toteutettu semanttisella teknologialla• Vaatii riittävän hyvän perustan ja kypsyystason (tiedon laatu, saatavuus)
Läheinen synonyymi: semanttinen haku ≈ ontologia palvelu
Data ja sisältö
Ontologiapalvelu
Ontologia tiedonhallinnan maailmassa
projektituotepalvelu
työkalu toimitus
ihminen
ratkaisuasiakas teknologia
tarpeethyödyt
SovelluksetKäyttäjät
Haku Help deskProjektin työpöytä
Tuote-opas
CMSTietämyksenintegrointi BI
Tiedonhallinnan tasot – semantic CM
Metadata• Tietotyypit• Kuvaava• Hallinnointi &
käsittely
Luokittelut• Taksonomia• Tesaurus• Sanasto
Konseptuaalinen• Laaja tesaurus• Ontologia
Ilmaisuvoima
Metatiedon uuttaminen
Luokittelun ehdottaminen
Asioiden yhdistely
Sisällön rajallinen ymmärrys
Päättely
Semanttinen vs. perinteinen sisällönhallinta
Semanttinen Perinteinen
Pienen tietoyksikkö • Entiteetti (asia) • Dokumentti
Haun fokus • Entiteetit, suhteet + sisältö • Teksti
Metadatan taso • Tietämyskartta • Arvot ja datatyypit
Kuvaavan luokittelun luonti • Uuttaminen, ehdottava • Käsin (ei tehdä)
Sisällön luokittelu • Hallittu termistö, määritelmät, synonyymit, relaatiot jne.
• Dokumenttityypit, vapaat ”tägit”
Linkitys liiketoiminnan tietotarpeisiin
• Kuvattu: taksonomiaan, tesaurukseen, ontologiaan
• Eri järjestelmässä (paras arvaus haun pohjalta)
Jokapäiväinen ontologiamme – Google search
Tekstihaku• Haetaan sanoja indeksoidusta sisällöstä
Luokittelu• Hakutulokset ehostetaan vertaamalla luokitteleviin termeihin
Tekstianalyysi• Tulosten relevanssi määräytyy semanttisen analyysin pohjalta
Konseptuaa-linen• Sanoja verrataan tunnettuihin konsepteihin• Kielelliset analyysitLinked Open Data yhdistetty
• Vertaus globaaleihin konsepteihin.• Linkitetyt hakutulokset.• Päättely • Luonnollisen kielen ymmärtä-minen
tänään
Sanoista asioihin, asioista konsepteihin
Knowledge fromFreebase.com via APIBy knowledge graph: http://www.freebase.com/m/040zch
Known concept
Knowledge graph - esimerkki
Miten se tehdään?Ontologia ja semanttinen tiedonhallinta
-rooli
Tietoarkkitehtuurin kerrokset
33
Rakenne
ERP
projektituotepalvelu
työkalu toimitus
ihminen
IntraEmailsMDM
IA tasot
Konseptuaalinen
Looginen
Toteutus
ratkaisu
CMS
asiakas
Tietotyypit
Dataja sisältö
- metadata
OntologiaTietämyskartta:
-Liiket. entiteetit-attribuutit
-suhteet
Järjestelmät-tietokuvaukset
Asiayhteys
teknologia
tarpeethyödyt
Luokittelut
Big Data
Liike-toimintaprosessi
T&K Tuotanto Myynti Huolto
Minulle tärkeä tieto. Hyviä päätöksiä.
Laadukas tieto.Saatavuus.
Yhteinen kieli. Jaettu ymmärrys.
Ontologiaratkaisun rakennuspalikat
ABSTRAKTIO TEKNOLOGIA DATA JA SISÄLTÖ
projekti
tuotepalvelu
työkalu toimitus
ihminen
ratkaisu
asiakas teknologia
tarpeethyödyt Rakenteinen
tieto
Muu sisältö
+ +
STANDARDITRDFS, OWL, SKOSRIF
ISO Topic MapsRFF/XML
SPARQL
Web API
XML, JSON-LD, RDFaODBC/JDBC Unicode
Tiedonhallinan kypsyys
Tiedot ja data siiloissaTiedot kuvattu, Siilojen mäppäysBisnestarpeet mäpätty tietoon
Päättely ja analytiikka,Säännöt
Strateginen johtamisvälineEnnusteet
Mukailtu malli pohjautuu: CMMi, Mike 2.0, EA Strategy maturity, Laatujohtamisen kypsyys
Kyvykkyys
Vertikaali ratkaisu
Tietämyksen integrointi palvelu
Ei tarvitse olla täydellistä ollakseen
hyödyllistä
Sanasto
Tyypillisiä käyttötapauksia• Automatisoida operaattori-portaalin sisällönhallintaa
– Tuoterakenne, yhteensopivuustiedot, tuoteinformaatio
• Hallita tietoa & mainoksia portaalissa– uutiset eri lähteistä reititetään, mainosten täsmäys
• ”Älykkäät” asiantuntijan apuvälineet– Nopeutetaan tuotesuunnittelua, fiksu help desk -apulainen
• Tietämystason tiedon integrointi– EAI käy kalliiksi ja hitaaksi – semanttisen tason integraatio
• Tärkeän tiedon uuttaminen isoista datamääristä– Telco operaattoreiden BSS/OSS datan louhinta
• Globaali avoin tieto (julkishallinto, bisnes)– Tiedon yhdistely ja käyttö Web APIn kautta– Programmableweb.com (MuleSoft)– http://www.bbc.co.uk/ontologies/
Opiskele lisää semanttista tiedonkäsittelyä
• Suomessa:– http://data.aalto.fi/ – http://jhsmeta.fi/sanasto/ – http://informationthinker.blogspot.fi/ (Heimon blogi)
• W3C:– http://www.w3.org/standards/semanticweb/– http://www.w3schools.com/web/web_semantic.asp
• Toimittajien valitut palat (MBS warning!):– http://www.cambridgesemantics.com/semantic-university/ – http://www.poolparty.biz/videos/ – http://www.fluidops.com/publications/ – http://www.ontology.com/resources/ – http://www.programmableweb.com/ (Web API)
The Semantic Web = a Web with a meaning.
Yhteenveto
Yhteenveto
• Semanttinen teknologia tarjoaa joustavaa ja tehokasta informaation hallintaa:– Tehokkaampia keinoja hallita tieto-tsunamia– Muodostaa yhtenäisen tietämyskartan tiedosta joka on hajallaan– Tehostaa tiedon hakua– Automatisoi metatiedon luontia (auto tagging)– Tuo ei-rakenteisen tiedon analytiikan saataville– Metatasolla on kettärämpää mallintaa liiketoimintaa
• Vaikka iso asia - liikkeelle pääsee helposti• Semanttinen netti = Linked Open Data (web of data)• Hakukoneet suosii RDF metadataa: http://schema.org/ (SEO)