Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

40
Tiedon määrä kasvaa rajusti – keinot hallita Semanttinen teknologia avuksi Sisällön- & dokumenttien hallinta '13 Heimo Hänninen 12.6.2013

description

Suomenkielinen esitys Talentumin sisällönhallinta seminaarista 2013. (Sorry, in Finnish only). Mitkä on kolme suurinta ongelmaa nyt ja mihin semanttinen teknologia voi tuoda apuja. Kolmas (ja kenties pahin) ongelma on mainittu mutta siihen ei teknologia tepsi - kenties aika parantaa tai putoava meteoriitti...

Transcript of Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Page 1: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Tiedon määrä kasvaa rajusti – keinot hallitaSemanttinen teknologia avuksi

Sisällön- & dokumenttien hallinta '13Heimo Hänninen

12.6.2013

Page 2: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Esittely

Page 3: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Talent Base

Luomme asiakkaillemme kilpailuetua suunnittelemalla parhailla menetelmillä tarkoituksenmukaisia IT-ratkaisuja.

Page 4: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

1 Strategia

2 Prosessit

3 Ratkaisusuunnittelu

Palvelualueemme

Page 5: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Yksittäisestä sovelluksesta kokonaisuuden hallintaan

Avaintiedon hallinta

(MDM)

Sisällönhallinta (ECM)

Asiakkuudenhallinta (CRM)

Verkkokauppa

Sähköiset palvelut

Page 6: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Talent Base apuna semanttisen tiedonhallinnan kehittämisessäPerustan luominen (master data management)

• Datan profilointi, data standardit & tietomallit, business case, evaluoinnit, arkkitehtuurit, projektointi…

Sisällönhallinta• Metadatamallit, taksonomiat, verkkosisällön hallinta, strategian luonti

Semanttisen tiedonhallinnan käyttöönotto• Hallitut ensiaskeleet (esim. asiakastiedon hallinta, dokumenttien luokittelu)• 360 näkyvyyden luonti• Ontology Systems kumppani (www.ontology.com)

Faktapohjainen tiedonhallinta• Liiketoimintaontologian luonti• liiketoimintasanastot

Page 7: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Best place is cloud base…

Page 8: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Informaatio tsunamiHaaste

Page 9: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Tiedon määrä kasvaa

2011-02-09 9

Page 10: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Tiedon määrä kasvaa

2011-02-09 10

Informaation määrä tuplautuu kahdessa

vuodessa!

Page 11: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Mitä minä kommunikoin?Miten sinä ymmärrät?

Haaste

Page 12: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Semantiikan kolmio: puhumme symboleilla, ajattelemme konsepteilla, tarkoitamme aitoja asioita

2011-06-17 12

Asiakas?

• “symbol”Nimi

• “concept”Henkilökohtainen rajallinen käsitys oliosta “ajatusolio päässäsi”

• “referent”Todellinen olio

http://www.yso.fi/onto/

liito/p1332

HenkilöLeasing firma

Yritysasiakas

Myyntipäällikkö

Company CustomerClient

Asiakas = joka maksaa auton huoltolaskun

http://jhsmeta.fi/sanasto/id/

henkilö/J15152

Asiakas = joka noutaa auton

Huoltopäällikkö

Page 13: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Liike-elämän hengen velttous:Huomenna huomataan, että tänään ei tehty mitään päätöksiä uusista kehityshankkeista

Haaste

Ei käsitellä tänään. Kirjoittajan huomio näinä ankean talouden aikoina.

Page 14: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Esityksen agenda

1. Tiedonhallinnan ongelmat => liiketoiminnan haasteet

2. Ontologia ja semanttinen tiedonhallinta1. Mitä se on?

2. Miten se tehdään?

3. Yhteenveto

Page 15: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Tiedonhallinnan ongelmat liiketoiminnan haasteet

Page 16: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Tiedonhallinnan haasteet

Epäyhtenäiset käsitteet ja kuvaukset

Tiedon määrä kasvaa (nopeammin kuin käsittelykyky)

Tiedon huono laatu

Elinkaari ei ole hallinnassa (omistajuus, hyöty vs. kulut)

Tieto ei ole rakenteista

Tieto on hajallaan, usein siiloissa

Rajoittunut tietoisuus relevantista tiedosta

Liiketoiminnan tempo vaatii tietoa nopeasti

Semanttinen teknologia

auttaa

Page 17: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Liiketoiminnan ongelmia

Ihmiset turhautuu

Huonoja päätöksiä

Turhaa työtä / huono

tuottavuus

Väärinkäsityksiä

Huonoa palvelua

"Cognitive treshold

exeeded"

Kun kompleksisuus ylittää ymmärryksen ihminen hyppää faktoista taikauskoon päätöksenteossa (Rebecca Costa)

Page 18: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Liiketoiminnan ongelmia

Ihmiset turhautuu

Huonoja päätöksiä

Turhaa työtä / huono

tuottavuus

Väärinkäsityksiä

Huonoa palvelua

"Cognitive treshold

exeeded"

30% of people’s

time is spent

searching for

relevant

information

IBM 2005

$16 million/year cost of unproductive time in company size of 1000 employees IDC 2012

Page 19: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Semanttinen tiedonhallinta

Page 20: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Semanttinen teknologia - häh?

Kielitieteessä

• Fonologia = äänteet,• Morfologia = lauseiden

muodostuminen• Semantiikka = merkitykset • Pragmatiikka = sanat kontekstissa

• esim. ironia, terminologia politiikassa, piilomerkitykset

Filosofia

• Ontologia = filosofinen tiede, tutkii olemisen kategorioita

Semanttinen teknologia

• Ontologia = konseptuaalinen tietomalli tietämysrakenteelle, kohde spesifinen

• Semanttisuus = merkityksiä hyödyntävä, (kieltä ja merkityksiä rajatusti ymmärtävä)

Page 21: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Suunnattu graafi - peruspalikka

• RDF tripletti edustaa nimettyä suunnattua graafia. • Siten se soveltuu paremmin tietynlaisen tietämyksen

mallintamiseen kuin relaatiomalli.

Heimo

Tämä kalvo

On luonut

Subject Predicate Object

Page 22: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Ontologian luonti – Graafi konsepti

ASPEN, an industry-leading Advanced Service Platform for Ethernet Networks

A-2200

Access

Aspen

A-2200

Service platform

Access

is a type of product

contains a product

is a type of product

Ethernet Networks

is applicable for

Page 23: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Mitä on ontologia?

Yritys

@nimi Heimo

@rooli konsultti

@sivu http://link

@sposti heimo…

Työntekijä@toimiala MDM… @kaupunki Espoo

@nimi Talent Base

Listaa MDM toimialan konsultit Espoossa.

@ID 2157464-4

työsuhde

Organisaation todellinen maailma

Ontologia = Tietämyskartta Subjektiivinen kuvaus maailmasta

Valitut oliot, yhteydet, ominaisuudet

Liiketoiminnan tarpeet (sovellukset)Logiikka: päättely, haut, navigointi ym.

Faktat, informaatio

URL

Page 24: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Yritys

@nimi Heimo

@rooli konsultti

@sivu http://link

@sposti heimo…

Työntekijä@toimiala MDM… @kaupunki Espoo

@nimi Talent Base

Listaa MDM toimialan konsultit Espoossa.

@ID 2157464-4

työsuhde

Organisaation todellinen maailma

Ontologia = Tietämyskartta Subjektiivinen kuvaus maailmasta

Valitut oliot, yhteydet, ominaisuudet

Liiketoiminnan tarpeet (sovellukset)Logiikka: päättely, haut, navigointi ym.

Faktat, informaatio

URL

Mitä on ontologia - tietokoneelle?

Page 25: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Mikä on ontologiapalvelu?

Talent Basen määritelmä:Ontologiapalvelu on tiedonhallintakyvykkyys:• Luoda konseptuaalinen malli tietovarantojen päälle:

– Käsin mallintaen tai– Automaattisesti (varmistettava luotettavuustaso)

• Palvella tietointensiivisiä sovelluksia:- Muodostaa yhteinen malli olennaiselle tiedolle- Tiedon haku liiketoimintakäsitteiden avulla- Yhdistellä tietoa yli siilojen- Linkittää data ja sisältö liiketoiminnan kontekstiin- Tuo ei-rakenteisen tiedon analytiikan saataville- Koskematta tietolähteisiin (haku lähteistä tarvittaessa)

• Toteutettu semanttisella teknologialla• Vaatii riittävän hyvän perustan ja kypsyystason (tiedon laatu, saatavuus)

Läheinen synonyymi: semanttinen haku ≈ ontologia palvelu

Page 26: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Data ja sisältö

Ontologiapalvelu

Ontologia tiedonhallinnan maailmassa

projektituotepalvelu

työkalu toimitus

ihminen

ratkaisuasiakas teknologia

tarpeethyödyt

SovelluksetKäyttäjät

Haku Help deskProjektin työpöytä

Tuote-opas

CMSTietämyksenintegrointi BI

Page 27: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Tiedonhallinnan tasot – semantic CM

Metadata• Tietotyypit• Kuvaava• Hallinnointi &

käsittely

Luokittelut• Taksonomia• Tesaurus• Sanasto

Konseptuaalinen• Laaja tesaurus• Ontologia

Ilmaisuvoima

Metatiedon uuttaminen

Luokittelun ehdottaminen

Asioiden yhdistely

Sisällön rajallinen ymmärrys

Päättely

Page 28: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Semanttinen vs. perinteinen sisällönhallinta

Semanttinen Perinteinen

Pienen tietoyksikkö • Entiteetti (asia) • Dokumentti

Haun fokus • Entiteetit, suhteet + sisältö • Teksti

Metadatan taso • Tietämyskartta • Arvot ja datatyypit

Kuvaavan luokittelun luonti • Uuttaminen, ehdottava • Käsin (ei tehdä)

Sisällön luokittelu • Hallittu termistö, määritelmät, synonyymit, relaatiot jne.

• Dokumenttityypit, vapaat ”tägit”

Linkitys liiketoiminnan tietotarpeisiin

• Kuvattu: taksonomiaan, tesaurukseen, ontologiaan

• Eri järjestelmässä (paras arvaus haun pohjalta)

Page 29: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Jokapäiväinen ontologiamme – Google search

Tekstihaku• Haetaan sanoja indeksoidusta sisällöstä

Luokittelu• Hakutulokset ehostetaan vertaamalla luokitteleviin termeihin

Tekstianalyysi• Tulosten relevanssi määräytyy semanttisen analyysin pohjalta

Konseptuaa-linen• Sanoja verrataan tunnettuihin konsepteihin• Kielelliset analyysitLinked Open Data yhdistetty

• Vertaus globaaleihin konsepteihin.• Linkitetyt hakutulokset.• Päättely • Luonnollisen kielen ymmärtä-minen

tänään

Page 30: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Sanoista asioihin, asioista konsepteihin

Knowledge fromFreebase.com via APIBy knowledge graph: http://www.freebase.com/m/040zch

Known concept

Page 31: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Knowledge graph - esimerkki

Page 32: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Miten se tehdään?Ontologia ja semanttinen tiedonhallinta

Page 33: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

-rooli

Tietoarkkitehtuurin kerrokset

33

Rakenne

ERP

projektituotepalvelu

työkalu toimitus

ihminen

IntraEmailsMDM

IA tasot

Konseptuaalinen

Looginen

Toteutus

ratkaisu

CMS

asiakas

Tietotyypit

Dataja sisältö

- metadata

OntologiaTietämyskartta:

-Liiket. entiteetit-attribuutit

-suhteet

Järjestelmät-tietokuvaukset

Asiayhteys

teknologia

tarpeethyödyt

Luokittelut

Big Data

Liike-toimintaprosessi

T&K Tuotanto Myynti Huolto

Minulle tärkeä tieto. Hyviä päätöksiä.

Laadukas tieto.Saatavuus.

Yhteinen kieli. Jaettu ymmärrys.

Page 34: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Ontologiaratkaisun rakennuspalikat

ABSTRAKTIO TEKNOLOGIA DATA JA SISÄLTÖ

projekti

tuotepalvelu

työkalu toimitus

ihminen

ratkaisu

asiakas teknologia

tarpeethyödyt Rakenteinen

tieto

Muu sisältö

+ +

STANDARDITRDFS, OWL, SKOSRIF

ISO Topic MapsRFF/XML

SPARQL

Web API

XML, JSON-LD, RDFaODBC/JDBC Unicode

Page 35: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Tiedonhallinan kypsyys

Tiedot ja data siiloissaTiedot kuvattu, Siilojen mäppäysBisnestarpeet mäpätty tietoon

Päättely ja analytiikka,Säännöt

Strateginen johtamisvälineEnnusteet

Mukailtu malli pohjautuu: CMMi, Mike 2.0, EA Strategy maturity, Laatujohtamisen kypsyys

Kyvykkyys

Vertikaali ratkaisu

Tietämyksen integrointi palvelu

Ei tarvitse olla täydellistä ollakseen

hyödyllistä

Sanasto

Page 36: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Tyypillisiä käyttötapauksia• Automatisoida operaattori-portaalin sisällönhallintaa

– Tuoterakenne, yhteensopivuustiedot, tuoteinformaatio

• Hallita tietoa & mainoksia portaalissa– uutiset eri lähteistä reititetään, mainosten täsmäys

• ”Älykkäät” asiantuntijan apuvälineet– Nopeutetaan tuotesuunnittelua, fiksu help desk -apulainen

• Tietämystason tiedon integrointi– EAI käy kalliiksi ja hitaaksi – semanttisen tason integraatio

• Tärkeän tiedon uuttaminen isoista datamääristä– Telco operaattoreiden BSS/OSS datan louhinta

• Globaali avoin tieto (julkishallinto, bisnes)– Tiedon yhdistely ja käyttö Web APIn kautta– Programmableweb.com (MuleSoft)– http://www.bbc.co.uk/ontologies/

Page 37: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Opiskele lisää semanttista tiedonkäsittelyä

• Suomessa:– http://data.aalto.fi/ – http://jhsmeta.fi/sanasto/ – http://informationthinker.blogspot.fi/ (Heimon blogi)

• W3C:– http://www.w3.org/standards/semanticweb/– http://www.w3schools.com/web/web_semantic.asp

• Toimittajien valitut palat (MBS warning!):– http://www.cambridgesemantics.com/semantic-university/ – http://www.poolparty.biz/videos/ – http://www.fluidops.com/publications/ – http://www.ontology.com/resources/ – http://www.programmableweb.com/ (Web API)

The Semantic Web = a Web with a meaning.

Page 38: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Yhteenveto

Page 39: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Yhteenveto

• Semanttinen teknologia tarjoaa joustavaa ja tehokasta informaation hallintaa:– Tehokkaampia keinoja hallita tieto-tsunamia– Muodostaa yhtenäisen tietämyskartan tiedosta joka on hajallaan– Tehostaa tiedon hakua– Automatisoi metatiedon luontia (auto tagging)– Tuo ei-rakenteisen tiedon analytiikan saataville– Metatasolla on kettärämpää mallintaa liiketoimintaa

• Vaikka iso asia - liikkeelle pääsee helposti• Semanttinen netti = Linked Open Data (web of data)• Hakukoneet suosii RDF metadataa: http://schema.org/ (SEO)

Page 40: Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Kysymysten aikaolkaa hyvä!

Kiitos!

[email protected]