Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Post on 05-Dec-2014

931 views 1 download

description

Suomenkielinen esitys Talentumin sisällönhallinta seminaarista 2013. (Sorry, in Finnish only). Mitkä on kolme suurinta ongelmaa nyt ja mihin semanttinen teknologia voi tuoda apuja. Kolmas (ja kenties pahin) ongelma on mainittu mutta siihen ei teknologia tepsi - kenties aika parantaa tai putoava meteoriitti...

Transcript of Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Tiedon määrä kasvaa rajusti – keinot hallitaSemanttinen teknologia avuksi

Sisällön- & dokumenttien hallinta '13Heimo Hänninen

12.6.2013

Esittely

Talent Base

Luomme asiakkaillemme kilpailuetua suunnittelemalla parhailla menetelmillä tarkoituksenmukaisia IT-ratkaisuja.

1 Strategia

2 Prosessit

3 Ratkaisusuunnittelu

Palvelualueemme

Yksittäisestä sovelluksesta kokonaisuuden hallintaan

Avaintiedon hallinta

(MDM)

Sisällönhallinta (ECM)

Asiakkuudenhallinta (CRM)

Verkkokauppa

Sähköiset palvelut

Talent Base apuna semanttisen tiedonhallinnan kehittämisessäPerustan luominen (master data management)

• Datan profilointi, data standardit & tietomallit, business case, evaluoinnit, arkkitehtuurit, projektointi…

Sisällönhallinta• Metadatamallit, taksonomiat, verkkosisällön hallinta, strategian luonti

Semanttisen tiedonhallinnan käyttöönotto• Hallitut ensiaskeleet (esim. asiakastiedon hallinta, dokumenttien luokittelu)• 360 näkyvyyden luonti• Ontology Systems kumppani (www.ontology.com)

Faktapohjainen tiedonhallinta• Liiketoimintaontologian luonti• liiketoimintasanastot

Best place is cloud base…

Informaatio tsunamiHaaste

Tiedon määrä kasvaa

2011-02-09 9

Tiedon määrä kasvaa

2011-02-09 10

Informaation määrä tuplautuu kahdessa

vuodessa!

Mitä minä kommunikoin?Miten sinä ymmärrät?

Haaste

Semantiikan kolmio: puhumme symboleilla, ajattelemme konsepteilla, tarkoitamme aitoja asioita

2011-06-17 12

Asiakas?

• “symbol”Nimi

• “concept”Henkilökohtainen rajallinen käsitys oliosta “ajatusolio päässäsi”

• “referent”Todellinen olio

http://www.yso.fi/onto/

liito/p1332

HenkilöLeasing firma

Yritysasiakas

Myyntipäällikkö

Company CustomerClient

Asiakas = joka maksaa auton huoltolaskun

http://jhsmeta.fi/sanasto/id/

henkilö/J15152

Asiakas = joka noutaa auton

Huoltopäällikkö

Liike-elämän hengen velttous:Huomenna huomataan, että tänään ei tehty mitään päätöksiä uusista kehityshankkeista

Haaste

Ei käsitellä tänään. Kirjoittajan huomio näinä ankean talouden aikoina.

Esityksen agenda

1. Tiedonhallinnan ongelmat => liiketoiminnan haasteet

2. Ontologia ja semanttinen tiedonhallinta1. Mitä se on?

2. Miten se tehdään?

3. Yhteenveto

Tiedonhallinnan ongelmat liiketoiminnan haasteet

Tiedonhallinnan haasteet

Epäyhtenäiset käsitteet ja kuvaukset

Tiedon määrä kasvaa (nopeammin kuin käsittelykyky)

Tiedon huono laatu

Elinkaari ei ole hallinnassa (omistajuus, hyöty vs. kulut)

Tieto ei ole rakenteista

Tieto on hajallaan, usein siiloissa

Rajoittunut tietoisuus relevantista tiedosta

Liiketoiminnan tempo vaatii tietoa nopeasti

Semanttinen teknologia

auttaa

Liiketoiminnan ongelmia

Ihmiset turhautuu

Huonoja päätöksiä

Turhaa työtä / huono

tuottavuus

Väärinkäsityksiä

Huonoa palvelua

"Cognitive treshold

exeeded"

Kun kompleksisuus ylittää ymmärryksen ihminen hyppää faktoista taikauskoon päätöksenteossa (Rebecca Costa)

Liiketoiminnan ongelmia

Ihmiset turhautuu

Huonoja päätöksiä

Turhaa työtä / huono

tuottavuus

Väärinkäsityksiä

Huonoa palvelua

"Cognitive treshold

exeeded"

30% of people’s

time is spent

searching for

relevant

information

IBM 2005

$16 million/year cost of unproductive time in company size of 1000 employees IDC 2012

Semanttinen tiedonhallinta

Semanttinen teknologia - häh?

Kielitieteessä

• Fonologia = äänteet,• Morfologia = lauseiden

muodostuminen• Semantiikka = merkitykset • Pragmatiikka = sanat kontekstissa

• esim. ironia, terminologia politiikassa, piilomerkitykset

Filosofia

• Ontologia = filosofinen tiede, tutkii olemisen kategorioita

Semanttinen teknologia

• Ontologia = konseptuaalinen tietomalli tietämysrakenteelle, kohde spesifinen

• Semanttisuus = merkityksiä hyödyntävä, (kieltä ja merkityksiä rajatusti ymmärtävä)

Suunnattu graafi - peruspalikka

• RDF tripletti edustaa nimettyä suunnattua graafia. • Siten se soveltuu paremmin tietynlaisen tietämyksen

mallintamiseen kuin relaatiomalli.

Heimo

Tämä kalvo

On luonut

Subject Predicate Object

Ontologian luonti – Graafi konsepti

ASPEN, an industry-leading Advanced Service Platform for Ethernet Networks

A-2200

Access

Aspen

A-2200

Service platform

Access

is a type of product

contains a product

is a type of product

Ethernet Networks

is applicable for

Mitä on ontologia?

Yritys

@nimi Heimo

@rooli konsultti

@sivu http://link

@sposti heimo…

Työntekijä@toimiala MDM… @kaupunki Espoo

@nimi Talent Base

Listaa MDM toimialan konsultit Espoossa.

@ID 2157464-4

työsuhde

Organisaation todellinen maailma

Ontologia = Tietämyskartta Subjektiivinen kuvaus maailmasta

Valitut oliot, yhteydet, ominaisuudet

Liiketoiminnan tarpeet (sovellukset)Logiikka: päättely, haut, navigointi ym.

Faktat, informaatio

URL

Yritys

@nimi Heimo

@rooli konsultti

@sivu http://link

@sposti heimo…

Työntekijä@toimiala MDM… @kaupunki Espoo

@nimi Talent Base

Listaa MDM toimialan konsultit Espoossa.

@ID 2157464-4

työsuhde

Organisaation todellinen maailma

Ontologia = Tietämyskartta Subjektiivinen kuvaus maailmasta

Valitut oliot, yhteydet, ominaisuudet

Liiketoiminnan tarpeet (sovellukset)Logiikka: päättely, haut, navigointi ym.

Faktat, informaatio

URL

Mitä on ontologia - tietokoneelle?

Mikä on ontologiapalvelu?

Talent Basen määritelmä:Ontologiapalvelu on tiedonhallintakyvykkyys:• Luoda konseptuaalinen malli tietovarantojen päälle:

– Käsin mallintaen tai– Automaattisesti (varmistettava luotettavuustaso)

• Palvella tietointensiivisiä sovelluksia:- Muodostaa yhteinen malli olennaiselle tiedolle- Tiedon haku liiketoimintakäsitteiden avulla- Yhdistellä tietoa yli siilojen- Linkittää data ja sisältö liiketoiminnan kontekstiin- Tuo ei-rakenteisen tiedon analytiikan saataville- Koskematta tietolähteisiin (haku lähteistä tarvittaessa)

• Toteutettu semanttisella teknologialla• Vaatii riittävän hyvän perustan ja kypsyystason (tiedon laatu, saatavuus)

Läheinen synonyymi: semanttinen haku ≈ ontologia palvelu

Data ja sisältö

Ontologiapalvelu

Ontologia tiedonhallinnan maailmassa

projektituotepalvelu

työkalu toimitus

ihminen

ratkaisuasiakas teknologia

tarpeethyödyt

SovelluksetKäyttäjät

Haku Help deskProjektin työpöytä

Tuote-opas

CMSTietämyksenintegrointi BI

Tiedonhallinnan tasot – semantic CM

Metadata• Tietotyypit• Kuvaava• Hallinnointi &

käsittely

Luokittelut• Taksonomia• Tesaurus• Sanasto

Konseptuaalinen• Laaja tesaurus• Ontologia

Ilmaisuvoima

Metatiedon uuttaminen

Luokittelun ehdottaminen

Asioiden yhdistely

Sisällön rajallinen ymmärrys

Päättely

Semanttinen vs. perinteinen sisällönhallinta

Semanttinen Perinteinen

Pienen tietoyksikkö • Entiteetti (asia) • Dokumentti

Haun fokus • Entiteetit, suhteet + sisältö • Teksti

Metadatan taso • Tietämyskartta • Arvot ja datatyypit

Kuvaavan luokittelun luonti • Uuttaminen, ehdottava • Käsin (ei tehdä)

Sisällön luokittelu • Hallittu termistö, määritelmät, synonyymit, relaatiot jne.

• Dokumenttityypit, vapaat ”tägit”

Linkitys liiketoiminnan tietotarpeisiin

• Kuvattu: taksonomiaan, tesaurukseen, ontologiaan

• Eri järjestelmässä (paras arvaus haun pohjalta)

Jokapäiväinen ontologiamme – Google search

Tekstihaku• Haetaan sanoja indeksoidusta sisällöstä

Luokittelu• Hakutulokset ehostetaan vertaamalla luokitteleviin termeihin

Tekstianalyysi• Tulosten relevanssi määräytyy semanttisen analyysin pohjalta

Konseptuaa-linen• Sanoja verrataan tunnettuihin konsepteihin• Kielelliset analyysitLinked Open Data yhdistetty

• Vertaus globaaleihin konsepteihin.• Linkitetyt hakutulokset.• Päättely • Luonnollisen kielen ymmärtä-minen

tänään

Sanoista asioihin, asioista konsepteihin

Knowledge fromFreebase.com via APIBy knowledge graph: http://www.freebase.com/m/040zch

Known concept

Knowledge graph - esimerkki

Miten se tehdään?Ontologia ja semanttinen tiedonhallinta

-rooli

Tietoarkkitehtuurin kerrokset

33

Rakenne

ERP

projektituotepalvelu

työkalu toimitus

ihminen

IntraEmailsMDM

IA tasot

Konseptuaalinen

Looginen

Toteutus

ratkaisu

CMS

asiakas

Tietotyypit

Dataja sisältö

- metadata

OntologiaTietämyskartta:

-Liiket. entiteetit-attribuutit

-suhteet

Järjestelmät-tietokuvaukset

Asiayhteys

teknologia

tarpeethyödyt

Luokittelut

Big Data

Liike-toimintaprosessi

T&K Tuotanto Myynti Huolto

Minulle tärkeä tieto. Hyviä päätöksiä.

Laadukas tieto.Saatavuus.

Yhteinen kieli. Jaettu ymmärrys.

Ontologiaratkaisun rakennuspalikat

ABSTRAKTIO TEKNOLOGIA DATA JA SISÄLTÖ

projekti

tuotepalvelu

työkalu toimitus

ihminen

ratkaisu

asiakas teknologia

tarpeethyödyt Rakenteinen

tieto

Muu sisältö

+ +

STANDARDITRDFS, OWL, SKOSRIF

ISO Topic MapsRFF/XML

SPARQL

Web API

XML, JSON-LD, RDFaODBC/JDBC Unicode

Tiedonhallinan kypsyys

Tiedot ja data siiloissaTiedot kuvattu, Siilojen mäppäysBisnestarpeet mäpätty tietoon

Päättely ja analytiikka,Säännöt

Strateginen johtamisvälineEnnusteet

Mukailtu malli pohjautuu: CMMi, Mike 2.0, EA Strategy maturity, Laatujohtamisen kypsyys

Kyvykkyys

Vertikaali ratkaisu

Tietämyksen integrointi palvelu

Ei tarvitse olla täydellistä ollakseen

hyödyllistä

Sanasto

Tyypillisiä käyttötapauksia• Automatisoida operaattori-portaalin sisällönhallintaa

– Tuoterakenne, yhteensopivuustiedot, tuoteinformaatio

• Hallita tietoa & mainoksia portaalissa– uutiset eri lähteistä reititetään, mainosten täsmäys

• ”Älykkäät” asiantuntijan apuvälineet– Nopeutetaan tuotesuunnittelua, fiksu help desk -apulainen

• Tietämystason tiedon integrointi– EAI käy kalliiksi ja hitaaksi – semanttisen tason integraatio

• Tärkeän tiedon uuttaminen isoista datamääristä– Telco operaattoreiden BSS/OSS datan louhinta

• Globaali avoin tieto (julkishallinto, bisnes)– Tiedon yhdistely ja käyttö Web APIn kautta– Programmableweb.com (MuleSoft)– http://www.bbc.co.uk/ontologies/

Opiskele lisää semanttista tiedonkäsittelyä

• Suomessa:– http://data.aalto.fi/ – http://jhsmeta.fi/sanasto/ – http://informationthinker.blogspot.fi/ (Heimon blogi)

• W3C:– http://www.w3.org/standards/semanticweb/– http://www.w3schools.com/web/web_semantic.asp

• Toimittajien valitut palat (MBS warning!):– http://www.cambridgesemantics.com/semantic-university/ – http://www.poolparty.biz/videos/ – http://www.fluidops.com/publications/ – http://www.ontology.com/resources/ – http://www.programmableweb.com/ (Web API)

The Semantic Web = a Web with a meaning.

Yhteenveto

Yhteenveto

• Semanttinen teknologia tarjoaa joustavaa ja tehokasta informaation hallintaa:– Tehokkaampia keinoja hallita tieto-tsunamia– Muodostaa yhtenäisen tietämyskartan tiedosta joka on hajallaan– Tehostaa tiedon hakua– Automatisoi metatiedon luontia (auto tagging)– Tuo ei-rakenteisen tiedon analytiikan saataville– Metatasolla on kettärämpää mallintaa liiketoimintaa

• Vaikka iso asia - liikkeelle pääsee helposti• Semanttinen netti = Linked Open Data (web of data)• Hakukoneet suosii RDF metadataa: http://schema.org/ (SEO)

Kysymysten aikaolkaa hyvä!

Kiitos!

Heimo.hanninen@talentbase.fi