Timo Honkela: Tietokone lukemassa yli 100 miljoonaa eri kirjaa: Kielitieteen ja filosofian...

21
Timo Honkela, Luonnonfilosofian seura, 24.1.2017 Timo Honkela Helsingin yliopisto 24.1.2017 Tietokone lukemassa yli 100 miljoonaa eri kirjaa: Kielitieteen ja filosofian näkökulmia [email protected] Luonnonfilosofian seura — The Finnish Society for Natural Philosophy

Transcript of Timo Honkela: Tietokone lukemassa yli 100 miljoonaa eri kirjaa: Kielitieteen ja filosofian...

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Timo Honkela

Helsingin yliopisto

24.1.2017

Tietokone lukemassa yli 100 miljoonaa eri kirjaa:

Kielitieteen ja filosofian näkökulmia

[email protected]

Luonnonfilosofian seura — The Finnish Society for Natural Philosophy

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Yli sata miljoonaa kirjaa

http://www.pcworld.com/article/202803/google_129_million_different_books_have_been_published.html

● Googlen kirjaprojektissa kerrottiin vuonna 2010, että maailmassa on julkaistu129 864 880 kirjaa

● Tarkan luvun antaminen ei ole kovin mielekästä, mutta suuruusluokka antaakäsityksen käsillä olevasta ilmiöstä

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Esimerkki tunnetuistasuomalaisista kirjoissa(Google Books 1890-2006)

Jean SibeliusGeorge Henrik von WrightUrho Kekkonen

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Esimerkki suomalaisistatieteentekijöistä kirjoissa

(Google Books 1970-2006)

Ilkka NiiniluotoBengt HolmströmTeuvo KohonenIlkka HanskiMika PantzarMarkku KulmalaLeena Peltola-PalotieTimo HonkelaRiitta Hari

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Ihminen kirjoissa:Kirjoittaja, toimittaja, viittaussuhteessa

etc.

https://www.google.com/search?tbm=bks&q=Timo+Honkela

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Aineistojen digitointi:esimerkkinä Kansalliskirjaston

sanomalehtiaineisto

http://digi.kansalliskirjasto.fi/

Digitointi > OCR > Hakutoiminnot ja jatkojalostus

https://www.kansalliskirjasto.fi/fi/palvelut#digitointi--ja-sailytyspalvelut

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Filosofiaa eivät voi paetatietojenkäsittelijätkään

● Uusi valituksen aika?● Empirismin ja rationalismin vuoropuhelu● Vuosisataiset filosofiset näkökulmat ja teemat

ovat edelleen tärkeitä ja aina vain tärkeämpiä koneiden käyttöön liittyen eli kun tekoälyä ja koneoppimista sovelletaan ihmistieteiden piirissä

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Tietokoneilla on helppolaskea lukumääriä ja

korrelaatioita

Voiko tietokoneen avullatarkastella merkityksiä?

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Loogisen päättelyn muotoja

● Deduktio● Induktio● Abduktio

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Koneoppimisen muotoja

● Ohjattu oppiminen● Ohjaamaton oppiminen● Vahvistusoppiminen

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Tiedon esittämisen muotoja

● Symbolit, propositiot● Vektoriavaruudet (tensorit)● Tila-avaruusmallit, dynaamisen järjestelmät

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Sanat-käsitteet-havainnot

Kaari

Vrt. tuoli, kuppi, ...

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Klassikkoesimerkki:Grimmin satujen analyysi (1995)

Honkela, Pulkki & Kohonen 1995

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Tilastollisesti etsittyjä assosiaatioitasanoille 1) onnellisuus ja 2) lätäkkö

● mielenrauha● tyytyväisyys● onnellisuuden● elämänilo● yksilöllisyys● rakkaus● välittäminen● onni● hyvinvointi● positiivisuus

● lammikko● lampi● oja● läntti● kuoppa● kolo● hiekka● allas● pläntti● läikkä

http://bionlp-www.utu.fi/wv_demo/Kiitokset: Turku BioNLP group, Filip Ginter ja Citizen Mindscapes -projekti (Helsinki, Turku) http://blogs.helsinki.fi/citizenmindscapes/

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Uusi askel:

Humanistinen meta-analyysi

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Taustaa: tulkinnan yksilöllisyydenmallintaminen (GICA-menetelmä)

● GICA-menetelmät (Grounded Intersubjective Concept Analysis) (Honkela ym. 2012) mahdollistaa mallit, joissa kunkin sanan merkitystä tarkastellaan yksilöllisesti

● Esimerkkinä USAn presidenttien puheet(State of the Union Address) ja sanan HEALTH merkityksen analyysi kontekstitietoatilastollisesti analysoide

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Sanan “health” analyysi

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Humanistinen meta-analyysi (Honkela 2016)

Aineistosanoineen

Analyysiolettaensanojenjaettu

merkitys Honkelanehdotus

Aineistosanoineen

Analyysi hyödyntäenmerkityksienvaihtelumallia

Merkityksien analyysirikkaissa konteksteissa

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Humanistinen meta-analyysi (Honkela 2016)

Aineistosanoineen

Analyysiolettaensanojenjaettu

merkitys Honkelanehdotus

Aineistosanoineen

Analyysi hyödyntäenmerkityksienvaihtelumallia

Merkityksien analyysirikkaissa konteksteissa

Sanoja ei voi ottaaanalyysin perusdataksi

olettaen, että sana tarkoittaatäsmälleen samaa, kun

puhuja/ kirjoittaja on eri jaeri kontekstissa

Sanan merkitys ontilastollinen, subjektiivinenja kontekstiriippuva ilmiö

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Humanistinen meta-analyysi (Honkela 2016)

...AUTENTTINEN...HAUVAKATTIKISSAKOIRA…REILU...TEHOKAS...

DATA (1)RIKAS

MERKITYS-MALLI

SISÄLTÖ-ANALYYSI

(HUMANISTINENMETA-ANALYYSI)

DATA (2)

Timo Honkela, Luonnonfilosofian seura, 24.1.2017

Kiitos!

http://375humanistia.helsinki.fi/humanistit/timo-honkela

http://www.slideshare.net/timohonkela

https://www.youtube.com/watch?v=UXwkGPMMZdk