Sosiaalisen median analytiikka

Post on 13-Apr-2017

897 views 6 download

Transcript of Sosiaalisen median analytiikka

Data- ja informaatioanalytiikka

5.4.2016 Sosiaalisen median analytiikka

TkT Jari Jussila

Big Data transaktioista interaktioihin

WEB

BIG DATA

Lähde: Yli-Pietilä & Backman 2013; Valli & Ahlgren 2013

ERP

CRM

ostotiedot maksutiedot

segmentointi tarjoustiedot asiakaskohtaamiset tukikontaktit

weblogit

tarjoushistoria A/B testaaminen

Dynaaminen hinnoittelu

Hakukonemarkkinointi ja optimointi

Mainosverkostot

Käyttäytymispohjainen kohdentaminen Dynaamiset funnellit

Ulkopuolinen demografia

Kuvat ja videot

Puheen muuttaminen tekstiksi

Feedit

Anturi/sensoridata

Tuote / palvelu logit

SMS/MMS

Käyttäjien luoma sisältö Mobiilidata

Klikkivirran analyysi

Sijaintidata

Sosiaaliset verkostot

Sosiaalinen media Sentimentti

Sentimenttianalyysi

Sentiment Analysis

Sentimenttianalyysi

Positiivinen Neutraali Negatiivinen

Esimerkki Twitter keskusteluiden sentimenttianalyysista

Lähde: NEMO Sentiment & Data analyzer

Sentimentti aikajana esityksenä

Lähde: NEMO Sentiment & Data analyzer

TOP 10 henkilöä viestien määrän suhteen

Lähde: NEMO Sentiment & Data analyzer

Mitä hyötyä voisi olla sentimenttianalyysistä?

Viikkoharjoitus 4: Tee-se-itse sentimenttianalyysi

•  Vaihtoehtoja sentimenttianalyysin tekemiseen a)  Analytiikkasovellukset (advanced analytics)

•  SAS® Text Miner http://www.sas.com/en_us/software/analytics/text-miner.html •  SPSS Text Analytics for Surveys

http://www-03.ibm.com/software/products/fi/spss-text-analytics-surveys •  RapidMiner https://rapidminer.com/solutions/sentiment-analysis/

b)  Sosiaalisen median analytiikkasovellukset •  Hootsuite https://hootsuite.com/products/insights •  Meltwater http://www.meltwater.com/fi/ •  …

c)  Sentimenttianalyysisovellukset •  NEMO Sentiment & Data analyzer http://seda.cloudapp.net/ •  SentiStrenght http://sentistrength.wlv.ac.uk/ •  …

d)  Ohjelmalliset lähestymistavat •  R Sentiment package https://cran.r-project.org/src/contrib/Archive/sentiment/ •  Python NLTK-trainer http://nltk-trainer.readthedocs.org/en/latest/ •  …

9/6

Sentimenttianalyysi live demo

Sentiment Analysis in Tableau using R

Lähde: https://www.youtube.com/watch?v=YkO6IXacK7s

Sentimenttianalyysia Tableaussa käyttäen R •  Asenna seuraavat ohjelmistot:

–  R https://www.r-project.org/ –  Rstudio https://www.rstudio.com/

•  ja tarvittavat R-kirjastot –  TM, NLP ja Rserve –  Rstem

https://cran.r-project.org/src/contrib/Archive/Rstem/ –  Sentiment

https://cran.r-project.org/src/contrib/Archive/sentiment/

Ota kirjastot käyttöön ja käynnistä R palvelu (run.Rserve)

Yhdistä Tableau ja R (Manage R Connection)

Luo Tableaussa uusi laskennallinen kenttä •  SCRIPT_STR('classify_polarity(.arg1,algorith

m="bayes", verbose=TRUE)[,4]',ATTR([Text]))

Lähde: https://boraberan.wordpress.com/2013/12/24/sentiment-analysis-in-tableau-with-r/

Verkostoanalyysi

Social Network Analysis (SNA)

Solmut, yhteydet ja verkostot

Tähti

Ympyrä

Ketju

Maksimaalisen keskittynyt, kaikki solmut jäsentyvät yhden keskeisen solmun ympärille

Keskittyneisyys äärimmäisen vähäinen, solmut kytkeytyvät toisiinsa ilman, että yksikään solmu olisi keskeisempi kuin toinen

Löyhempi kuin tähti, mutta keskittyneempi kuin ympyrä

0 1 1 1 1 1 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0

0 1 0 0 0 0 1 1 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 1 1 0 0 0 0 1 0

0 1 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0

18/6

Verkostojen anatomia

Keskeisempiä käsitteitä liittyen verkostoanalyysiin

19

KESKEISYYS ARVOSTUS

TÄRKEYS

Lähde: Wasserman & Faust 1994

Keskeisyysaste Läheisyys Degree Prestige

Proximity Prestige

Välillisyys Informaation keskeisyys

Status or Rank Prestige

•  Keskeisyysaste (degree) •  Kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin

toimijoihin

•  Jos verkostoaineisto on suunnattu, voidaan laskea erikseen lähettäjäkeskeisyys (outdegree) ja vastaanottajakeskeisyys (indegree)

•  Keskeisyysastetta läheinen indeksi on ego tiheys (ego density) (Burt 1982, Knoke & Kuklinski 1982). Ego tiheys on suhdeluku toimijan suorista yhteyksistä kaikkiin mahdollisiin yhteyksiin suuntaamattomissa verkostoissa.

20

Keskeisyysaste (asteluku)

Lähde: Wasserman & Faust 1994

•  Ideana on, että toimija on keskeinen jos se kykenee nopeasti vuorovaikutukseen muiden kanssa

•  Läheisyys (closeness) on toimijan lyhyimpien polkujen summa kaikkiin verkoston muihin toimijoihin

•  dij on lyhyimmän polun pituus i:n ja j:n välillä

•  Huomaa tulkinnassa, että pieni arvo tarkoittaa keskeistä pistettä

∑=

=n

ijiji dc

Läheisyys

Lähde: Wasserman & Faust 1994

•  Välillisyys (betweenness) mittaa, kuinka monen toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu

•  Jos piste sijaitsee useiden muiden pisteiden välillä, se pystyy säätelemään esim. tiedon kulkua näiden välillä (portinvartijat)

•  Piste voi olla (lokaalisti) hyvin epäkeskeinen, mutta sen välillisyys voi silti olla hyvin suuri

22

Välillisyys

Lähde: Wasserman & Faust 1994

Viikkoharjoitus 3: Tee-se-itse Twitter verkostoanalyysi – markkinoinnin näkökulmasta •  Asenna seuraavat ohjelmistot

– Anaconda Python 2.7 https://www.continuum.io/downloads

– Gephi https://gephi.org/ •  Kerää data

– Tätä varten tarvii luoda Twitter sovellus (App) https://apps.twitter.com/

– Nouda twiitit käyttäen seuraavaa skriptiä https://github.com/jukkahuhtamaki/pcm-demo/tree/master/twitter-api

Hyödynnetään #ohsiha oppeja ja työkaluja

Ohjelmallinen sisällönhallinta 2016

Lähde: http://iislab.ee.tut.fi/piiri/groups/ohjelmallinen-sisällönhallinta-2016

Valitse itselle/ryhmälle mieleinen firma/organisaatio

Muokkaa Python koodia Spyderillä ja aja se

Avaa gexf (Graph Exchange XML Format) tiedosto Gephillä

Laske verkostometriikat ja visualisoi verkosto

Kiitokset

•  Jukka Huhtamäki @jnkka #ohsiha •  Harri Jalonen @Jalonen #nemohanke •  Jayesh Gupta @jyshgupta