Social Media Mining & Social Network - Università di Roma LUMSA€¦ · del web 2.0 e di Facebook...

Post on 05-Jun-2020

5 views 0 download

Transcript of Social Media Mining & Social Network - Università di Roma LUMSA€¦ · del web 2.0 e di Facebook...

Social Media Mining

&

Social Network

Prof.ssa Alessandra Musolino

1

Social Media

• Insieme di applicazioni web tramite le quali gli utenti possono creare e scambiarsi contenuti

• è contemporaneamente uno spazio, nel quale prendono vita le informazioni, fortemente integrato con gli strumenti di creazione e scambio delle informazioni stesse

• “un gruppo di applicazioni web basate sui paradigmi (tecnologici ed

ideologici) del web 2.0 che permettono lo scambio e la creazione

di contenuti generati dagli utenti”. (Andreas Kaplan e Michael Haenlein)

• Possiede tutte le caratteristiche di una piattaforma digitale

2

Community online

• Gruppo di persone che si incontrano, discutono e si scambiano informazioni attraverso la rete (gli strumenti utilizzati più frequentemente dagli utenti per interagire sono forum, chat e programmi di messaggistica istantanea) (Def. Treccani)

• è quindi un insieme di persone con interessi o valori comuni

• I social media sono la piattaforma che permette alle community online di formarsi ed evolversi

3

Contenuto Generato dagli Utenti

• Per contenuto generato dagli utenti (dall'inglese user-generated content; sigla UGC) si intende qualsiasi tipo di contenuto - come ad esempio: post nei blog, contributi a wiki, discussioni nei forum, post nei reti sociali e tweet, podcast e altri tipi di file audio, immagini e video digitali - creato dagli utenti e pubblicato inInternet, spesso reso fruibile tramite le piattaforme di social networking (fonte: wikipedia

4

Contenuto Generato dagli Utenti (def. OCSE)

• Tre criteri per illustrare i requisiti generali necessari

– Requisiti di pubblicazione

– Sforzo creativo

– Creazione al di fuori delle pratiche e delle routine professionali

5

Social Network

• Social media e Social Network hanno significati diversi

• SN è una struttura basata su relazioni tra individui, gruppi e organizzazioni

• Uno spazio dove il focus è spostato verso i legami, le relazioni tra le persone e non verso le informazioni che circolano tra di esse

• Si possono studiare con la teoria dei grafi

• Esistevano, come concetto di rete sociale, molto prima del web 2.0 e di Facebook

6

Social Network Analysis (SNA)

• Analisi delle strutture sociali finalizzati alla conoscenza del comportamento collettivo

• Oggetto dello studio sono le dinamiche relazionali che intercorrono tra gli individui

• La teoria permette di indagare sulla reciproca influenza tra comportamenti sociali e sul sistema d’interdipendenze

7

Social Network Analysis (SNA)

• Si avvale del contributo di quanto teorizzato da: – Jacob Levi Moreno, fondatore della sociometria

– Scuola antropologica di Manchester che riservava una particolare attenzione ai cambiamenti nei processi socioculturali

– Scuola di Harvard, approccio strutturalista allo studio delle reti e uso dei modelli algebrici per uno studio quantitativo delle reti sociali (forma delle reti più che contenuto)

8

Differenza tra dato e informazione

Il dato descrive in maniera elementare, un fatto, un oggetto, un evento o altro, attraverso simboli o combinazione di simboli. Non è interpretato ma esprime in forma originaria l’oggetto rappresentato dal dato stesso.

Il dato diventa informazione quando ci permette di scegliere. L’informazione diventa conoscenza quando ci permette di capire.

Il Data Mining

• Selezione, osservazione e modellazione di grandi

moli di dati al fine di riconoscere principi di

funzionamento non noti a priori

• To mine (scavare, estrarre)

• Spesso l’estrazione di informazioni dai dati non si

basa su ipotesi preventivamente definite allo scopo

• Le ipotesi di ricerca vengono scoperte nei dati stessi

• Non è una ricerca sui dati per la produzione di report

10

Social Media Mining

• Estrazione di informazioni dai social media per esaminarle e trasformarle in conoscenza

• Social Media Analytics e Insights possono essere considerati sinonimi, anche se alcuni tool gli attribuiscono il semplice significato di estrazione dei dati di comportamento degli utenti della piattaforma

• Può essere necessario effettuare ripetuti cicli di estrazione, modificando la procedura sulla base dei risultati ottenuti nel ciclo precedente.

11

• Analisi preventiva

– Ricognizione dei dati disponibili

– Valutazione dei costi, includendo il tempo tra i costi

– Valutazione della fattibilità

• Preparazione delle risorse necessarie

– Hardware

– Software

– Umane

– Log delle attività (per tracciare e fornire supporto alle modifiche successive)

12

Ipotesi di Iter procedurale (1)

Ipotesi di Iter procedurale (2)

• Attuazione

– Estrazione dei dati

– Step iniziale di elaborazione (pre-elaborazione)

– Esecuzione dell’algoritmo di estrazione

• Valutazione dei risultati

– Creare indici sintetici

– Organizzare le informazioni ottenute

– Esportare

– Interpretare

– Valutare il procedimento eseguito alla luce dei risultati

13

– Manuale, tramite interazione diretta con l’interfaccia grafica

– Automatica

– Mista

Nella modalità automatica esistono software, detti crawler, o spider o robot, che “leggono” i contenuti oggetto dell’estrazione. Questa lettura può essere fatta anche effettuando ripetute richieste ai servizi API (Application Programming Interface) della piattaforma.

14

Modalità di estrazione dati

• È sempre opportuno pre-trattare i dati dal punto di vista qualitativo e quantitativo, per ottimizzare le fasi successive

• Per semplificare le operazioni di estrazione è possibile che siano stati inizialmente letti senza controlli restrittivi

• Questa operazione può avere effetti sui risultati finali se non gestita correttamente

15

Pre-elaborazione

Esempi:

– Data cleaning (eliminare il rumore)

– Normalizzazione

– Conversioni

– Aggregazioni

– analisi dati mancanti

– Eliminazione di ripetizioni e ridondanze

– Oscuramento dati personali

16

Pre-elaborazione

La scelta iniziale può essere modificata in funzione di eventuali risultati precedenti. La qualità del dato guida i passaggi successivi

– Manuale

– Automatico

– Semi-Automatico

• L’algoritmo che effettua la segmentazione in segmenti omogenei è tra i più noti

• Un insieme di dati è detto profilato se i segmenti sono costruiti adeguatamente

17

Esecuzione algoritmo

Interpretazione dei risultati

• Approccio: – Descrittivo

– Esplorativo

– Predittivo

– Inferenziale (si ricercano correlazioni)

• Modalità – Deduttiva: Premesse + regole Risultati

– Induttiva: Premesse + Risultati Regole

– abduttiva: Risultati + regole Premesse

……….. e ricominciare

18

Link

• http://w2.vatican.va/content/francesco/it/messages/communications/documents/papa-francesco_20190124_messaggio-comunicazioni-sociali.html

• http://w2.vatican.va/content/francesco/it/messages/communications/documents/papa-francesco_20180124_messaggio-comunicazioni-sociali.html

• https://www.avvenire.it/papa/pagine/contro-fake-news-occorrono-persone-e-verita