Download - 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Transcript

2. Grafi

IndiceTipi di grafiRappresentazione di grafiMisure su grafi

distanza minimacentralità dei nodibetweenness, clustering closeness, Distribuzione dei gradi dei nodi

Esercizi: PajekOctave:

Page 3: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Un grafo è un insieme di nodi (o vertici) V, collegati tra loro da un insieme di archi [arcs,links] o spigoli (o collegamenti o archi non orientati) [edges] E. Si indica con G=(V,E).

numero spigoli=|E|=m; numero vertici=|V|=n

L’ordine di un grafo è il numero di vertici n

Un grafo si dice semplice se non ha multiarchi (multiple arcs) o loop

multiarcoloop

Nodi: persone, eventi, jobs, etc.Archi: realazioni personali, sequenze temporali, …

Page 4: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Un percorso (walk) è una sequenza di nodi adiacenti.

Un percorso chiuso è un percorso in cui il primo e l’ultimo vertice coincidono ovvero che congiunge un nodo a se stesso

Un grafo si dice connesso se dati due nodi qualsiasi esiste un cammino che li congiunge

Due archi si dicono connessi se hanno un nodo in comune

Un cammino (path) è una sequenza di archi connessiche congiunge due nodi (in modo tale che nessun nodo si ripeta)

Un ciclo è un cammino che congiunge un nodo a se stesso

Page 5: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

n3n4

Percorso diretto (Directed walk) n5-n1-n2-n3-n4-n2-n3Cammino diretto (Directed Path) n5 n4 n2 n3 Cammino non diretto (Semipath) n1 n2 n5 n4 n3Ciclo (Cycle) n2 n3 n4 n2Ciclo non diretto (Semicycle) n1 n2 n5 n1

Page 6: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Una componente di un grafo è un sottografo connesso.

Un sottografo (sub-graph) di un grafo è un grafo i cui nodi e archi sono un sottoinsieme di quelli di G.

Page 7: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Grafo pesato

Un grafo è orientato (directed graph o digraph) quando tutti i suoi archi lo sono.

Page 8: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Un albero è un grafo connesso senza cicli

Un albero è un grafo tale che |n-m|=1

La struttura ad albero di un grafo permette di raggiungere tutti i nodi con il minimo numero di archi Albero di Ricoprimento Minimo =minimum spanning tree (mst)

Un insieme di alberi disgiunti è una foresta

Page 9: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Prim’s algorithmKruskal’s algorithm Boruvka’s algorithm

Algoritmi per calcolare il mst

Page 10: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Un grafo si dice completo se da ogni nodo si raggiunge qualsiasi altro percorrendo un solo spigolo

Il numero di spigoli in un grafo completo è: m=n(n-1)/2Il grado di ogni vertice è n-1

Page 11: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Un grafo si dice regolare se tutti i nodi hanno lo stesso grado

Page 12: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Come si rappresenta matematicamente un grafo

Page 13: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Matrice di adiacenza

Matrice binaria. E’ simmetrica se il grafo non è orientato e viceversa

7 ;11

nAAkn

jji

jiji

Page 14: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

111

100

010

001

Inc

0111

1000

v1 v2 v3 v4

E1 E2 E3

Matrice IncidenzaMatrice adiacenza

1 4 12 4 13 4 14 1 14 2 14 3 1

Lista adiacenza

Page 15: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Se il grafo è pesato allora è descritto da una matrice W del tipo:

Page 16: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Matrice laplaciana: L=Deg-A:

Esempio

Alcune proprietà:Siano g autovalori di L L è sempre semidefinita positiva

Il numero degli autovalori nulli è quello delle componenti connesse

Page 17: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

La distanza d(i,j) tra due nodi (non necessariamente distinti) i e j è la lunghezza del cammino minimo che li congiunge.

La lunghezza di un cammino è il numero di spigoli (link) in esso contenuti (per i relativi pesi)

Il diametro di un grafo è la massima delle distanze minime tra le coppie dei suoi verticiIl diametro di un grafo completo è 1, indipendente da n

La lunghezza caratteristica [characteristic path length ], è la media delle distanze minime

Distanza e diametro

n(n-1)/2 =n° totale di link se la rete è non diretta

Page 18: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

2*8=16

Page 19: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Eigenvector centrality: Authorities and Hubs

Nelle reti orientate i gradi in entrata (xi) ed in uscita (yi) dei nodi hanno un significato diverso. Si deve risolvere un problema agli autovalori (anzi 2) Av=lv

WWWLe authority (grande xi) contengono grandi informazioni su un dato tema.

Gli hub (grande yi) dicono dove trovare quelle informazioni

Page 20: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Manuale Pajek

Page 21: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Eingenvector centrality

Un nodo è importante se ha «amici» importanti

La matrice di adiacenza A è non negativa (ha autovalori ≥0)

Il teorema di Perron-Froboenius afferma che se la rete è connessa allora il massimo autovalore è reale e le componenti dell’autovettore corrispondente sono positive

Le si può normalizzare e trovare un ranking dei nodi . La componente con il valore più grande è quella con gli «amici più importanti».

E’ il metodo usato da Google. Una pagina è importante se puntata da pagine importanti

Page 22: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Degree centrality e Degree centralization

Le persone sono centrali se l’informazione può facilmente raggiungerle La degree centrality è Il più semplice indicatore di centralità di un nodo ovvero è il numero dei sui vicini (il suo grado) La degree centralization di una rete è la misura di quanto la sua struttura sia lontana da quella di una rete a stella.

Esempio

v3v1

112

)44(1)14(4)(

ACD

0)( CCD17.0

)22()12()22()22()12()(

BCD

1)-2)(n-(n

))deg(v-*deg(v)(

|V|

1iGCD

In una rete con linee multiple o loops (non semplice) il grado di un vertice è diverso dal numero di vicini (e la centralization può essere >1). In questo caso non è opportuno usare la misura di degree centralization

Page 23: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Closeness Centrality and Closeness Centralization

In una rete di comunicazione l’informazione raggiunge una persona più facilmente ed in modo più corretto se il percorso che deve fare è breve.

La Closeness Centrality di un vertice è l’inverso della somma delle distanze del vertice dagli altri divisa per il numero di vertici :

(Sum distanze dai vertici/ n°dei vertici) -1 = ( n°di vertici/sum distanze dai vertici)

La Closeness Centralization è la variazione della closeness centrality dei vertici divisa per la variazione della closeness centrality in una rete a stella delle stesse dimensioni

N.B. Per calcolare le distanze i nodi devono essere connessi. La closeness centralization è una misura definita solo su una componente connessa.

Page 24: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

L’efficienza del grafo G è definita così:

Questa quantità è basata sull’assunzione che l’efficienza nella comunicazione tra due nodi i e j è uguale a

Centrality: efficiency (di un grafo)

Page 25: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Il grado può non riuscire a cogliere l’importanza di un nodo

La betweenness (‘’essere tra’’) di un nodo i è il numero di cammini minimi (geodesic paths) tra altri vertici che lo attraversano diviso per il numero totale di cammini minimi .

Page 26: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Betweenneess Centrality and Betweenness Centralization

Una misura di centralità è quella dell’ «essere intermediario» ad esempio in una rete di comunicazione cioè il flusso di informazioni che una persona può controllare perché la attraversa.

La Betweenness centrality di un vertice è il numero di cammini minimi (geodesiche) che attraversano un nodo diviso per il numero totale di cammini minimi

La Betweenness centralization è la variazione della Betweenness Centrality dei vertici divisa per la variazione della betweenness centrality in una rete a stella delle stesse dimensioni.

Page 27: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

La betweennees può essere una misura della vulnerabilità del grafo ad attacchi selettivi ai suoi nodi

Page 28: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

degree

Alaska

Page 29: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Page 30: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Page 31: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

In Pajek)1))(deg(deg(

)((2)(1 1

vGEvCC

21=7*6/2

Il coefficiente di clustering Ci del nodo i è il numero di spigoli esistenti tra i suoi nodi vicini diviso per tutti i nodi possibili tra i vicini stessi

Clustering coefficient

Page 32: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Clustering coefficient

Deg(v)=degree of v

|E(G1(v)|=n°di connessioni tra i vicini di v

)1))(deg(deg(

))((2)( 1

vGEvCC

)(deg

)deg()( 11

' vCCMax

vvCC 1)(0 1

' vCC

Page 33: 2. Grafi. Indice Tipi di grafi Rappresentazione di grafi Misure su grafi distanza minima centralità dei nodi betweenness, clustering closeness, Distribuzione.

Il Clustering Coefficient del grafo è la media dei clustering dei nodi:

Esistono altre definizioni di clustering Coefficient che danno valori simili (ma non identici)

Gli alberi hanno coefficiente di Clustering =0

Il Clustering misura la connessione dell’intorno di una rete e fornisce un’altra misura della robustezza del grafo. Se un grafo ha un valore di Clustering alto anche se eliminiamo un nodo il grafo rimane connesso