Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2...

28
Introducción al análisis de redes parte 2 Propiedades globales de redes Modelos de redes Clustering en redes

Transcript of Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2...

Page 1: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Introducción al análisis de redesparte 2

Propiedades globales de redes

Modelos de redes

Clustering en redes

Page 2: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Características topológicas de redes

Diámetro

El diámetro dm de un grafo es la máxima distancia entre

cualquier par de nodos:

dm = max(d

uv)

Distancia media

La distancia media o longitud característica de un grafo es la

distancia promedio entre todos los pares de nodos:

d = <duv

>

Cuando hay distancias infinitas, se calcula la eficiencia,

utilizando las inversas de las distancias:

1/duv

→ 0 para duv

→ ∞ y, deff

= <1/duv

>

Page 3: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Características topológicas de redes

Distribución del grado

Los gráficos y análisis de las curvas de distribución de

grado son una herramienta habitual para analizar la

topología de redes.

Se puede graficar el histograma de la frecuencia, o

probabilidad, de que un nodo tenga grado k:

p(k) : probabilidad de que el grado de un nodo sea k

Page 4: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Características topológicas de redes

Distribución del grado

Page 5: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Características topológicas de redes

Por cuestiones computacionales un gráfico usual que reemplaza al anterior es el de grados de los nodos vs. los nodos ordenados (rankeados) por rango:

Page 6: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

En redes muy inhomogéneas* el calculo de la

distribución de p(k) via histogramas es

imprecisa y se dificulta la interpretación

En estos casos funciona mejor la distribución

acumulada del grado, es decir, la probabilidad

de que un nodo tenga un grado mayor que k.

Características topológicas de redes

*: una red es inhomogenea cuando los nodos tienden a agruparse de acuerdo a su grado.

Page 7: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Características topológicas de redes

Page 8: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Mezclado selectivo (assortive mixing)

red no selectiva (disassortive)

Los vértices con alto grado se conectan

preferencialmente con nodos de bajo grado.

red selectiva (assortative)

Los nodos de alto grado se asocian con otros

nodos de alto grado, y los de bajo grado se asocian

entre si.

Las redes sociales tienden a ser selectivas; y las redes biológicas y físicas no selectivas

Page 9: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Mezclado selectivo (assortive mixing)

Correlación de grados

La correlación de grados se puede obtener a partir de la

distribución conjunta p(ki, k

j) de que los nodos i,j tengan

grados ki y k

j.

Para grados no correlacionados la probabilidad conjunta

está dada por el producto de las distribuciones

marginales p(ki, k

j) = p(k

i).p(k

j)

La estimación directa de p(ki, k

j) es computacionalmente

demandante. Es más directo usar el coeficiente de

correlación de Pearson entre el grado de nodos

adyacentes.

Page 10: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Mezclado selectivo (assortive mixing)

Correlación de grados

El coeficiente de correlación o “selectividad” varía entre

-1 y +1:

r < 0 → red no selectiva

r > 0 → red selectiva

Este coeficiente falla para redes muy inhomogéneas,

por ejemplo, redes selectivas para nodos de grado bajo

y no selectivas para nodos de grado alto.

Page 11: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

R= - 0.137

Asociación entre grados de vecinos en una red no selectiva

Page 12: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Mezclado selectivo (assortive mixing)

Correlación de grados

Otra medida para evaluar la correlación de grados es el

grado medio de los vecinos (gmv). Para cada nodo i:

Después se puede graficar, por ejemplo, gmv vs. k, o

<gmv> vs. k

Para grafos dirigidos se calcula también la correlación

entre ki

in y los kj

out de los vecinos; o la correlación ki

out

con los kj

in de los vecinos.

gmv=1

∣N i∣ ∑j∈N i

k jN(i): vecinos de I

kj: grado de j

Page 13: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Asociación entre grados y grado medio de los vecinos

Page 14: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Asociación entre grados y grado medio de los vecinos

Page 15: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Mezclado selectivo (assortive mixing)

Indice de coincidencia

i,j: nodos

n(i), n(j): vecinos de los nodos i,j

A: matriz de adyacencia

M ij=∑ vecinos comunes

∑ total de vecinos=

∑k ,l

N

Aik . A jl

ni+ n j−∑k ,l

N

Aik . A jl

Page 16: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Coeficiente de clustering

Coeficiente de clustering

Estima la cohesividad local, midiendo la probabilidad de que

dos nodos que tienen un vecino común, también estén

conectados entre ellos.

Se calcula como el cociente entre el número de aristas

observadas para i y el máximo número posible de aristas:

C = 0.0 C = 0.7

Ci= E

i /E

max

Emax

= ki(k

i-1)/2

Ci = 2E

i / k

i(k

i - 1)

Page 17: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Coeficiente de clustering

Coeficiente de clustering medio o global

C = <Ci>

Muchas redes muestras un coeficiente de clustering

alto, indicando cohesividad local y una tendencia de los

nodos a formar grupos

Page 18: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Mundos pequeños

En muchas redes reales a pesar del gran número

de nodos, las distancias medias son cortas:

d ~ logNv para N

v → ∞

La mayoría de los nodos tienen pocas aristas y un

número pequeño de ellos está altamente

conectado.

También se las conoce como redes libres de escala

Page 19: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Mundos pequeños

Características:

1. La distribución de grados p(k) sigue la ley de

potencia:

p(k) ~ k-γ γ: exponente del grado

2. Los coeficientes de clustering son mayores que los

de grafos al azar con el mismo número de nodos y

vértices (y no debería haber grandes diferencias en el

promedio de las caminos más cortos).

Page 20: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Mezclado selectivo (assortive mixing)

Clustering en triadas

Una triada es un triplete de nodos

Ctriadas

= 3 x nro. triadas / nro. tripletes conectados

3 A, B, C

12 A->B, C

102 A<->B, C

021D A<-B->C

021U A->B<-C

021C A->B->C

111D A<->B<-C

111U A<->B->C

030T A->B<-C, A->C

030C A<-B<-C, A->C

201 A<->B<->C

120D A<-B->C, A<->C

120U A->B<-C, A<->C

120C A->B->C, A<->C

210 A->B<->C, A<->C

300 A<->B<->C, A<->C

Page 21: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Triadas

Page 22: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Prototipos de modelos de redes

Son modelos nulos de redes. Sirven para testear hipótesis.

Ejemplos:

Erdös-Rényi

Es el modelo básico de redes aleatorias, Son Nv nodos

conectados por Ne aristas elegidas aleatoriamente del conjunto

de Nv x (N

v-1) / 2 posibles aristas.

Reproduce propiedades de mundo pequeño, pero no clustering

local.

Page 23: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Prototipos de modelos de redes

Watts-Strogatz

Es una red que comienza como un “lattice” en el que se

intercambian nodos al azar.

Se obtienen redes con elevado clustering local y caminos cortos

en promedio, pero no reproduce otras características de redes

reales.

Ninguno de los modelos anteriores reproduce la inhomogeneidad en la distribución del grado

Page 24: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Prototipos de modelos de redes

Barabási-Albert

Este modelo genera redes con distribuciones de grados que se

corresponden con los de grafos libres de escala.

Se construye agregando aristas de a pasos, y los nodos con

mayor grado tienen mayor probabilidad de recibir una nueva

arista

Page 25: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Testeo estadístico de redes

Comparación contra modelos nulos

Un índice de interés Q de una red se compara contra un conjunto

de redes sustitutas, que son redes generadas aleatoriamente a

partir del modelo nulo, y se evalua de acuerdo a un score:

S=Qred−⟨Qsustitutas⟩

sustitutas

Page 26: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Propiedades adicionales de redes complejas

Robustez: persistencia de propiedades topológicas, como la

distancia media, ante la remoción de nodos o aristas.

Las redes libres de escala son robustas frente a ataques

aleatorios y sensibles a ataques selectivos.

Modularidad: Los módulos son subconjuntos de nodos

conectados densamente entre sí, pero de manera rala con

otros subconjuntos.

A partir de estructuras más simples es posible construir una

red más compleja.

La detección se estas sub-estructuras puede realizarse con

métodos de clustering apropiados

Page 27: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Propiedades adicionales de redes complejas

Modularidad:

m: número de vérticesAij: matriz de adyacenciak: gradosδ(c

i,c

j) =1 si los nodos i,j pertenecen a la misma comunidad,

si no, es cero

Page 28: Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2 Propiedades globales de redes Modelos de redes Clustering en redes. Características topológicas

Propiedades adicionales de redes complejas

Subgrafos y motivos en redes:

Propiedades locales asociadas a nodos

motivos redes