ネットワークの構造 - 明治大学mizutani/ict/network_struct.pdfdle the boundaries of di...

8
ネットワークの構造 ネットワーク形成の理論にむけて 通信するコンピュータ同士はどのような ネットワークを形成しているのか? その測定・観察はたいへん難しかった リンクし合っているWebページはどんな ネットワークを形成しているのか? ネットワークの実際を知ることは極めて困難 友人関係や異性関係を教えててもらえますか 6次の隔たり:Stanley Milgramの1967年のネブラスカ州からボストンへの 見知らぬ人への手紙の実験 伝染病の感染拡大と疫学的対策 epidemic (outbreak):伝染病が予想を超えて急激に広がる状態 endemic:地域内で流行し、他の地域に広がってはいかない通常の流行 pandemic:多国間にまたがって広範囲に感染した爆発状態 masahiro Mizutani v 頂点 にリンクしている辺の数 ネットワーク頂点の次数 1 2 3 4 5 次数 3 次数 4 次数 1 次数 2 次数 2 =3本の辺 =4本の辺

Transcript of ネットワークの構造 - 明治大学mizutani/ict/network_struct.pdfdle the boundaries of di...

Page 1: ネットワークの構造 - 明治大学mizutani/ict/network_struct.pdfdle the boundaries of di erent tightly-linked regions or sit squarely in the middle of one. Developing a language

ネットワークの構造ネットワーク形成の理論にむけて

通信するコンピュータ同士はどのようなネットワークを形成しているのか?

その測定・観察はたいへん難しかった

リンクし合っているWebページはどんなネットワークを形成しているのか?

ネットワークの実際を知ることは極めて困難

例友人関係や異性関係を教えててもらえますか

6次の隔たり:Stanley Milgramの1967年のネブラスカ州からボストンへの見知らぬ人への手紙の実験

伝染病の感染拡大と疫学的対策epidemic (outbreak):伝染病が予想を超えて急激に広がる状態endemic:地域内で流行し、他の地域に広がってはいかない通常の流行

pandemic:多国間にまたがって広範囲に感染した爆発状態

masahiro Mizutani

v頂点 にリンクしている辺の数

ネットワーク頂点の次数1

2

3

4

5

次数 3

次数 4

次数 1

次数 2次数 2

=3本の辺

=4本の辺

Page 2: ネットワークの構造 - 明治大学mizutani/ict/network_struct.pdfdle the boundaries of di erent tightly-linked regions or sit squarely in the middle of one. Developing a language

?次数 1 2 3 4 5 6 ∞

頻度

P (k)

k k

次数分布の様子

ネットワークの次数分布1. 全頂点      の次数      を調べ上げる

v1, v2, . . . , vN

d1, d2, . . . , dN

2. 次数 を持つ頂点の数 

を数えるk nk

(k = 1, 2 . . . )3. 次数 を持つ頂点がネットワーク内に登場する頻度  

k

P (k) =nk

N

4. 得られる頻度分布が次数分布 masahiro MizutaniA-L. Barabási, Nature 401(1999)

100

10–2

10–4

10–6

10–8

100 101 102 103 104 100 101 102 103 104

Pout(k)

Pin(k)

a b出て行くリンク 入ってくるリンク

Pout(k) � k�2.45 Pin(k) � k�2.1

Webページの次数分布

べき分布

Masahiro Mizutani

ベキ分布頂点の次数が である確率k P (k)

P (k) = ck��

� : ベキ指数c : 規格化定数

c = 1/��

k=1

1k�

= 1/⇥(�)

��

k=1

P (k) = 1条件         から定まる

⇥(�) : Riemannのゼータ関数 Masahiro Mizutani

ベキ分布のグラフP (k) = ck�� log P (k) = �� log k + log c

5 10 15 20

0.05

0.1

0.15

0.2

0.25

0.3

0.35γ=3P(k)

k1 1.5 2 3 5 7 10 15 20

0.0001

0.001

0.01

0.1

1log P(k)

log k

γ=3

両対数グラフで直線になる

Page 3: ネットワークの構造 - 明治大学mizutani/ict/network_struct.pdfdle the boundaries of di erent tightly-linked regions or sit squarely in the middle of one. Developing a language

Masahiro Mizutani

ベキ分布

P (k) = ck��

k = 1, 2, 3, . . .

離散分布

P (x) = cx�� , (x � x0)連続分布(パレート分布)

Masahiro Mizutani

ベキ法則

y � x�2つの量 と との関係がy x

� :ベキ指数

例:万有引力の法則2物体の間に働く力 は、2物体間の距離  の2乗に反比例する。

f r

f � 1r2

Masahiro Mizutani

• 特徴的尺度(scale)を持たない(free)

• 同じベキ指数のベキ分布はスケール変換に対して不変

• 平均から離れた値を持つ確率が消えない• 大きな次数を持つ頂点が少なからず存在

ベキ分布の特徴

ハブ(hub)

Masahiro Mizutani

ベキ法則のスケール変換不変性スケール変換

log s = � log tただし

y = cx��

1 1.5 2 3 5 7 10 15 200.0001

0.001

0.01

0.1

1log y

log x z = cw��

1 1.5 2 3 5 7 10 15 200.0001

0.001

0.01

0.1

1log z

log w

ベキ法則はスケール変換しても同じ法則として保たれる( スケール変換から自由)スケール・フリー

y � z = sy

x � w = tx

Page 4: ネットワークの構造 - 明治大学mizutani/ict/network_struct.pdfdle the boundaries of di erent tightly-linked regions or sit squarely in the middle of one. Developing a language

Masahiro Mizutani

??ノミ(蚤)を観る

対象に特徴的尺度があるノミと分かるには

尺度(倍率)を上げていくと、ノミだと分からなくなるMasahiro Mizutani

自己相似性どんな部分も、適当に拡大すると、元の図形とほぼ同じ形(自分に相似的)

フラクタル(Fractal)

Masahiro Mizutani

Koch曲線フラクタル図形の例

Masahiro Mizutani

Koch曲線は部分を拡大すると全体と相似

何倍に拡大してるか区別できない

特徴的尺度がない(Scale-free)

Page 5: ネットワークの構造 - 明治大学mizutani/ict/network_struct.pdfdle the boundaries of di erent tightly-linked regions or sit squarely in the middle of one. Developing a language

Masahiro Mizutani

フラクタル次元

ある図形の全体が、  に縮小したミニチュア  個によって構成されているとき

1/aad

その図形の次元= d

次元概念の一般化

Masahiro Mizutani

全体を1/3倍したパーツを4つ貼り合わせて全体になる3d = 4

d =log 4log 3

= 1.2619..

Koch曲線の次元

Masahiro Mizutani

平均から離れた値の確率

大きなkの領域

γ

�k⇥平均値

平均から離れたkの値を取る確率は無視できない程度に大きい

テキスト

Masahiro Mizutani

2 4 6 8 10 12

0.2

0.4

0.6

0.8

2 4 6 8 10 12

0.002

0.004

0.006

0.008

0.01

y =1x3

y =1x3

y =13x

y =13x

ベキ関数    と指数関数

の減少比較y = a�x

y = x��

指数関数の急激な減少に比べてベキ関数の減少は穏やか

希有現象(大きなk)の存在

Page 6: ネットワークの構造 - 明治大学mizutani/ict/network_struct.pdfdle the boundaries of di erent tightly-linked regions or sit squarely in the middle of one. Developing a language

Masahiro Mizutani

• 頂点次数の頻度がベキ分布を持つネットワーク• Small World性とは別概念

• 大抵のScale-FreeネットワークはSmall World性を併せ持つ

• Small World性は満たすが、非Scale-Freeなネットワークもある

Scale-Freeネットワーク

masahiro Mizutani

ハブ(hub)

スケールフリーネットワークの特徴ハブの存在

ネットワークにおいて、非常に多くの辺が集まっている頂点

1.1. ASPECTS OF NETWORKS 3

Figure 1.2: Social networks based on communication and interaction can also beconstructed from the traces left by on-line data. In this case, the pattern of e-mail communication among 436 employees of Hewlett Packard Research Lab is su-perimposed on the o�cial organizational hierarchy [6]. (Image from http://www-personal.umich.edu/ ladamic/img/hplabsemailhierarchy.jpg)

by links.

Later in this chapter we’ll discuss some of the things one can learn from a network such as

the one in Figure 1.1, as well as from larger examples such as the ones shown in Figures 1.2–

1.4. These larger examples depict, respectively, e-mail exchanges among employees of a

company; loans among financial institutions; and links among blogs on the Web. In each

case, links indicate the pairs who are connected (specifically, people connected by e-mail

exchange, financial institutions by a borrower-lender relationship, and blogs through a link

on the Web from one to the other).

Simply from their visual appearance, we can already see some of the complexity that net-

work structures contain. It is generally di�cult to summarize the whole network succinctly;

there are parts that are more or less densely interconnected, sometimes with central “cores”

containing most of the links, and sometimes with natural splits into multiple tightly-linked

regions. Participants in the network can be more central or more peripheral; they can strad-

dle the boundaries of di↵erent tightly-linked regions or sit squarely in the middle of one.

Developing a language for talking about the typical structural features of networks will be

an important first step in understanding them.

Social networks based on communication and interaction can also be constructed from the traces left by on-line data. In this case, the pattern of e-mail communication among 436 employees of Hewlett Packard Research Lab is superimposed on the official organizational hierarchy.

http://www.cs.cornell.edu/home/kleinber/networks-book/Masahiro Mizutani

• Webページ

• 多くのリンクが集まる有名サイト• インターネットコンピュータ接続• 巨大プロバイダがバックボーンを提供

• 俳優の共演関係• 有名人は知り合いが多い

• 巨大空港• ハブ空港を経て、地方空港にたどり着く

ハブ存在の実証例

Page 7: ネットワークの構造 - 明治大学mizutani/ict/network_struct.pdfdle the boundaries of di erent tightly-linked regions or sit squarely in the middle of one. Developing a language

Masahiro Mizutani

ベキ分布の検討

「不公平な」分布である

以下、計算しやすさのために、連続なベキ分布である

パレート分布 P (x) = cx�� , (x � x0)で検討してみる

Masahiro Mizutani

0 5 10 15 20 25 300

0.05

0.1

0.15

0.2

0.25

12.5 15 17.5 20 22.5 25 27.5 30

0.00025

0.0005

0.00075

0.001

0.00125

0.0015

0.00175

0.002

cx��Parato分布(ベキ分布)指数分布

大きい値を取る確率の比較

大きな値を取る確率は無視できない程度に残る

大きな値を取る確率は無視できる程度に微少

指数分布Parate分布

e��x

Masahiro Mizutani

パレート分布 P (x) = cx�� , (x � x0)� = 3, x0 = 1の場合

x��

5 10 15 20 25 30

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

�x⇥�

2x0

⇥x⇤� =� � 1� � 2

x0平均値 = 2

P (⇤x⌅� ⇥ X ⇥ x0) = 1��

� � 2� � 1

⇥��1

下位から平均値までを取る確率= 0.75

ベキ分布則の特異性全体の上位2割を定めるx��

なるP (X � x��) = 0.2 x�� =�

15

⇥ 11��

x0 =�

5

=�

2P (X � x12� ) =

12

x12� =

�12

⇥ 11��

x0なる全体の半分を定めるx

12�

x12�

Masahiro Mizutaniパレート分布

5 10

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

�x⇥�

x12�

x��

x12�

x��

�x⇥�

全体を二分する位置

平均値

全体の上位2割の位置

431

平均値よりかなり小さい

平均値より少し大きいだけ

大きな値をとる確率が無視できないために右側にずれている

~高額所得者の所得分布

Page 8: ネットワークの構造 - 明治大学mizutani/ict/network_struct.pdfdle the boundaries of di erent tightly-linked regions or sit squarely in the middle of one. Developing a language

Masahiro Mizutani

• 経済学者のV. Paretoが見出した経験法則

• 「富の分布はベキ法則に従う」• 「80対20の法則」・富の8割は2割の人が所有している・商品売上げの8割は2割の商品が生み出す

・故障の8割は2割の部品に原因がある

パレートの法則(1848-1923)

厳密な「科学法則」ではない

・売上げの8割は2割の顧客が生み出す売上げ向上には、この2割の顧客を狙え

masahiro Mizutani

商品売上げの8割は2割の商品で達成される(パレートの法則)。在庫制限のために、主にこの2割の商品を揃えねばならず、他の8割は「死に筋」として軽視されていた。

ネット販売では在庫制限はなく、この8割をビジネスに組み込むことによって無視できない売り上げとなっている。

ロングテール商品売上げ高

商品アイテム 死に筋

ロングテール(長い尾)ヘッド

売れ筋売り上げの8割

売り上げの2割

masahiro Mizutani

Apple iTune Music Storeには2600万曲の楽曲ダウンロード総数2500億

全曲が売り上げに貢献している

2013年2月6日発表

masahiro Mizutani

ネットワークに何故ハブが

生じてしまうのか(なぜ次数分布がベキ分布になるのか)