微观视角下的社会网络站点 中的交友模式
description
Transcript of 微观视角下的社会网络站点 中的交友模式
微观视角下的社会网络站点中的交友模式
第六届全国复杂网络学术会议
2010. 10
胡 海 波华东理工大学
在线社会网络
WWW 上人与人之间通过在线社会软件建立起来的人际关系网络。这些在线社会软件多运行在 Web 2.0 互联网模式下。 朋友关系 同学关系 亲属关系 商业合作关系
The emergence of ‘cyberspace’ and the World Wide Web is like the discovery of a new
continent.– Jim Gray,
1998 Turing Award address
Lazer D, et al. Computational social science. Science, 2009, 323: 721-723.Kleinberg J. The convergence of social and technological networks. Commun. ACM, 2008, 51(11): 66-72.
在线社会网络
在线个人社区 Yahoo! 360°
LiveJournal
在线交友网 Facebook (N>2 亿) 人人网(原校内网 N>1 亿) Myspace (N>2 亿) Mixi Cyworld orkut Pussokram
在线社会媒体 Digg Flickr 豆瓣 Youtube 土豆网 CiteULike, del.icio.us, BibSonomy
BBS 饮水思源 BBS 水木清华 BBS
P2P Gnutella
实时通信系统 MSN (N>2.4 亿) QQ ICQ
若邻网络www.wealink.com一个大型的在线社会网络,注册用户多为职业人士。
在若邻网中,一位用户若邀请另外一位用户作为他的好友,那么只有当被邀请的用户接受邀请之后,二人之间的好友关系才能确立,从而在两位用户之间产生一条新的连边。每位用户的度值,即好友数,将显示在其个人简介的页面上,并可被所有的网络用户浏览。用户的互惠性是指某用户向另一用户发出邀请从而导致该邀请被接受。
NetworkevolutionNetworkevolution
<From, To, When><U1, U2, T1> Invite<U1, U3, T2> Invite<U3, U1, T3> Accept<U4, U2, T4> Invite<U2, U4, T5> Accept<U2, U1, T6> Accept …… T3
U1 U3
U1 U3
U4
U2
U1 U3
U4
U2
T5 T6
互惠性及互惠时间分布
Data format (triples)
用户往往快速地响应并接受邀请,近似地,时间间隔分布以指数衰减。事实上, 67.04% 的请求在一天( 24 小时)内接受,84.25% 的连接请求在一个月( 30 天)内接受。
i
( a)发出与接受邀请之间的时间间隔分布,( b)发出邀请之后在第 i天被接受的比
例
接受邀请的速度是否与邀请者或接受者的度值有关?
100
101
102
103
10−6
10−4
10−2
100
102
k
<t>
(da
y)
InviterAccepter
平均互惠时间 <t> 与邀请者 /接受者的度值的关系
互惠时间与邀请者 /接受者的度值的 Pearson相关系数为 -0.02/-0.05,几乎是不相关的。另外,我们发现,对于某些大度值的邀请者 /接受者,他们的平均互惠时间 <t> 很短,从而导致了上述的弱的负相关性,这些用户构成了该网络中最活跃的用户。
用户行为的时间特性
用户发出邀请之间、接受邀请之间或任意两个事件之间的时间间隔分布 10
−610
−410
−210
010
210−6
10−5
10−4
10−3
10−2
10−1
t (day)
P(t
)AllSendingAccepting
Slope»−1.891day
2days
3days4days
三个分布都满足指数约为 1.89 的幂律分布。分布的尾部在时间间隔为整数天的位置上出现尖峰,表明了人的生活习惯中所出现的每天的周期性。
用户的优先选择特性<From, To, When><U1, U2, T1> Invite<U1, U3, T2> Invite<U4, U2, T4> Invite ……
Launching sequence: U1, U1, U4, ...Reception sequence: U2, U3, U2, …
<From, To, When><U1, U2, T1> Invite<U1, U3, T2> Invite<U3, U1, T3> Accept<U4, U2, T4> Invite<U2, U4, T5> Accept<U2, U1, T6> Accept ……
Jure Leskovec, Lars Backstrom, Ravi Kumar, Andrew Tomkins. ACM KDD’08, pp. 462-470
( ) ii
jj
kk
k
( 1)( ) ~
: ( 1)t vt
ut
e v k t kk k
u k t k
1
0( ) ( )d ~
kk k k k
正反馈效应:发出好友邀请的次数越多,再次发出邀请的可能性也就越大;接受邀请的次数越多,再次接受的可能性也越大。
测试方法
测试 Wealink 中用户的优先选择特性
线性优先1 »
100
101
102
103
104
10−6
10−4
10−2
100
102
k
Reception
~k2
Launchin
log( ) log( )a b k 回归模型
用户的优先连接特性
优先接受:老用户的度值越大,就越可能接受来自其他老用户的邀请并与之建立连接 (U2) ; 优先创建:老用户的度值越大,他 / 她的邀请就越可能被其他的老用户接受 (U1) ; 优先依附:新用户倾向于跟度值大的老用户建立连接 (U4) 。
<From, To, When><U1, U2, T1> Invite<U1, U3, T2> Invite<U3, U1, T3> Accept<U4, U2, T4> Invite<U2, U4, T5> Accept<U2, U1, T6> Accept<U5, U4, T7> Invite<U4, U5, T8> Accept ……
NetworkevolutionNetworkevolution
T3
U1 U3
U1 U3
U4
U2
U1 U3
U4
U2
T5 T6 T8
U1
U4
U3
U2
U5
测试不同类型连接的优先性
线性优先性
100
101
102
103
10-8
10-6
10-4
10-2
100
102
k
preferential creationpreferential acceptance~k2
preferential attachment
现实中的社会网络具有明显的亚线性优先性 β<1 。现实社会网络中,每个人的人脉关系基本上是不透明的,而在线社区则不同,每位用户有多少好友甚至这些好友是谁都标识的一清二楚,这使得网络明星在在线社区中的吸引力,相对于现实中的人际关系,更为显著。
1 »
谢谢!欢迎批评指正