疫情下的小世界网络

S_World_Network_U_Epidemic

Posted by 邬小达 on July 4, 2020

今年,我们都被突如其来的疫情打乱了原有的生活节奏。过年前后,国内可以说是集全国之力控制住了疫情。企业慢慢地复工,我们也回到了自己的工作岗位上。

于此同时,疫情在国外的蔓延,演变成了全球大流行。直到2020年7月1日,疫情还是没有结束。很多国家和地区的累计确诊人数仍在不断地增长。

全球的累计确诊人数约1100万,现有确诊约442万。

全球的累计确诊人数呈现了指数增长,没有下降的趋势。而每日新增人数还在慢慢地上升。——截至2020年7月1日

随着国内疫情被控制住,大多数人都恢复了原来的生活节奏。我们或多或少产生了这种感觉:疫情离我们遥远了。而6月中旬,北京爆发的小范围疫情,又将我们的视线拉了回来。

为什么疫情如此难控制?从流行病学来看,影响病毒传播的主要因素有两个:(1)感染率;(2)易感者和感染者接触的概率。

新冠病毒的传染率R值普遍在1以上,是偏高的。易感者和感染者接触的概率则与全球的社会结构有关。全世界已经变成了一个紧密联系的的网络,使得任何事物的传播效率都变得比以前快很多,比如食品、信息,当然也包括病毒。

六度分隔现象

我们都会过类似的经历,当介绍自己的两个朋友相互认识时,闲聊之后发现他们有一个共同的熟人,比如A的姐姐与B的老师有联系。于是感慨这个世界好小呀。

在20世纪50年代,并不存在“网络”的概念。但当时社会在社会学界流传着未经证实的假说:我们拥有着庞大且相互联系的社会关系,然而在一定意义上是很小的社会关系,即人们只需要通过很少的熟人关系就可以认识任何一个人。

哈佛大学的心理学家米尔格兰姆(Stanley Milgram,就是做电击实验的那位)对这个假说产生了兴趣。在1967年,他做了一个经典的实验来研究这个问题。在这实验中,他设计出了一种创造性的信息传递机制。他在美国的波士顿、奥马哈、内布加斯随机找来了几百个被试,然后让他们把信寄给两个目标人物:一个是马萨诸塞州莎伦的神学学生的妻子,另一个是马萨诸塞州的一个股票经纪人。寄信的方法是被试将信寄给可能认识目标人物的熟人。然后再由熟人转寄给熟人的熟人,直到信通过熟人的关系交到目标人物的手中。研究结果发现,在送达的信件中,平均只需要通过5个熟人就可以做到。这个发现后来被称为“六度分隔”(six degrees of separation)。

关于米尔格兰姆的研究还有后续。后来心理学家格兰菲尔德(Judith Kleinfeld)研究发现,这个实验的研究结果被曲解了。其实,被试中的大部分人并没有把信件寄到,研究结果受到了可得性偏差的影响,只统计了那些少数寄到的数据。此外,在米尔格兰姆的其他研究中,经手的平均熟人个数也要超过5个。当然,这是后话了,先暂且忽略。

此外,我们也可以从数学角度来简单推演一下为什么存在“六度分隔”。假设你有100个朋友,然后朋友也有自己的100个朋友。那么经过2步,你就可以认识1万人;以此类推,经过3、4、5步,你可以认识1百万、1亿、1百亿人。这意味着,只要在6步之类,你就可以与这个地球上的任何一个人产生联系。

小世界网络

首先我们来了解下网络的基本定义。网络可以认为是由边连接起来的节点的集合。在网络中,有两个基本元素,节点和边。节点代表了个体(如神经元、网站、人),边则表示个体的之间的关联(突触、超链接、社会关系)。

接下来,应用数学家和社会学家邓肯·瓦特(Duncan Watts)和应用数学家斯托加茨(Steven Strogatz)出场了。他们提出了小世界网络(1998年,《小世界网络的集体动力学》)来解释六度分隔现象。

瓦特原来是研究蛐蛐是如何通过鸣叫,形成同步现象的。

雄蛐蛐通过发出大声的鸣叫吸引雌性蛐蛐。蛐蛐会仔细倾听周围蛐蛐的声响,调整自己的发声,和邻居的声音吻合起来。把多个蛐蛐放到一起,它们就能渐渐地把杂乱的鸣叫混合成交响曲,让我们在潮湿的夏夜尽情欣赏——《链接》

这类由大量个体相互作用而涌现的集体行为也可以理解为一种简单的网络。后来,他放弃研究蛐蛐转研究网络理论(当然,关于蛐蛐的研究也带给了他关于网络研究的灵感)。他和斯托加茨希望挖掘出现实中社会网络的基本特征,最好可以通过一个简单的模型来解释。

在社会网络中,每个人的行为都不太一样,这就导致个体的行为模式很难进行具体地描述。因此,他们对个体的行为模式做了简化,看成是随机的表现。这些随机的表现反映到网络中,就是边与边之间发生随机连接。在该假设下,他们希望观察所有可能的网络来得出答案。

具体的做法是,他们从边的随机连接概率出发,来研究当它发生变化时,网络的结构会发生什么变化。从网络图的角度分析,就是平均路径长度(路径长度:两个节点之间最短路径的边的数量)和集群系数如何变化。

左图是随机连接概率为0的极端情况。在该网络图中,每个人手拉手连在一起,构成了一个闭环。右图则是另一种极端情况,节点完全随机连接,也就是随机网络。中间的图代表连接概率介于0-1之间的情况。相比左图,B节点连接到了其它节点上。

他们的研究有两个重大的发现。一是仅仅添加几个随机链接,不至于改变集群系数,但却可以导致所有节点的平均路径长度急剧减小。如图中所示,连接概率从0开始增加时,平均路径长度急剧下降。前5个随机重连,就可以使平均路径长度减少一半。

此外,随着节点数量的增加,随机连接会导致平均路径长度减少得更加明显。

邓肯·瓦特和斯托加茨将集群系数很高,同时平均路径长度很小的网络称为小世界网络。

病毒与小世界网络

我们每个人的朋友圈都是相对小的集合,但只要圈子内的少数人交往广泛,有着外部的联系,那么就产生了连接圈外的捷径。因此,这导致全球不再是孤立的,而是形成了小世界网络。

正如瓦特和斯托加茨所发现的,只需要在网络中添加少许的随机连接,就可以使整个网络的平均距离极度减小。换句话说,随机连接作为捷径使得整个网络的不同部分连接起来了。节点只需要通过少数几步,就可以连接到任何一个节点。因此,我们从小世界网络中学到最重要的一点是存在非常短的路径,可以让你与世界上的任何一个人发生联系。

即使如此,对于寻找特定的人仍是一个难题。如果按照随机寻找的方法,假设你有100个朋友,然后朋友也有自己的100个朋友,依次类推。如果你想找2步开外的某个人,就需要1万次的尝试……5步开外,就需要1百亿次的尝试。因此,问题的关键在于如何找到这条路径。

可以这对病毒而言,却不是问题。因为,病毒不需要传播给某一个或一些特定的个体,只要能够创造随机连接就可以了。现今人们可以很容易地相互接触,为病毒创造了非常有利的条件。这意味着,病毒搜寻出来的每条路径,都可以将自己传播出去。

>病毒不遵循广播的传播方式。所以如果易感者和感染者之间有捷径可循,病毒可不会管人类是否意识到它的存在,甚至是否可以找到它,它会竭尽所能,搜寻每条可能路径将自己传播出去。——《六度分隔》

比如,一个感染者登上飞机或者高铁,他就可以传染给另一区域的人(创造随机连接)。大城市的人口大量流动也是如此,乘坐地铁、商场购物、写字楼办公,都在创造网络的随机连接。

因此,我们看到不论是大洋彼岸的美国、还是遥远的热带雨林,都出现了感染者。全世界的确诊人数每天都在增长。

除了研发疫苗之外,现在控制病毒传播的方法,也都是为了切断小世界网络的随机连接。比如,戴口罩,在家办公、不聚集等方法。

参考资料

《六度分隔》

《链接》

《复杂》

Coronavirus: is the R number still useful?