目前已得到研究的典型无向网络包括:Internet网络,电影演员合作网络,科学家合作网络,人类性关系网络,蛋白质互作用网络, 语言学网络,蛋白质折叠关系网络。
无向网络的基本几何量[1,2]有:度及其分布特征,度的相关性,集聚程度及其分布特征,最短距离及其分布特征,介数(Betweenness) 及其分布特征,连通集团的规模分布。
一个顶点的度是指与此顶点连接的边的数量,即
dv = ![]() ![]() |
(1) |
![]() ![]() ![]() |
(2) |
v
V我们都可以得到其度dv。度值的分布特征是网络的重要几何性质。规则网络各顶点度值相同,因而符合
分布,
随机网络符合泊松分布(见3.1节),大量实际网络存在幂律形式的度分布[1,2],称为无标度
网络(Scale Free Networks),包括Internet网络[44,45],电影与电视剧演员合作网络[18,32,46],科学家合作网络[66,67],
人类性关系网络[47],蛋白质互作用网络[48],语言学网络[49]等,同时还存在高斯
型,如蛋白质折叠网络[46],和指数衰减型的概率分布,如电视剧演员合作网络[46]。
进一步的问题是,是否度分布可以完备地描述网络的特征呢?如果度分布与网络一一对应,我们就说度分布可以完整地描述网络,网络也只需 要用度分布来描述。试想对于一给定的度分布,通过抽样,我们可以给对应网络的每一个顶点一个度值,保持度值的任意一种连接方式都构 成一种网络。如果任意一种连接对应的其他几何量都一样,则我们认为实际上为同一网络。但是显然不能保证其他几何量也都一样。那么, 保持度值不变的随机连接,即度与度之间没有相关性,是否可以成为大多数网络的代表呢?所以度分布之间的相关性是另一个重要的几何量。 Newman把它称为“匹配模式”[16],意思是考察度值大的点倾向于和度值大的点连接,还是倾向于和度值小的点连接。具体的方法是,通过任意一条 边都可以找到两个顶点,进而得到两个度值,这样通过所有的边我们就得到了两个序列,分析这两个序列的相关性即可。研究表明实际 网络存在一定程度上的匹配模式,有的网络正向匹配,也有的网络反向匹配。但是,由于是无向网络,把哪一个顶点的度放入序列a,把 哪一个顶点的度放入序列b是任意的,这一点对于相关性分析的影响并没有得到研究。实际网络的分析表明,不同的网络存在不同的匹配 模式,有正相关也有负相关。
集聚程度的意义是网络集团化的程度,即考察连接在一起的集团各自的近邻之中有多少是共同的近邻。一种定义是对于每一个顶点v,找
到其近邻集合Nv,记
n = Nv
,Nv中存在的边的数量为
M = ![]() ![]() ![]() |
(3) |
Cv = ![]() |
(4) |
两点的最短路径lij定义为所有连通
i, j
的通路中,所经过的其他顶点最少的一条或几条路径。记
i, j
之间最短路径的集合为Sij,相应的路径长度为
dij =
lij
。如果
i, j
之间不存在通路,那么记dij = N。于是我们可以得到
一个N x N的矩阵
dij
。其分布特征是一个重要的全局几何量,其平均值称为平均最短路径d。
另一个重要的全局几何量是介数(Betweenness)[17]。顶点u的介数含义为网络中所有的最短路径之中,经过u的数量。
它反映了顶点u的影响力。记
i, j
之间最短路径的集合为Sij,顶点u的介数定义为
Bu = ![]() ![]() |
(5) |
连通集团是指G的一个子图,在这个子图内,任意两点之间都存在通路。一个网络可能存在多个相互独立的连通集团。在渗流模型中, 当系统处于临界状态时,连通集团的规模呈现出幂率分布。实证研究表明,对于大量的Scale-free 网络,连通集团的规模也存在幂率分布[1]。
关于无向网络的度分布还存在另外一种形式。计算近邻顶点的数目得到度值,然后把所有顶点的度值归一化后再把近邻顶点的度值相加得 到顶点的二次度值,重复 这一过程,直到得到稳定的度值[6]。这样得到的每一个顶点的度值实际上是邻接矩阵的最大本征值对应的本征向量,上述过程实际上就是矩 阵本征值的最速下降法。但是这样的度分布具有的几何意义目前没有得到研究。