近年来,网络科学迅速成长。通过研究网络的结构和连接模式,研究人员能够洞察网络中不同变量间是如何连接的,并对新兴网络的属性作出判断。
在人工设计的网络中,各元素之间的连接可被直接观察到。但对于社会、生物和信息网络,其中的关系和连接只能根据系统中各种元素在不同时间、不同条件下的表现进行推断。
麻省理工学院计算机科学副教授马诺里斯·克里斯(Manolis Kellis)说:“一些相关元素在它们的活动模式中可能出现相关性,但这很可能纯粹是因为它们都与同一个第三方相连接,比如,如果研究者的亲属跟随研究者参加基因组学会议,那么看起来他也可能是基因组学学者圈的一部分,但其实这一连接只是间接的。”
这些间接联系一直困扰着学者。在今年8月发表于《自然生物技术》(Nature Biotechnology)杂志的论文《作为区分网络中直接依赖的一般方法的网络去卷积》(Network deconvolution as a general method to distinguish direct dependencies in networks)中,麻省理工学院的克里斯和其同事一起,描述了一种新的算法,这种新算法可以推断网络中的直接依赖性。
论文作者之一索黑尔·费兹(Soheil Feizi)说:“我们开发了一种新的方法来区分因素间的相互联系是直接的还是多余的,这种区分是通过衡量连接模式在整个网络中的比重来达到的。”该技术的原理与区分混合在一起的水和酒精相似。如果水和酒精以液体形式在同一个玻璃容器中存在,肉眼无法将二者区分开来。但将其冻结后,效果显而易见,因为水会冻结而酒精不会。
费兹表示:“将网络转化为光谱分析法能更清晰地揭示网络中的直接联系,光谱方法使用了完整网络结构中来自全球的信息,因而比以前仅凭本地信息判断间接连接的方法更为强大。”
多数推断网络连接的技术通常都是计算密集型并且非常耗费时间,且往往仅适用于有限的情况下。论文的另一位作者、麻省理工大学电子实验室教授穆里尔·迈达(Muriel Medard)说:“新的技术揭示了本地互动影响全球行为的原理。它是一种通用分析工具,适用于任意尺寸的网络。可以在一个更广泛的框架下,将信息理论和线性代数技术应用到现实世界问题的解决中去,并且其适用度很大,有很大弹性空间,可以做很多可能的适应性修改。”
目前,这一方法已被应用到基因网络及社交网络中,未来有望在疾病传播途径、社会互动和其他不同领域的研究中发挥作用。
(郑讴/编译)