無尺度網路
在網路理論中,無尺度網路(Scale-free network,或稱無標度網路)是帶有一類特性的複雜網路,其典型特徵是在網路中的大部分節點只和很少節點連接,而有極少的節點與非常多的節點連接。這種關鍵的節點(稱為「樞紐」或「集散節點」)的存在使得無尺度網路對意外故障有強大的承受能力,但面對協同性攻擊時則顯得脆弱。現實中的許多網路都帶有無尺度的特性,例如互聯網、金融系統網路、社會人際網路等等[1]。
源起
無尺度網路的概念是隨着對複雜網路的研究而出現的。「網路」其實就是數學中圖論研究的圖,由一群頂點以及它們之間所連的邊構成。在網路理論中則換一套說法,用「節點」代替「頂點」,用「連結」代替「邊」[2]:4[3]:9。複雜網路的概念,是用來描述由大量節點以及這些節點之間錯綜複雜的聯繫所構成的網路。這樣的網路會出現簡單網路中沒有的特殊拓撲特性[3]:2。
自二十世紀60年代開始,對複雜網路的研究主要集中在隨機網路上。隨機網路,又稱隨機圖,是指通過隨機過程製造出的複雜網路。最典型的隨機網路是保羅·埃爾德什和阿爾弗雷德·雷尼提出的ER模型。ER模型是基於一種「自然」的構造方法:假設有 個節點,並假設每對節點之間相連的可能性都是常數 。這樣構造出的網路就是ER模型網路。科學家們最初使用這種模型來解釋現實生活中的網路[2]:7-9。
ER模型隨機網路有一個重要特性,就是雖然節點之間的連接是隨機形成的,但最後產生的網路的度分佈是高度平等的。度分佈是指節點的度的分佈情況。在網路中,每個節點都與另外某些節點相連,這種連接的數目叫做這個節點的度。在網路中隨機抽取一個節點,它的度是多少呢?這個概率分佈就稱為節點的度分佈[3]:11。
在一般的隨機網路(如ER模型)中,大部分的節點的度都集中在某個特殊值附近,成鐘形的泊松分佈規律(見圖3)[4]。偏離這個特定值的概率呈指數性下降,遠大於或遠小於這個值的可能都是微乎其微的[3]:11,就如一座城市中成年居民的身高大致的分佈一樣。然而在1998年,Albert-László Barabási、Réka Albert等人合作進行一項描繪萬維網的研究時,發現通過超連結與網頁、文件所構成的萬維網網路並不是如一般的隨機網路一樣,有着均勻的度分佈[5][6]。他們發現,萬維網是由少數高連接性的頁面串聯起來的。絕大多數(超過80%)的網頁只有不超過4個超連結,但極少數頁面(不到總頁面數的萬分之一)卻擁有極多的連結,超過1000個,有一份文件甚至與超過200萬個其他頁面相連。與居民身高的例子作類比的話,就是說大多數的節點都是「矮個子」,而卻又有極少數的身高百丈的「巨人」。Barabási等人將其稱為「無尺度」網路[5]。
描述與定義
無尺度網路的特性,在於其度分佈沒有一個特定的平均值指標,即大多數節點的度在此附近。在研究這個網路的度分佈時,Barabási等人發現其遵守冪律分佈(也稱為帕累托分佈),也就是說,隨機抽取一個節點,它的度 是自然數 的概率:
也就是說 的概率正比於 的某個冪次(一般是負的,記為 )。因此 越大, 的概率就越低。然而這個概率隨 增大而下降的「速度」是比較緩慢的:在一般的隨機網路中,下降的速度是指數性的,而在無尺度網路中只是以多項式類的速度下降[3]:12。
在現實中許多大規模的無尺度網路中,度分佈的 值介於2與3之間[3]:14。在對數坐標系中,度分佈將會是一條斜率介於-2至-3之間的直線[3]:12。如左下圖中,橫坐標為節點的度,從 一直到 ;縱坐標為找到這樣的節點的概率從 一直到 。最高度數的節點有882條連接。所有的藍點大致成一條直線分佈(綠色的直線)。
度-度相關性
僅僅是將度分佈的冪律分佈作為無尺度網路的定義有其不夠完善之處。由於冪律分佈是方差可能無窮的高可變分佈,對於度分佈是同一個冪律分佈的不同網路,其拓撲結構和特性可能存在巨大的差異。2005年,Lun Li和大衛·阿爾德森(David Alderson)等人在論文《邁向無標度圖的理論》(Towards a Theory of Scale Free Graphs)中提出了一種補充性的標度性測度[7]。設 為所有具有(依照冪律分佈的)度分佈 的網路 的集合,對於其中每一個網路 ,定義度-度相關數:
其中 表示 中所有連接的集合。根據排序原理,如果度數大的點之間相互連接的話,那麼 會比較大。設 為最大的,那麼定義度-度相關係數:
度-度相關係數 介於0與1之間。 越靠近1,則稱此網路 「無尺度」的, 靠近0,則稱 是「富尺度」的。在此定義下,無尺度網路中的節點度數分佈特徵體現了自相似的性質,而凸顯了「無尺度」的特徵,與富尺度網路之間有相當的差異[7]。
例子
不少現實中的網路結構都屬於無尺度網路,或者有無尺度的特性。以下是一些無尺度網路的例子:
網路 | 節點 | 連接 |
---|---|---|
電影演員網路[6] | 演員 | 出演同一部電影 |
萬維網[6] | 網頁 | 超連結 |
互聯網[8] | 路由器 | 物理連接 |
蛋白質相互作用網路[9] | 蛋白質 | 蛋白質之間的相互作用關係 |
金融網路[10] | 金融機構 | 借貸關係 |
美國飛機航班網路[11] | 機場 | 飛機航線[12] |
BA模型
Albert-László Barabási與Réka Albert在1999年的論文中提出了一個模型來解釋複雜網路的無尺度特性,稱為BA模型[6]。這個模型基於兩個假設:
- 增長模式:不少現實網路是不斷擴大不斷增長而來的,例如互聯網中新網頁的誕生,人際網路中新朋友的加入,新的論文的發表,航空網路中新機場的建造等等。
- 優先連接模式:新的節點在加入時會傾向於與有更多連接的節點相連,例如新網頁一般會有到知名的網路站點的連接,新加入社群的人會想與社群中的知名人士結識,新的論文傾向於引用已被廣泛引用的著名文獻,新機場會優先考慮建立與大機場之間的航線等等。
在這種假設下,BA模型的具體構造為:
- 增長:從一個較小的網路 開始(這個網路有 個節點, 條邊),逐步加入新的節點,每次加入一個。
- 連接:假設原來的網路已經有 個節點( )。在某次新加入一個節點 時,從這個新節點向原有的 個節點連出 個連結。
- 優先連接:連接方式為優先考慮高度數的節點。對於某個原有節點 ( ),將其在原網路中的度數記作 ,那麼新節點與之相連的概率 為:
這樣,在經過 次之後,得到的新網路有 個節點,一共有 條邊[6][3]:27-28。
分析BA模型網路的漸近度分佈(當節點數量很大時的度分佈)主要有連續場理論、主方程法和速率方程法。這三種方法得到的漸近結果都是相同的。2001年,Béla Bollobás證明了在節點數量很大時,BA模型網路的度分佈遵從 的冪律分佈[13][3]:29。之後,其它的無尺度網路模型也開始被提出。
其它無尺度模型
BA模型成功的為無尺度網路找到了一個簡單而合理的形成機制。然而,BA模型也有其自身的局限。例如,它只能描述 的無尺度網路,對於真實網路的一些非冪律特徵如指數截斷(exponential cutoff)、小變量飽和(saturation of small variables)等無法描述[3]:33。因此,各種BA模型的推廣、變化版本開始出現。Bollobás在2001年提出了線性弦圖模型(LCD模型),允許節點自己與自己相連[14]。而後又出現了只允許重複連線而不允許自連線的模型[15]與不允許重複連線、自連線而是在選中的舊節點的鄰域隨機聯線的模型[16]。
適應度模型
在BA模型的製造過程中,人們發現,存在越久的節點具有越高的度數。然而,現實生活的網路中並非存在越久的元素就能有更多的聯繫。BA模型並沒有包括「後起之秀」的現象[3]:33。於是,出現了基於BA模型的適應度模型。適應度模型主要是修正了優先連接的機制,對每個節點加上一個吸引因子 ,這樣新節點的相連概率改正為:
局域世界演化模型
另一種基於BA模型的推廣版本是局域世界演化模型。這個模型假設每個新節點在引入時並不能在全域進行優先連接。比如說一家新上市的公司可能只會與同地區或同國家的公司展開貿易聯繫,居民搬入新社區時只會與同一幢樓的人開始認識等等。局域世界演化模型將BA模型優先連接的機制改為:新加入的節點時,先選擇全部節點的一部分(隨機選取的 個節點)作為局域世界,然後再在局域世界中進行優先連接。模擬結果指出,當 從 變化到 時,產生的網路從服從指數分佈逐漸過渡到服從冪律分佈[18]。
複製模型
在BA模型中,度分佈實際上是和增長的時間 (或說增長次數)相關的,只是在 十分大時近似於度分佈。複製模型是一個與增長時間無關的模型。複製模型的做法是每次隨機地「複製」一個原有的節點:即隨機選定一個節點 ,再加入一個新節點,然後新節點按照 與其它舊節點連接的方式與舊節點相連,最後與 也相連[19]。
分層模型
2001年,Barabási提出了第一個確定性的分層網路模型。這個模型是為了解釋生物學中 的代謝網路。分層模型的想法是從模體(motif)出發,通過自相似的層次疊加而得到複雜網路。這種思想類似於分數維圖形。Barabási的模型是:
- 建立一個根節點,以及兩個一級節點,並分別於根節點相連,這形成一個一級模體(右圖6中n=1的階段);
- 以一個一級模體作為根模體,再建立兩個一級模體,將它們的一級節點(一共4個)與根模體的根節點相連,這樣得到一個二級模體(右圖6中n=2的階段);
- 對二級模體重複前一步的操作(見右圖n=3的階段)。
這樣形成的網路是無尺度網路,Barabási算出它的 [20]。後來有使用5節點4連結作為模體,得到 ,而4節點3連結作為模體得到 ,近似於代謝網路。需要注意的是此模型中不少度數是0概率的,所以需要使用補分佈繞過。類似的確定性模型還有偽分形圖(pseudofractal scale-free network)[21]以及阿波羅模型(Apollonian network)[22]。
無尺度網路的阿喀琉斯之踵
2000年7月27日,《自然》雜誌的封面文章標題是《互聯網的阿喀琉斯之踵》(Achilles' Heel of the Internet)。阿喀琉斯是古希臘神話中的英雄,他出生後,他的母親捏着他的腳踝將他浸泡在冥河中,從此他的身體刀槍不入,只有踵部沒被浸到,是為其致命弱點。因此如今「阿喀琉斯之踵」常被用來稱呼一個系統的致命缺陷[23]。這篇文章中從互聯網的無尺度特性出發,探討它對意外故障的承受能力。
假設在一個網路中移除一個節點,以及與其相關的連接,那麼原網路中的其他點也可能受到影響:原本相連的兩個節點可能不再相連;即使相連,從其中一處到另一處可能需要經過更多的路途。總的來說,網路的連通性降低了。文章比較了ER隨機網路模型與BA模型在移除少量節點時對網路連通性的影響[24]。這個影響主要使用最大連通子圖的大小 與平均路徑長度 來衡量。在執行「隨機攻擊策略」,也就是在網路中隨機地去除一些節點時,無尺度網路的 比隨機網路下降慢得多, 的增長也緩慢得多。但是在執行「蓄意攻擊策略」,也就是選擇移除連接度最高的節點時,則會得到相反的結果[24]。受到隨機攻擊的隨機圖會分裂成幾個較小的子圖,而無尺度網路則有很大概率保持連通;然而面對蓄意攻擊(或稱協同攻擊)時,只需要移除5-10%的高於5度的節點,就能徹底癱瘓無尺度網路[3]:31-33。
流行病臨界值
流行病或網路病毒在複雜網路中的傳播也是複雜網路研究的方向之一。在均勻網路如ER模型隨機網路或小世界網路中,如果考慮易感(S)→感染(I)→易感(S)的SIS模型,那麼存在一個與網路特性相關的臨界值,當有效傳播率高於這個臨界值的時候,傳染病會在網路中傳播並穩定在某個恆定密度上(激活相態)。而當有效傳播率低於這個臨界值時,傳染病會很快逐漸消亡(吸收相態)[3]:73-74。對於無尺度網路,由於度分佈不均勻,臨界值比較小。對於BA模型,臨界值為0。也就是說,只要有效傳播率大於0,病毒就能有效傳播並達到穩定[25]。而對於有限規模的無標度網路,臨界值大於0,但會在均勻網路的十分之一左右。因此,無標度網路對於病毒傳播的抵抗性較均勻網路脆弱得多[26]。
由於無尺度網路應對流行病感染的脆弱性,人們提出不同的免疫策略來彌補。主要研究的免疫策略有三種:隨機免疫、選擇免疫與熟人免疫[3]:79。
隨機免疫
隨機免疫是在網路中隨機抽取一部分節點進行免疫。研究表明,採取這種策略的話,需要對網路中幾乎所有的節點都進行免疫才能保證最終消滅傳染病[3]:79。
選擇免疫
選擇免疫是在網路中抽取度最大的節點進行免疫。就BA模型而言,採取這種策略的話,即使有效傳播率變化,也可以只免疫很小一部分節點就保證消滅傳染病[3]:79。
熟人免疫
由於選擇免疫需要知道全局節點的度數情況,才能找到度數最大節點進行免疫,這在面對互聯網等龐大的複雜網路時會導致難以操作。熟人免疫採取的是隨機抽取一部分節點,然後對每個節點隨機選一個與之相連的「鄰居」節點來進行免疫。由於在無尺度網路中,度大的節點可以與非常多的節點相連,因此選擇「鄰居」免疫的話,碰到度大節點的概率會比碰到度小節點的概率大得多。所以熟人免疫要比隨機免疫有效得多,只略差於選擇免疫[27][3]:79。
同步性
音樂會或歌劇完場時,台下的觀眾不間斷地鼓掌。在很短幾次後,鼓掌的頻率就會變得同步。這種現象顯示出網路的同步性。研究表明,網路動力系統的同步性取決於節點動力系統的特性,節點的耦合方式與網路的結構。對於BA模型網路,節點數的增加不會降低網路同步的穩定性。而面對隨機攻擊和蓄意攻擊,BA模型網路的同步性與連通性表現出相同的特徵:對於隨機攻擊承受性強,而對蓄意攻擊則顯得脆弱[3]:79。
參考來源
- ^ 張皓。「《灌園先生日記》中家族社會網絡之分析研究(1927—1932)」。碩士論文,國立彰化師範大學歷史學研究所,2024。
- ^ 2.0 2.1 Richard Durrett. Random graph dynamics. Cambridge University Press. 2007. ISBN 978-0-521-86656-9 (英語).
- ^ 3.00 3.01 3.02 3.03 3.04 3.05 3.06 3.07 3.08 3.09 3.10 3.11 3.12 3.13 3.14 3.15 3.16 3.17 汪小帆,李翔,陳關榮. 《复杂网络理论及其应用》. 清華大學出版社. 2006. ISBN 9787302125051 (中文).
- ^ Statistical analysis of network data: methods and models, p.157
- ^ 5.0 5.1 《科學美國人》中文版2003年7月. 无尺度网络. 集智集團. [2011-07-04]. (原始內容存檔於2021-03-11).
- ^ 6.0 6.1 6.2 6.3 6.4 Albert-László Barabási, Réka Albert. Emergence of Scaling in Random Networks (PDF). Science: 509–512. [2011-07-09]. doi:10.1126/science.286.5439.509. (原始內容存檔 (PDF)於2021-09-23).
- ^ 7.0 7.1 Lun Li, David Alderson, Reiko Tanaka, John C. Doyle, Walter Willinger. Towards a Theory of Scale-Free Graphs: Definition, Properties, and Implications (PDF). Internet Mathematics: 431–523. [2011-07-09]. doi:10.1080/15427951.2005.10129111. (原始內容存檔 (PDF)於2021-09-23) (英語).
- ^ Ye Xu and Wen-bo Zhang. A Power-Law Approach on Router-Level Internet Macroscopic Topology Modeling. Advances in Intelligent and Soft Computing: 1471–1479. doi:10.1007/978-3-642-03664-4_156.
- ^ L.Giot; et al. A Protein Interaction Map of Drosophila melanogaster (PDF). Science: 1727–1736. [2011-07-11]. doi:10.1126/science.1090289. (原始內容 (PDF)存檔於2011-01-12).
- ^ Rama Cont , Amal Moussa, Edson Bastos e Santos. Network Structure and Systemic Risk in Banking Systems (PDF). SSRN.
- ^ 中國和印度的國內航班網路則更適合用小世界網路刻畫
- ^ Sheila R.Conway. scale-free networks and commercial air carrier transportation in the United States (PDF). 24th international congress of the aeronautical sciences.[永久失效連結]
- ^ Bollobás, B.; Riordan, O.; Spencer, J.; Tusnády, G. The degree sequence of a scale-free random graph process. Random Structures and Algorithms. 2001, 18 (3): 279–290. MR 1824277. doi:10.1002/rsa.1009.
- ^ Béla Bollobás, Oliver Riordan, Joel Spencer, Gábor Tusnády. The degree sequence of a scale-free random graph process. Random structures & algorithms: 279––290. doi:10.1002/rsa.1009 (英語).
- ^ S.N.Dorogovtsev, J.F.Mendes , A.N.Samukhin. Structure of growing networks with preferential linking. Physical review lettres. doi:10.1103/PhysRevLett.85.4633 (英語).
- ^ Holme P;Kim B J. Growing scale free networks with tunable clustering. Physical review E. doi:10.1103/PhysRevE.65.026107 (英語).
- ^ G. Bianconi ;A.L.Barabasi. Bose-Einstein condensation in complex networks. Physical review letters. doi:10.1103/PhysRevLett.86.5632 (英語).
- ^ Qin, Sen; Dai, Guan-Zhong. A new local-world evolving network model. Chinese Physics B: 383–390. doi:10.1088/1674-1056/18/2/001 (英語).
- ^ R. Kumar, P. Raghavan, S. Rajagopalan, D. Sivakumar, A. Tomkins, E. Upfal. Stochastic models for the Web graph. IEEE Comput. Soc: 57–65. doi:10.1109/SFCS.2000.892065 (英語).
- ^ Albert-Laszlo Barabasi, Erzsebet Ravasz, Tamas Vicsek. Deterministic Scale-Free Networks. Physica review A: 559–564. doi:10.1016/S0378-4371(01)00369-7 (英語).
- ^ S.N. Dorogovtsev, A.V. Goltsev, J.F.F. Mendes. Pseudofractal Scale-free Web. Physica review E. doi:10.1103/PhysRevE.65.066122 (英語).
- ^ Jose S. Andrade Jr., Hans J. Herrmann, Roberto F. S. Andrade, Luciano R. da Silva. Apollonian networks. Physica review lettres. doi:10.1103/PhysRevLett.94.018702 (英語).
- ^ 據蘇聯俄羅斯聯邦教育部國家教科書出版社列寧格勒全社1961年俄文版譯. 神话辞典. 商務印書館. 1985.第19頁.
- ^ 24.0 24.1 Réka Albert, Hawoong Jeong, Albert-László Barabási. Error and attack tolerance of complex networks. Nature. 27 July 2000, 406 (6794): 378–382 [2011-07-09]. doi:10.1.1.33.2606/nature.406.2115.378. (原始內容存檔於2021-03-01) (英語).
- ^ Romualdo Pastor-Satorras, Alessandro Vespignani. Epidemic Spreading in Scale-Free Networks (PDF). Physical review lettres: 3200–3203. [2011-07-09]. doi:10.1103/PhysRevLett.86.3200. (原始內容存檔 (PDF)於2021-09-23) (英語).
- ^ Romualdo Pastor-Satorras, Alessandro Vespignani. Epidemic dynamics in finite size scale-free networks (PDF). Physical review E. [2011-07-09]. doi:10.1103/PhysRevE.65.035108. (原始內容存檔 (PDF)於2021-03-04) (英語).
- ^ Reuven Cohen, Shlomo Havlin, Daniel ben-Avraham. Efficient Immunization Strategies for Computer Networks and Populations (PDF). Physical review lettres. [2011-07-09]. doi:10.1103/PhysRevLett.91.247901. (原始內容存檔 (PDF)於2021-03-04) (英語).
- Eric D. Kolaczyk. Statistical analysis of network data: methods and models. Springer; 1 edition. 2009. ISBN 978-0387881454 (英語).
- Richard Durrett. Random graph dynamics. Cambridge University Press. 2007. ISBN 978-0-521-86656-9 (英語).