Taming out-of-equilibrium dynamics on interconnected networks
作者:
Javier M. Buldú, Federico Pablo-Martí, Jacobo Aguirre
地址:
https://www.nature.com/articles/s41467-019-13291-2
一、前言
這篇論文提出一種新的方法來實時描述、預測和管理髮生在網際網路絡上演化過程的非平衡動態。
這一目標的實現是通過對現象學的全面分析處理,並將其簡化為一個二維的通量圖,以便實驗人員在每一步預測修改不同系統之間聯絡的動態結果。實驗結果與真實資料相一致,該方法可以被移植應用於叢集網路和任何規模、拓撲結構或起源的互連網路,諸如創新結構的知識糾紛、國際經濟關係和疾病在社會中的傳播方式等。
二、介紹
許多真實世界的網路可以被視為擁有自身標識的系統,可與其他實體相互連線,共同組成所謂的“網路的網路”。這些複雜系統的某些特性與孤立系統截然不同。
當網路屬性在與其他網路互動時,它們會發生改變,這一事實為在網路之間定義最佳連線提供了可能性。舉個例子,一個網路在網路的網路中的重要性通過其累積的特徵向量中心性來衡量,而這一點又很大程度上依賴於它的它的譜屬性(即鄰接矩陣的最大特徵值)和特定的聯結器節點(即連線到其他網路的聯結器的節點)。
前一種分析的一個主要侷限性是,它們主要關注系統的漸近平衡狀態。然而,許多真實的過程是永遠遠離平衡的。網路不能逃避這一現實,因為大多數真正的網路系統是在通過時間不斷進化的。
在網路競爭資源給定的框架下,一個主要的目標可能是將達到均衡的時間最小化——或最大化,而不是將某個結果的最終價值最大化。這一事實引出了一個自然而然的問題:為什麼我們不應該尋找一個依賴時間的次優連線策略,作為補償,它需要更短的時間來達到平衡?此外,如果網路決定在某個時間修改其連線策略以避免有害的平衡狀態,該怎麼辦?
這篇文章描述了網路上的動態過程是如何達到平衡狀態的,以及通過實時精確地管理連線它們的鏈路來實現這種動態行為的潛在指導。此外,文中介紹了一個基於被研究系統的光譜特性的新框架,該問題的分析處理允許預測網路之間的聯結器連結如何影響整個系統的演變和實時調整這些連結的後果。作者還提出了多種應用來描述這一新視角的潛力和進一步發展的途徑。
三、實驗相關
1.基本方法和定義
• 基本方法
本文研究發生在兩個網路A和B上失去平衡的動態過程,它們通過一定數量的聯結器構成一個含有兩個網路的“網路的網路”---T。
隨時間演變的過程由公式(1)給出:
其中,M是一個通用的過渡矩陣,用於描述發生在兩個網路上的動態過程;n(t)是一個代表系統在時間t的狀態的向量,n(0)是初始狀態條件。
向量n(t)代表不同的大小取決於系統的性質。可能是社會學背景下的人數,可能是生物學環境中的有機體或分子數,也可能是金融和經濟網路中的貨幣或商品與服務的數量,亦或者是創新網路中的知識,等等。為簡單起見,我們將使用通用術語population向量代表n(t),因此每個節點i在時間t擁有一個population---n_i(t),每個網路一個population--PA(t)和PB(t)等於在每個時刻留在該網路的節點的population佔總population的比例。
• 系統的漸近平衡
很容易看到n(t)→u_(T, 1)當時間增長時,u_(T, 1)為與過渡矩陣M的最大特徵值相關聯的特徵向量。此外,u_(T, 1)強烈依賴於聯結器節點,即那些通過聯結器連線連結,以及從孤立的網路A和B獲得的最大的特徵值λ A1和λ B1。為了方便性,我們假設網路A和B,滿足λ A, 1>λ B, 1。當λ1隨著連結和節點的數量增長時,我們稱A為強網路和B為弱網路。
• 特徵向量中心
與表示網路的矩陣的最大特徵值相關聯的特徵向量。它被廣泛地用於測量網路中節點的拓撲重要性,並被實驗證明在知識傳播系統中是至關重要的。我們將網路A和B的中央(C)和外圍(P)節點i使用大和小的中心性(Ul)i來各自命名。當每個網路被孤立時計算(因此每個節點在整個過程具有一個恆定的數量)。
• 引入結論
兩個網際網路絡通過低中心性的節點(即使用外設-外設(PP))連線可以使強網路A保留儘可能多的使用者,而通過中心節點(central - central (CC)連線)的連線對弱網路最有利。然而,這兩種連線策略的結果都是在平衡狀態下測量的,不考慮實現它所需的時間,也不考慮網路修改其互連的能力。之後該文章將分析在網路遠離平衡狀態時研究網路上動態系統的重要性。
2.一個說明時間重要性的例子
——知識在創新網路傳播的模型
• 對模型的描述
①節點代表個人或公司,他們與他人競爭或合作,以獲取生產某種產品或控制某種技術的最有價值的知識;
②假設知識只能通過與搭檔的合作過程和知識交換創造。在這些工作中,知識交換被理解為正式或非正式的研究與開發(R&D)關係,可以用個體之間的雙邊互動來描述;
③在許多情況下(例如生物技術行業),關聯性較低的組織最有可能失敗。
根據以上三點,在網路結構中與其他公司建立聯絡總體上似乎是一個不錯的策略。
描述知識在網路上傳播動態的方程為:
其中,n_i (t)表示個體i在時間t的知識積累,這些知識在一個時間段內只能從個體j轉移到與其直接相連的個體i。{nn}_i表示節點i的近鄰。其動態可表示為矩陣形式:
其中,G是網路的鄰接矩陣,如果節點i和j相連,其元素G_ij=1,否則G_ij=0。
• 具體過程
兩個網路A和B,它們在各自的節點上競爭所積累的知識。首先假設這兩個網路最初是斷開的,最強的網路在完全沒有知識的情況下開始,並願意通過聯結器節點連線到最弱的網路,以在漸近平衡時獲得最大可能的知識,但同時最小化達到這種平衡的時間。
為清楚起見,在這個例子中,文章先分析了網路通過一個唯一的聯結器連結進行連線的情況,但稍後將證明,這種情況可以直接推廣到更多的連結。
圖1:兩個網際網路絡上演變的動態過程
圖1顯示了幾種優化知識從弱網路B的N_B個節點向強網路A的N_A完全轉移的策略。P_A (t)代表在t時刻在網路A中的知識佔總知識的比例。顯而易見,P_B (t)=1- P_A (t)。
• 靜態策略
①通過中心度最高的節點(CC)連線網路A和網路B;
②通過外圍節點(PP)連線網路A和網路B。
• 動態策略
在有必要的情況可隨時修改聯結器的連線,同時儘量優化所積累的知識和到達平衡的時間。
①窮舉方法,探索能使知識流量在之後n步中最大化的方法(n=5和10)所有可能的組合;
②基於選擇CC的策略的啟發式方法(它會導致狀態快速遠離平衡),直到知識流量變得非常低,因為此時到達了CC漸近平衡,然後轉換成PP策略,這種策略比較慢,但是可以使強網路最後獲得儘可能多的知識。
• 策略比較
圖1顯示窮舉方法是最有效的方法,但是計算代價非常高,因為每經過一個時間t,需要計算兩個網路之間所有可能的NA*NB個連線的後n個步驟。另一方面,基於CC和PP策略相結合的啟發式方法得到了一個解,該解達到了網路A的最優知識,僅比窮舉法稍慢,但計算速度快幾個數量級。
如果實驗的目標是阻礙創新的傳播而不是促進傳播,一個有效的啟發式策略將連線通過PP連線(最小化流量)持續很長一段時間,當弱網路的剩餘資訊在CC連線達到均衡狀態時,通過改變連線狀態徹底變成CC可以完全阻止通量產生。
3.現象學的分析方法
這篇文章主要關注兩個獨立的網路,它們通過有限數量的聯結器相互連線,其中普通的人口(或知識)隨著時間的推移而發不斷變化,聯結器連結可以在任何時間步長變化。
文中特別注意的是得到人口分佈和人口流動的理論表示式,即在每個時間步長內,人口從一個網路流向另一個網路的比例,以獲得在兩個網路的屬性在變化過程中的未來行為,它們潛在的連線策略和初始人口分佈。
4.人口分佈的演變
文中通過公式4給出兩個互聯對稱網路上一般過程隨時間的演化規律:
其中n(t)的含義如前所述,M是描述動態過程的過渡矩陣;N_t = N_A + N_B是網路的網路T中的節點總數;α_i = n(0) • u_(T, i)是初始條件在網路T的矩陣M的第i個特徵向量上的投影。
假設矩陣A和B滿足λ_(A, 1) > λ_(B, 1),其中u_(A, i)和λ_(A, 1)是網路A的矩陣M_A的第i個特徵向量和對應的特徵值,B同理。使用公式5來估計初始條件n(0):
其中,。
引入定義在0~∞之間,時間為t時的網際網路絡中的人口分佈函式x(t):
聯立公式(4)和(6),運用相關理論,我們可以獲得矩陣T的第一和第二特徵值和特徵向量,作為只依賴於相互隔離的網路A和B的特徵值和特徵向量、聯結器的連線權重ϵ和聯結器的資訊的量。
在網路T上的人口分佈函式x(t)服從公式(7):
其中:
P是一個滿足條件的矩陣:如果A中的節點l和B中的節點m通過一個聯結器相連,則P中的元素P_ml = P_lm = 1,否則P_ml = P_lm = 0。
F代表在A, B相互連線之前,所有連線節點的特徵向量中心的測量結果之和。因此,ϵF被命名為連線強度,ϵF/△λ被命名為正常連線強度。
值得注意的一點是,PP連線會導致F的值較低,CC連線或是大規模的PP連線能帶來較大的F值。
最終可以得到結論--x(t)的表示式只依賴於四大因素:
①孤立的網路A和B的第一個特徵值λ_(A, 1)和λ_(B, 1);
②通過F可以得到的連線節點的中心性,而F取決於A和B的第一個特徵向量u_(A, 1)和u_(B, 1);
③聯結器連線權重ϵ;
④初始條件x_0。
5.人口流動和漸近平衡
人口流量x(t):衡量在時間t時,人口從網路A傳播到網路B的速度。它允許網路在此過程的每一步選擇最優策略來根據具體情況,最大化或最小化這一流量。根據公式(7),得到公式(9):
其中K、L、△λ、ϵ各含義與公式(7)中相同,的值越大意味著人口分佈的變化越快,易得到當系統處於平衡狀態時= 0,代入公式(7),我們得到公式(10):
當兩個網路通過外圍節點(PP策略)連線時,ϵF ≈ 10,x_eq = 0,人口的均衡分佈充滿了強網路A,且幾乎與u_(A, 1)一致。
CC策略即ϵF的值儘可能大,推動人口儘可能向弱網路B流動。
在兩個網路之間的連線策略,即ϵF不改變的情況下,如果x_0 >x_eq,人口將會從B單向往A流動,反之則由A向B流動。
圖2:人口流量的數值和解析計算之間的比較
圖2顯示了在t=1和t=150時,與正常連線強度ϵF/△λ和初始人口分佈x_0的函式關係:a圖和b圖中,人口流量絕對值使用圖1中用到的無標度網路對兩個互連網路的非平衡態進行數值計算得到;c圖和d圖中,人口流量絕對值通過公式(9)分析得到。圖中的白線對應於平衡態x_0 = x_eq。
可以發現,正如對現象學的分析處理所預測的那樣,人口流量超過平衡線時,人口將向網路A流動,而如果在平衡線以下,人口流動將趨向於網路B。此外,在此動態過程剛開始時,遠離平衡(a和c的右上角)的CC連線流量最大;然而在大多數情況下,網路使用PP連線。
6.人口流量圖和框架的適用性
• 人口流量圖的建立
利用上述結果可以建立一個人口流量圖,作為研究一般網際網路絡上的非平衡過程的一般框架。具體來說,主要是利用了以下幾點:
①在= 0的情況下得到平衡曲線,這一點依賴於網路的內部拓撲結構,或者說是它們的最大特徵值和網路之間的聯結器連線情況,與初始人口分佈x_0無關;
②x_0>x_eq時,<0;x_0<x_eq時,>0。
因此,xxx圖的軌道每一步都會向平衡邊界移動一段垂直距離;同時,在任何時候改變聯結器連線將會水平地移動軌道。
通過這種方法,可以得到一個圖,它可以表示在每個時間步長選擇聯結器連結的條件下,從任意初始條件到任意最終平衡狀態的完整軌跡。
圖3:人口流量圖
• 框架適用性的探究
如果把現象學看作一個遊戲,那麼任何一種競爭規則都包含在這個框架中,例如一個獨特的網路在最短的時間內獲取最多的人口,一個網路之間的競爭,其中競爭者輪流選擇聯結器連結,等等。
在圖3中繪製了幾個樣本軌道來顯示這個框架的通用性:
⑴大多數人口最初放在弱網路B(x_0 = 2.5)中,目標是儘可能快地讓人口移動到網路B中:
①通過圖1所示的窮舉方法來實現,在每一步中,系統選擇的連線使人口流量達到最大,經過十步,策略從CC逐漸變化到CP,最後到達PP連線(軌跡(i));
②通過啟發式方法,即網路通過CC連線,直到系統接近平衡狀態,改變到PP連線(軌跡(ii))。
⑵人口最初放在弱網路A(x_0 = 0)中,選擇一箇中間連線,推動人口向網路B流動,直到x(t)達到一個定值(此例中x(t) = 0.6),立刻改變聯結器的連線方式和它們的權重,來停止人口流動,以無限期維持在這種情況下人口分佈 (軌跡(3));
⑶軌跡(4)顯示了兩種不同策略交替的最簡單情況。該方法表明,這種情況下的最終均衡等價於同時應用兩種策略,但將聯結器連結的權重減半。
除了圖3所示的一般例子外,這篇文章還通過對一個研究經濟網路演變的實際案例的分析來體現該框架的應用價值。
四、討論
在這篇文章的這項研究中,作者證明了:在兩個相互連線的網路之間,可以通過對聯結器連結的適當改變,引導系統的動態,根據需要決定系統從任何初始條件到任何期望的最終狀態的演變過程。
文中提出了一個完整的分析處理過程,為了簡化系統的管理,引入一個二維結構-人口流量圖,其中包含人口隨時間的演變,所有可能的初始條件和連線策略。
文中的方法適用於任何規模或拓撲結構的有向和無向網路描述和管理整個系統的非平衡演化,只要系統的動態演化可以通過一個過渡矩陣來建模,即n(t) = M^t n(0),n(t)為某個變數在時間t是網路中每一個節點的狀態向量。
作者研究了從2005年到2015年36個經合組織國家的經濟網路。面對不同國家的經濟行為,文中的方法可以幫助出開發依賴國家的經濟和金融形勢的積極的經濟政策。文中還通過專門的補充注例來提供其方法在其他複雜系統的潛在應用,如在分散的棲息地內的物種的生長的控制和優化的突變——選擇進化過程,疾病蔓延在社會環境的描述,和描述了1988年和1999年之間在生物科技方面相互協作網路的進化的潛在的資料集的分析。