[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜

Eastmount發表於2018-08-16

作者最近研究人物關係圖譜,準備發表相關的文章,原本是用Python Networkx庫繪製,但效果不太理想;故改為Gephi軟體,發現其非常好看,特分享幾篇文章供大家交流學習,希望對您有所幫助,尤其是引文分析、社交網路、主題分佈等方向的同學。後續的文章將盡可能的使用Markdown語法撰寫了。
參考文章:【python資料探勘課程】十七.社交網路Networkx庫分析人物關係(初識篇)

PSS:2019年1~2月作者參加了CSDN2018年部落格評選,希望您能投出寶貴的一票。我是59號,Eastmount,楊秀璋。投票地址:https://bss.csdn.net/m/topic/blog_star2018/index

[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜
五年來寫了314篇部落格,12個專欄,是真的熱愛分享,熱愛CSDN這個平臺,也想幫助更多的人,專欄包括Python、資料探勘、網路爬蟲、影象處理、C#、Android等。現在也當了兩年老師,更是覺得有義務教好每一個學生,讓貴州學子好好寫點程式碼,學點技術,"師者,傳到授業解惑也",提前祝大家新年快樂。2019我們攜手共進,為愛而生。

一.關係圖譜結果展示

1.Fruchterman Reingold佈局
執行結果如下圖所示:

[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜

2.Force Atlas佈局
總體佈局如下圖所示:

[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜
然後檢視圖譜的細節如下所示:
[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜
[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜


二.匯入共現矩陣

1.Excel構建共現矩陣
接下來匯入Excel檔案的共現矩陣,如下圖test.xls檔案所示,具體怎麼得出這個表格資料,我後續文章將採用倒敘的方式進行講解,包括抓取知網的論文資料。

[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜
部分資料如下所示,其中“趙凌 謝傳紅”表示兩個作者合作完成一篇文章,同理“趙凌 石維武”也一樣,這就是所謂的共現矩陣。有的學者針對文學作品或影視作品做關係圖譜,則只需將出現在同一章節或同一集電視劇的演員看作存在關係,構建對應的共現矩陣即可。 ```python 趙凌 謝傳紅 趙凌 石維武 張磊 屈國超 張磊 王韶霞 張磊 謝卓瀟 屈國超 王韶霞 屈國超 謝卓瀟 王韶霞 謝卓瀟 高會軍 屈植斌 胡翠華 彭馨 張婷 趙孝梅 張婷 何燕 張婷 鄧婕 張婷 吳昌學 張婷 禹文峰 張婷 官志忠 ``` 文章“貴州都勻陽和鄉格業寨水族“開控”儀式及儀式音聲考述”的作者剛好是“趙凌 謝傳紅 石維武”三位老師,也對應上述的共現關係。
[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜

2.Gephi匯入資料

接下來開啟Gephi軟體,點選“檔案”=>“匯入電子表格”,選擇“test.xls”檔案,如下圖所示。

[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜
點選“下一步”=>“完成”,需要注意的是:圖的型別選擇“無向邊”,因為論文作者是同時出現的,不存在方向;而如果研究論文引用文獻,則建議構建有向圖。
[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜
該圖共有497個節點,1085條邊,點選確定之後如下圖所示,可以看到一堆混亂的關係及散點。
[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜


三.設定節點和邊

接著點選右下角“統計”,然後點選:
(1) 平均路徑按鈕(Betweenness Centrality)
(2) 模組化(Modularity Class)

[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜
執行過程中會彈出生成的報告圖,點選“關閉”按鈕即可,如下圖所示:
[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜

接著設定節點和邊的屬性。
(1) 設定節點大小(第二個圖示)Ranking為度。點選“執行”後,可以看到節點的大小有所改變,這裡的節點大小對應節點的度,例如作者“王二”與五個作者共現,則大小設定為5;也可以設定為平均路徑按鈕(Betweenness Centrality)。

[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜

(2) 設定節點顏色(第一個圖示)Partition為Modularity Class(模組化),為不同的關係設定不同的顏色,如下圖所示。

[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜


四.設定關係圖片佈局

1.設定為Fruchterman Reingold型別。FR演算法(Fruchterman-Reingold) 屬於力引導佈局演算法類別,網路區域性演算法。

[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜
輸出結果如下圖所示:
[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜

2.設定為Force Atlas型別。同時將斥力強度從200設定為2000,這樣點之間的線會分得更開。

[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜
接著點選預覽,點選“顯示節點標籤”並設定為中文漢字,勾選“比例大小”,否則節點很大的字型很大,可以看到影象如下所示:
[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜
但是圖形中存在很多兩兩在一起的點,他們是常見的碩士論文和博士論文,導師和學生的合作,或者僅有兩個作者的文章。
[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜
如何過濾這些關係比較孤立的群體呢? 可以通過“過濾”中點選“拓撲”=>“在度的範圍”,將關係較少的子圖過濾。
[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜
輸出結果如下圖所示:
[關係圖譜] 一.Gephi通過共現矩陣構建知網作者關係圖譜

最後推薦下面文章給大家學習:
(1) 視訊: http://www.iqiyi.com/w_19ru91d0vt.html
(2) 百度文庫: https://wenku.baidu.com/view/29328a9f19e8b8f67d1cb92d.html
(3) 部落格文章: Gephi學習筆記-畫出圖形基本流程

PS:感謝博友的反饋及相關知識,本文應用的應該是共現矩陣不是共線矩陣吧。英文名是Co-occurrence Matrix,也翻譯成共生矩陣

相關文章