進入21世紀,面對科學知識呈爆炸式增長的大資料挑戰,一種有效獲取知識和探測知識前沿的新領域與新手段——科學知識圖譜和知識視覺化方法,正在蓬勃興起。
科學知識圖譜是以科學知識為物件,顯示科學知識的發展程式與結構關係的一種圖形。它具有“圖”和“譜”的雙重性質與特徵:既是視覺化的知識圖形,又是序列化的知識譜系,顯示了知識單元或知識群之間網路、結構、互動、交叉、演化或衍生等諸多複雜的關係。科學知識圖譜研究,以科學研究正規化為基礎,以引文分析方法和資訊視覺化技術為手段,涉及數學、圖形學、資訊科學、認知科學和電腦科學諸學科交叉的領域,是科學計量學的新發展。
科學文獻是通過一代又一代引文,即一代接一代不斷引用參考文獻,在繼承前代科學家的研究成果基礎上,而不斷創新、突破和發展起來的。這是科學知識區別於非科學文化而發生革命性變革,並引領技術創新及其驅動發展的強大內在動力。科學引文索引(SCI),就是以此為原理而建立的科學文獻資料庫。我們可以在SCI資料庫中檢索一個學科或知識領域的全部文獻資料,運用引文分析方法和知識視覺化技術,構建該學科或知識領城的引文網路知識圖譜,展現出該領域的來龍去脈、知識基礎與研究前沿。目前,各種資訊及知識視覺化軟體與技術,異軍突起,群雄逐鹿,由是繪製的知識圖譜千姿百態,精彩紛呈。
在科學知識圖譜領域中,最令人注目的學者,是國際著名的資訊視覺化領軍人物、美籍華人學者陳超美博士。他在資訊視覺化和科學知識圖譜領域在知名的Springer出版社首先出版了兩部學術專著《資訊視覺化》(1999)和《科學前沿圖譜》(2002)。由他開發的基於引文空間分析的CiteSpace知識視覺化軟體,是目前最為流行、國際公認領先世界的知識圖譜繪製工具之一。用CiteSpace繪製的知識圖譜最突出特點,是能夠將一個知識領域的演進歷程集中展現在一幅引文網路圖譜上,並在圖譜上把作為知識基礎的引文節點文獻和共引聚類所表徵的研究前沿自動標識出來。
CiteSpace軟體可以繪製多種形式的知識圖譜,其中主要是兩種:一種為預設的常規聚類檢視,它側重於體現文獻或作者共被引聚類之間的結構特徵與各個聚類標徵的研究前沿及其演進歷程,突出關鍵節點文獻的基礎作用;另一種時間線檢視,側重於勾畫各個聚類中文獻的歷史跨度和聚類之間的關係,以及各個聚類反映的研究前沿。
常規聚類的知識圖譜一般為文獻共被引聚類圖譜,以陳超美等人於2012年5月發表的基於CiteSpace的再生醫學領域綜述一文中的文獻共被引圖譜為例:各個節點圓形年輪的大小代表節點文獻被引頻次多少,其由內到外的色調變化和各個聚類的色調變化,代表了2000年至2011年的時間變化。圖譜左下角箭頭所指聚類7,為“誘導多能幹細胞(induced pluripotent stem cell,iPSC)”的前沿聚類,其中日本生物學家山中伸彌(Shinya Yamanaka)首創“iPSCs”的高被引、高突現性論文起關鍵的基礎作用,預言該領域這一研究前沿將會摘取諾貝爾獎。果然,山中伸彌和英國科學家格登(John Gurdon)因在此方面的貢獻而獲得2012年度此項殊榮。
常規聚類圖譜另一種形式為作者共被引聚類圖譜,可以顯示研究前沿的作者基礎, 特別是能夠反映高影響力作者對科學研究前沿的基礎地位與作用。
藉助知識圖譜人們可以透視龐大的人類知識體系中各個領域的結構,理順當代知識大爆炸形成的複雜知識網路,預測科學技術知識前沿發展的最新態勢。目前,CiteSpace及相關知識視覺化技術與知識圖譜方法已廣泛地應用於管理學、教育學、社會學、體育學及其他人文社科領域,在基礎醫學和生物學等自然科學領域的應用方興未艾,並且通過專利文獻的計量和視覺化分析而在工程技術領域開拓了越來越廣闊的應用空間。
來源:科技日報