指導老師:汪雲海
團隊資訊:蘇柏瑞 、楊明 、張開翼
創作初心
COVID-19 是人類歷史上第一次在高度發達的自媒體、全媒體時代遇到的高傳染性病毒,對於應付病毒,我們不能只從患者入手,更要面對的是因此引發群眾的恐慌心理。
在武漢初期,我們遇到過因為恐慌導致大量常規感冒、發燒患者擠兌醫院,在醫院造成大規模傳染。冠狀病毒為呼吸道傳染病,在擁擠、封閉的環境內很容易造成大範圍交叉傳染。在來自武漢大學中南醫院的新冠病毒肺炎患者的回顧性臨床資料,發現 41% 為院內感染[1]。
並且因為恐慌效應在自媒體時代各種社交軟體上的二次傳播,加劇了人們對病毒的恐懼,促使大量疫情嚴重地區的人開始向其他地區逃離,進一步加大了阻擊疫情的難度。
而在社會學中恐懼會隨著民眾內部的傳播進一步擴大其影響,從而導致股市崩盤、消費驟降、公司裁員等現象。 就目前這個節點來看,全球股市都開始崩盤,美國股市史詩三連跌停,對世界經濟造成重大的影響。而理性的看,很多恐慌造成的結果是無意義的,如果大家保持克制,可以很大程度上減少疫情對經濟的影響。
北京市習近平新時代中國特色社會主義思想研究中心在 2 月 17 號發表社論[2],提出在目前這個時代,需要我們加強輿論監管、加強輿論引導水平。
提出在目前的局勢下,我們需要做到:把握輿論生態變化、建立全媒體傳播體系、強化制度意識等多個方面。
故我們想探究的就是在新聞對輿論的引導和輿論之間的關係,亦或者我們的輿論引導是否起到了作用,起到了什麼樣的作用。 在本視覺化中,我們透過文字視覺化的方式,結合實時資料,將資料、輿論、新聞集中在一起,可以非常快速的分析輿論導向、新聞資訊、疫情資料。
VisLab was founded 2016 at Shandong University, Qingdao, China by Prof. Yunhai Wang. Its mission is to enhance people's ability to understand and communicate data through the design of automated visualization and visual analytics systems.
We study the perceptual and mathematical foundations of visualization in order to improve the efficiency of interactive data analysis, while developing interactive systems for data visualization and analysis.
騰訊影片地址: https://v.qq.com/x/page/n0944tpp2ij.html
作品簡介
NCOVIS 輿論新聞視覺化
在疫情期間,我們爬取了知乎熱搜資料以及中國新聞網的新聞資料。旨在探索:隨著疫情確診、治癒和死亡人數的變化:
人們在網路上討論什麼?
各地區新聞在報導什麼?
上面兩者的關係以及對控制疫情有什麼指導意義?
知乎熱搜資料視覺化
我們系統有兩部分構成,第一部分就是知乎熱搜資料視覺化,用來探索在疫情的擴散的不同階段,人們的輿論以及關注點是如何變化的。
該部分由三個圖表構成:動態條形圖、動態詞雲和堆疊面積圖。
我們希望使用者從疫情資料出發,也就是堆疊面積圖中發現一些感興趣的時間範圍,然後去動態條形圖和詞雲檢視相應時間,人們討論的話題是如何變化的。
從堆疊面積圖出發
該堆疊條形圖反映的是各個地區,確診、治癒、死亡人數之和隨著時間的變化。
不同於普通的堆疊面積圖,我們提供了豐富的互動手段,讓使用者可以從不同層次去探索資料、篩選資料,從而更加容易的發現感興趣的時間範圍。
可以透過下拉框從全國、地理分割槽(華中、西南地區等)、省份和直轄市(湖北、北京等)三個不同級別分別探索資料,點選地區的名字只檢視該地區的資料。
動態條形圖和詞雲
動態條形圖展現的是知乎熱搜的熱度變化,而動態詞雲展示的是熱搜對應回答的關鍵詞的變化。
條形圖的高度和位置會隨著熱度和排名的變化而變化,詞語的大小會隨著權重的變化而變化,我們也對變化過程進行了一定程度的最佳化,使其更易於使用者觀察變化。
透過這樣的動畫處理,我們賦予了使用者在時序維度上對輿論進行分析的能力,使用者可以從時序上對輿論的變化進行思考。
我們認為阻擊疫情不只是一個醫學問題,而是對社會各個方面的一次考驗,來自中國軍網一篇報導,在火神山醫院配有專業的心理醫生團隊,保證醫生、戰士、 患者的心理健康[3]。
新聞資料視覺化
這是我們系統的第二部分,中國新聞網資料視覺化。用於隨著疫情的擴散,各個地區在報導什麼。
該部分主要有三張圖表構成:樹形時間熱圖、形狀感知詞雲和餅狀圖。
我們也希望使用者從疫情資料出發,也就是樹狀時間熱圖中發現感興趣的時間和地區,然後去形狀感知詞雲和餅狀圖探索該地區和時間的新聞報導情況。
樹形時間熱圖、日曆時間熱圖
樹形時間熱圖主要用於展現各個地區的每天新增的確診、死亡和治癒人數。
不同於普通的時間熱圖,我們將其與中國地區所構成的樹結構進行結合,使得使用者可以透過操作樹結構來影響右側熱力圖的展示的層次和對資料進行篩選。
例如圖中使用者對西北地區和東北地區進行摺疊操作,可以方便的對比不同地區的總人數在隨時間的變化。同時也以雙擊地圖名進入日曆該地圖的日曆時間熱圖檢視細節。
透過兩種常見的視覺化方式相結合,在一個視覺化中實現了對確診人數分地區的趨勢變化並向使用者提供了粒度控制,可以有效的輔助使用者對趨勢的準確感知。
形狀感知詞雲視覺化和餅狀圖
形狀感知詞雲是用於展現中國新聞網上各個地圖新聞資料中的關鍵字。之所沒有用普通詞雲,是因為新聞很難做到像前面輿論視覺化使用動態詞雲的方式來吸引關注。
所以我們以各個地圖的地理輪廓作為生成詞雲的輪廓,在保證資訊傳遞質量的前提下,美化輸出結果,吸引使用者關注,並提高二次傳播的可能性。
而餅狀圖則是對各個地區每一天新聞資料的總的概括,展示不同類別的新聞佔比,用於分析疫情期間新聞的報導傾向。
作品價值及影響力
對於這次影響我們生活方方面面的疫情,我們希望提供一個不同的角度來觀察這次疫情,除了常見的資料、趨勢的洞悉,我們更多的把注意力放在了人本身。資料是冷冰冰的,但我們可以透過冷冰冰的資料去分析資料背後的人是在這次疫情中心理、行為的變化。
我們希望透過視覺化輿論的方式,來輔助政府對輿論引導的決策,幫助制定合理的政策來疏導輿論,避免恐慌情緒的蔓延對社會造成更大的傷害。 對於個人使用者,可以透過視覺化迅速獲取疫情資料、分地區資料的同時,進一步瞭解目前輿論關注點,對疫情有更加深刻的認識。
對於研究學者來說,本次疫情是醫學、社會學、心理學一個很好的研究範本,我們希望透過視覺化的方式將輿論隨著疫情發展而產生變化的過程以清晰直觀的方式呈現出來。從中可以獲得人類第一次在自媒體時代面對如此高傳染性的病毒時,群眾心理情況、恐慌心理的擴散和自我疏導、關注點,從而對此類事件有更深的瞭解,對未來可能的類似情況有更充足的準備。
舉例
對於社會價值,我們可以舉一個簡單的資料洞察,透過動態詞雲和疫情資料河流圖相結合,我們可以發現,當疫情這個突發問題突然擺到所有人的面前時,幾乎與疫情相關的問題蔓延式的衝擊知乎熱榜,預示著輿論對疫情開始極度恐慌,而相對的新聞報導開始集中報導疫情相關的問題。 這顯示了疫情初期,普通群眾與新聞媒體面對未知恐慌整體心態。
從初期到現在,輿論與新聞心態發生了多次波動與變化,可以有很多有趣的變化和細節去分析。為了形成鮮明的對比,我這裡以中國疫情逐漸接近拐點而國外疫情未爆發,輿論逐步放緩時舉例。此時可以發現,疫情相關話題基本不再佔據話題熱榜,人們對於疫情趨於常態化,從而分出精力去討論生活中的瑣事(例如佔據熱搜第三的“有沒有微信的頭像和背景是一套的”)。
而隨著時間的推進,國外疫情爆發,再度引爆了已經放緩的輿論,群眾開始密集討論國外疫情。中期心態放多緩,近期焦慮就多嚴重,從國際主義來看,疫情對全世界造成巨大災害,我們也牽掛著國際友人。同時,此時各種疫情常態化的言論逐漸出現,導致人們無論是對國外疫情的擔憂還是對外源疫情輸入、疫情常態化的焦慮重新佔領熱搜。
這個例子我們僅僅是從非專業的角度去揣測群眾心理、社會學專業人士可能得出的結論,過於粗淺,相信專業人士可以藉助我們的系統分析出更多對研究疫情心理的結論與有價值的資訊。
作品技術說明
資料處理
文字處理方面,我們使用 TextRank[5] 演算法,對輸入新聞、簡訊息文字、熱搜等資料進行權重分析,獲得文字中關鍵詞及關鍵詞權重。 為了進一步清洗文字,我們使用結巴分詞對輸入文字的分詞結果進行詞性判斷,去除不適合出現在最終詞雲結果中的單詞。
視覺化演算法
在時序詞雲方面,考慮到時序詞雲需要快速的生成多幀詞雲,所以我們使用了 IEEE VIS 2009 的 Wordle 演算法[6],其生成演算法為簡單的阿基米德螺旋線,在後端可以快速生成多幀詞雲,傳輸給前端以供生成動態時序詞雲。
形狀感知詞雲部分,我們實現了來自 IEEE VIS 2019 的 ShapeWordle[4]演算法,並且對中文進行了適配的處理,最後在中文環境下也可以產生很美觀的生成結果。
其生成演算法是基於形狀感知的阿基米德螺旋線,能夠使詞雲填充進給定的形狀,並使關鍵詞儘可能的貼合給定輪廓。
前端
我們的分析系統是一個跨三端(手機、平板、電腦)的互動式網站,使用的技術是 React + D3 + Ant Desgin。部署在: https://pearmini.gitee.io/ncovis-2020
後端架構
引用
[1] Clinical Characteristics of 138 Hospitalized Patients With 2019 Novel Coronavirus-Infected Pneumonia in Wuhan, China. https://www.ncbi.nlm.nih.gov/pubmed/32031570
[2] 新知新覺:有效提升輿論引導水平 http://theory.people.com.cn/n1/2020/0217/c40531-31589573.html
[3] 專訪強軍網應對疫情心理服務熱線諮詢師李光耀 http://www.mod.gov.cn/education/2020-03/15/content_4861978.htm
[4] ShapeWordle: Tailoring Wordles using Shape-aware Archimedean Spirals http://www.yunhaiwang.net/infoVis2019/shapewordle/index.html
[5] TextRank: Bringing Order into Texts https://web.eecs.umich.edu/~mihalcea/papers/mihalcea.emnlp04.pdf
[6] Participatory Visualization with Wordle https://ieeexplore.ieee.org/document/5290722