團隊成員:胡東籬、黃冬霞、蔣博
指導老師:趙穎
創作初心
在疫情的發展期間,透過對湖北省各市相關資料的展示以及分析其與疫情的關係並視覺化,直觀地表現與疫情相關的社會因素以及影響程度,方便人們瞭解疫情資料以及社會各因素與疫情的關係。作品對湖北省各市與武漢交通流資料、與武漢距離、人口資料、醫療資料等多源資料進行視覺化,展示湖北省各市的社會情況;分析多源資料與疫情的關係,從交通、人口、醫療三個方面入手,展示他們與疫情的相關程度,從而讓人們關注與疫情相關的社會情況。
作品簡介
(1)作品介紹
①湖北總體資料展示與分析
該總體統計圖以遞減的方式展示了湖北各市的相關資料,包括人均生產總值、各市人數、人口密度、老年人口占比、衛生機構密度、各市確診人數等方面資訊。
在人均生產總值、人口密度、衛生機構密度和確診人數資訊中,條形圖的長度代表數量的多少;在人數和老年人口資訊中,用顏色深淺程度代表數值高低;床位數的部分,顏色和所佔面積表示數量的多少。
②湖北十市疫情相關資料展示
湖北十市部分單位化地展示了湖北十市的生產總值、人口密度、衛生機構密度和單位人數床位數量資訊,提供了各市經濟、人口和衛生相關的具體資料。圖片下方的折線圖來自2020年1月25日至2020年3月20日湖北各市疫情趨勢歷史資訊;折線圖橫座標表示時間,縱座標表示統計人數,不同顏色的曲線代表了不同型別的資料,包括各市累計確診人數、現存確診人數、治癒人數和死亡人數。
武漢市:
孝感市:
黃岡市:
荊州市:
襄陽市:
黃石市:
宜昌市:
鄂州市:
荊門市:
隨州市:
③流量/距離與疫情的分析
該部分首先展示疫情早期武漢市到湖北省(除武漢)各市的人口流動情況;地圖深淺表示三月中旬各市(疫情中期)的感染人數,直線顏色深淺表示從武漢到各城市的人口流量。
接下來的流量與各市感染人數散點圖、距離與各市感染人數的關係散點圖,表明距離的遠近與感染人數並沒有明顯的規律,而流量的大小與感染人數呈現出了一個接近線性的關係;分析該情況是因為新冠病毒透過飛沫傳染,與距離並無直接關係,而與人群最可能移動的路徑長度(我們也可以稱之為等效距離)有關係,這裡我們用流量來表示人口流動的等效距離。
④人口因素與醫療因素與疫情資料的分析
這一部分我們採集了湖北省各市的相關資料,包括:人口密度(人/平方公里)、女性比例、老年人口比例(60歲及以上)、醫療機構密度(個/平方公里)、千人平均床位數(個/千人)、千人平均醫療技術人員數(個/千人)。透過多元迴歸分析建立函式,得到各因素與各市在三月中旬(疫情中期)感染人數、治癒人數、死亡人數的關聯絡數,從而得到各因素與疫情資料的相關程度,使用桑基圖展示。
(2)社會價值
透過這個作品,使用者可以瞭解到從疫情初期到中期湖北省各市的疫情情況的變化(確診人數、死亡人數、治癒人數變化),湖北省各市的社會基本資料以及彼此的關係。透過對各因素的分析,例如流量與感染人數的關係,使用者可以瞭解到交通封閉的必要性;透過對人口資料的分析,我們可以看到老年人口與感染人數的關聯是較大的,說明老年人對該病毒的體抗力偏低,需要更加註意日常的防護。
(3)物件導向
希望瞭解疫情相關資訊的人群,進行疫情關聯性分析研究的人群,人口、交通、衛生相關管理部門。
作品價值及影響力
(1)價值
①資料收集的方法、相關資料集和關聯性分析方法可用於多種場合。
②疫情相關資料展示,直觀明瞭地傳遞出湖北各市的疫情資訊和相關資料資訊。
③分析關聯性,分析疫情相關的因素,如疫情初期交通流量、老年人口所佔比例、 等 方面內容,為疫情的防護、治療和進一步研究提供基礎資訊和參考方向。
(2)影響力
①便於獲取湖北各市疫情相關資訊,引發民眾對疫情的關注、對社會情況的思考。
②呼籲廣大市民群眾,在出行時重視武漢相關的交通流量、所在地人口密度、人口接觸距離等因素,防患於未然。
③引起相關部門的重視,在控制疫情情況時,注意當地老年人口比例,注重交通流量的管控。加強醫療衛生方面的防護和建設,未雨綢繆,以達到促進各地疫情防治、社會長治久安的目的。
作品技術說明
(1)使用工具
Tableau、Python、spss、Photoshop
(2)資料來源:
①湖北省統計年鑑:
http://tjj.hubei.gov.cn/tjsj/sjkscx/tjnj/qstjnj/
②疫情實時資料獲取:
https://zhuanlan.zhihu.com/p/105365487?utm_medium=social
④全國新型肺炎疫情實時資料介面:
⑤2019新型冠狀病毒疫情時間序列資料倉儲: https://github.com/BlankerL/DXY-COVID-19-Data
⑥2019新型冠狀病毒疫情時間序列資料:
https://github.com/BlankerL/DXY-COVID-19-Data/blob/master/json/DXYArea-TimeSeries.json
(3)資料集處理
①資料處理
A.多源相關資料部分:獲取湖北省各市的地圖空間檔案;查詢和儲存湖北省各市與武漢的交通流量、距離;搜尋湖北省各市的人口密度等人口資料以及醫療機構密度等醫療資料;透過網路上給出的資料來源對資料進行收集,使用Python對資料進行去重、補缺、清洗等,並將資料規律地儲存與csv檔案中便於後續使用。
B.各市疫情資料部分:透過爬蟲爬取實時疫情介面和疫情歷史資訊資料倉儲中的資料;處理json資料時,利用“湖北”作為關鍵詞,提取出所有湖北相關的疫情歷史資訊;解析json檔案結構,提取出湖北各市的疫情資料,進行時間戳轉換後,按照不同的市作為劃分,存入不同的檔案;寫入csv 檔案後發現每個市同一天有多條記錄,篩選時讀取日期列,最終得到展示需要的各市疫情歷史資訊檔案。
②製作過程
根據將要製作的圖表要求,對整理好的csv資料檔案進行匹配、合併、刪減等操作,使用Tableau製作流量、距離與疫情資料的關係散點圖;使用spss分析人口資料、醫療資料與疫情資料的關係,得到各項資料對疫情的影響程度情況,透過Tableau將人口、醫療資料與疫情資料的關係進行視覺化展示。
根據湖北省各市疫情累計確診人數排序,取累計確診人數排名前十的市作為展示物件。Tableau繪製各市地圖、疫情相關歷史資料曲線以及基礎展示資料。湖北省各 市多源資料化簡、單位化處理後,藉助Photoshop工具,利用圖示個數定量表示生產總值、人口、衛生機構、床位數量等資訊。