3f094d04700c73565106aae0741af5bc

在新聞中使用數字、採用視覺化形式呈現新聞,已經成為新聞報導的普遍做法,看似簡單,其實背後技巧多多。

在2015全球深度報導大會上,伊利諾伊大學厄巴納香檳分校教授、全球深度報導網董事會主席Brant Houston、調查記者與編輯協會(Investigative Reporters and Editors,IRE)的執行總監Mark Horvit及培訓主管Megan Luther分享瞭如何選用資料、如何用資料讓新聞更可信以及製作釋出資料視覺化時的“必記要點”。

如何在海量資料中抽取資料寫進故事?相信這是每一個記者都曾經歷或仍在苦惱的問題。擁有豐富調查報導實踐和培訓經驗的Houston總結出了幾種新聞記者適合使用的資料型別,並強調最重要的前提:清楚新聞故事中使用的資料是為了解決什麼問題,我們才能決定能採取什麼樣的演算法;複雜或者含混的資料時常出現,我們有時需要驗證演算法,或者自己動手算出新資料。

69f0c3af4fb43a812565d690dbe96eec

Brant Houston在講解新聞中使用眾數的例子

推薦使用的資料型別:
1. 在描述一個地區的人口收入或者住房情況時,以中位數取代平均數。中位數是按大小排列時最中間的數字,比平均數更有代表性,更易讓讀者理解和推測具體情況,並有助於避免收入差距懸殊且低收入人數較多時,使用平均數會拉高收入水平這一陷阱;
2.使用眾數反應頻率和集中情況。例如,一共有15個人,有兩人是收入500萬美金,有兩人收入5萬美金,剩下的收入10萬美金,因而10萬美金就是眾數,能說明所在團體大多數人的收入水平是什麼樣的;
3.使用比例和比率。把資料轉換成每單位平均資料,要點就更清楚了。比例適用於突出不同主體之間的差別;
4.特別關注比率的變化(百分比)。假設一個人今年的收入是4萬美元,下一年收入為4.2萬美元,前後差了2000美元,從百分比來看,收入變動了5%,或者說漲了5%。兩組相關資料的比率變化就有可能孕育新聞。譬如,公司的預算上調了30%,而所購買物品的價格僅上漲了2%,那麼背後原因是什麼?如果有選擇物品、預算決策的資訊,我們說不定就能挖到貓膩、寫成新聞;
5.計算比率變化時,我們應關注最顯著的變化,捨棄輕微變動。

選好了資料,呈現資料也同樣重要,用圖表展示比文字列舉更直觀形象。Houston推薦了表格、線形圖、餅圖、柱狀圖,都能讓讀者清晰閱覽資料,一看即懂。

311d7e5c57ac863c44f71b9c7dc7e4b1
同時,他還推薦了幾個易於下載表格資料的權威出處:世界衛生組織的Observatory Data(GHO)、世界銀行的資料庫、聯合國網站(能連結到很多重要統計網站或頁面)。

資料到手之後,需確定要檢索的資料目錄,掌握基本的分類,同時確定篩選的標準,要見到樹林而非樹木——從資料看概況而不是侷限在小範圍。
另外一場題為“新聞故事中使用資料的最佳方式”的分享中,來自IRE的Mark Horvit和Megan Luther逐步分析了資料視覺化作品當中最通用的資料使用法則。
關於使用資料,選定時間範圍非常重要,至少有3年左右的資料對比會更具可信度。
用時間軸展示資料,更容易被讀者理解;要想更快更準地選資料 ,就得明白資料庫資料的計算方法。
選取資料後,你還需要在資料分析之前做幾件事:先把資料備份,算算關鍵資料來驗證它們是否有效、合理,搞清楚每一行每一列的資料分別代表什麼。這裡有兩點非常重要,一是看看有沒有缺失的資料,並瞭解每一行資料的意義,這樣就能加快資料分析;二是清楚所選資料應該一共有多少行多少列,有些國家可能會隱藏部分資料,因此在使用之前一定要確認,以免作品中出現離奇資料,無法自圓其說 — 換句話說,你要確保資料是連貫的、計算的數字項是前後一致的。除此之外,也不要做資料假設。
資料分析完成後,最好記錄下工作流程和得出的結果,不要只儲存資料透視表(pivot tables)就草草了事。要把發現寫下來,建立備忘錄,並準備好接下來要做的事件清單,或為攝影師和網站等單獨建立工作清單。同時,應對照IT或資料講座、培訓分享的內容來確認自己做的對不對。提前考慮怎麼呈現資料,別等著呈分析完資料才開始,最好在分析過程中即有一定的預想和準備。
驗證你的資料分析。篩選分析出的資料包含項,或者使用不同的結構查詢語言,檢查你的主要發現和工作記錄,也讓其他人幫助你檢查資料。
單純的資料不等於好故事,把你的結果分享給例如資料來源機構的官員,以驗證自己的資料準確度,聽聽他們的意見。報告、檔案中的數字總數和單個數字相加的結果應該一致,與此同時,也要以其他相關資訊來驗證資料的有效性。
現在終於可以下筆寫新聞了!同樣,你不能對資料的使用過於大意:最好用表示程度的詞來描述數字,例如“至少”、“多於”、“大約”,以避免後面反覆修改。不要在一個作品裡使用太多資料,也不能過分推理自己的資料,只寫合理且得到驗證的結論。寫清楚資料的來源,列出你獲取資料的機構名稱。
此時,記者得不斷問自己:有哪些部分還不知道?會產生什麼錯誤?有沒有核查完所有的結果(資料的魅力在於它並不能直接開口告訴你錯在哪裡,而是會通過結果顯示出來)?是不是每一個資料元素(圖片、互動式效果等等)都能確切表達它應該表達的意思?我的發現是不是和所有人的認識相沖突(如果分析結果與通識完全相反,你的報導要麼精彩絕倫,要麼錯得離譜)?
你還需要一份最後檢查的清單:在採訪時,讓信源拼寫自己的名字和稱呼頭銜;記錄或者抄寫採訪資訊;反覆驗證可靠信源的言論;儲存連結和其他研究成果;詢問信源其他新聞報導有哪些不實之處,避免犯同樣的錯誤。d87239b9b1102d041c038d0d9f442a48
在提交之前,多重檢查可保證萬無一失。最後自己再多看看數字、計算方法、名字、頭銜、地點、對照筆記和記錄檢查筆記、定義、連結、拼寫和語法、語句引用等,計算機的拼寫檢查系統也會出錯,所以還是參考權威的拼寫建議(字典等)更保險。