資料新聞熱從何而來
法國哲學家雷吉斯·德佈雷(Régis Debray)曾經提出這樣的論斷:人類社會從媒體的角度可以被定義為三個時代,即書寫時代、印刷時代和視聽時代。當下我們正處在第三個以視聽文化佔主導的時代,這是人類有史以來對自身所處社會了解途徑最多、範圍最廣、可接觸到的資訊最充分的時代。為了更好地滿足與生俱來的好奇心,人類自從發明語言文字起就不斷地追求著更好的資訊溝通手段。當然,簡單粗暴地將對新聞的追求和對好奇心的滿足畫上等號是不確切的,新聞對於人類社會的重要性遠大於此。新聞業的進步使當今人類能更好地知曉環境、獲取資訊、做出決策,而為了這個目的,人類一直走在追求更好的資訊獲取與傳播手段之路上,在工業革命之後建立起了今天龐大的大眾新聞媒介系統,包括從技術到體制,再到從業者的培養與傳承等一系列的完整體系。
早期的新聞業所依靠的是記者的觀察寫作與編輯的把關編排。誠然這比作為一門社會專業分工而存在的新聞業出現之前的道聽途說要來得真切可靠許多,但依然受從業人員個人因素影響巨大。隨著傳播技術手段的進步,新聞業在20世紀經歷了從解釋性報導到調查性報導,再到精確報導的歷史程式。這是一個主觀性漸減而客觀性漸增的過程,使人類在追求新聞報導盡可能地貼近社會客觀現實之路上大步前進。而進入21世紀以來,隨著計算機、網際網路、資料庫等技術的發展與普及,利用資料來挖掘新聞話題或輔助事件報導越來越普及;而最近大資料概念從網際網路產業向新聞業的擴散,也使資料新聞成為最熱話題之一。
資料新聞,或者叫資料驅動新聞,並非一種完全獨立的全新形式,其可以追溯到精確新聞、計算機輔助報導等早期報人追求新聞報導盡可能客觀的種種嘗試。20世紀60年代菲利普·邁耶開創了使用計算機進行精確新聞報導的先河,“將社會科學和行為科學的研究方法應用於實踐新聞的報導”。在這之後,計算機輔助報導逐步完善起來,得到廣泛應用,並在90年代之後出現了資料庫新聞等進一步的嘗試。但是,早期的資料庫新聞並不包括對資料的深度挖掘與分析,只是對原始資料的初步整合,用來對新聞報導文字進行輔助說明。
而資料新聞則是一次革命。與之前的嘗試不同,資料新聞的核心被正式放在了資料上,這裡的資料不是簡單的統計數字,而是廣義上的資訊,包括文字圖片、音視訊,乃至各種行為習慣、地理位置等。在資料新聞的工作流程中,資料被深度挖掘處理,基於一定的標準過濾重組,以視覺化的形式展示並講述新聞故事。在開源的資料新聞手冊中,資料被認作既可以是資料新聞的來源,亦可以是講述新聞故事的工具,新聞業者可以採用資訊圖表來以相對簡化直觀的方式報導一個複雜的故事。資料新聞結合了傳統的新聞敏感性、敘事說服能力和海量的資料資訊,最終創造出新的報導方式。
對資料新聞熱的冷思考
資料新聞時代,新聞從業者被寄予更新的要求,他們必須學會掌握通過對資料的搜尋、查詢、整理、總結與呈現來完成過去僅僅通過採訪即可完成的專業資訊蒐集工作。掌握了這些技術的記者在對於事實的洞察與報導方面將變得更加容易,他不再需要去四處打聽,也不需要去絞盡腦汁推測,在理想情況下對於足夠多與廣的資料的掌握將使得事實之上的遮蓋物不復存在。但這種理想狀況是否已經或者可以在近期的未來成為現實,現在看依然存在疑問。
資料新聞一方面抓住了技術進步帶來的新可能,另一方面也迎合了當下受眾的直接需求,但其本質依然應該是對社會事實的客觀報導,這就使得在解決了資料來源、分析、呈現等方面的基本疑問之前,我們並不能對其抱有過於理想化的態度。
1.資料從何而來
資料新聞賴以生存的根本是對資料的佔有,那麼資料來源則成了資料新聞實現精確和貼近客觀事實的重中之重。如同傳統新聞報導中的採訪環節,資料新聞生產的第一步在於資料的採集與挖掘。資料可分為結構性資料和非結構性資料:前者是指儲存在資料庫當中,有統一結構和格式的資料,如政府、企業公開的統計資料,具有一定的權威性和可信度;後者則是無法用數字或統一的結構來表示的資訊,如社交媒體上使用者的評論、關注的話題,購物網站上註冊使用者的購買記錄、產品喜好等。僅就資料來源而言,我們當前所能接觸到的資料很多時候並未達到真正的大資料標準,官方公開的資料也並不充分,社會渠道所採集到的資料也面臨侵犯隱私的指控,以及過於受商業利益擺佈的懷疑。可以毫不客氣地說,在這些問題解決之前,想依靠資料新聞來實現更為精確地反映社會客觀事實的目的只是一個烏托邦式的設想。
2.資料由誰來辨
毫無疑問的是,只要專業性的新聞行業存在,新聞報導的主體就不會完全從專業人士轉移到業餘使用者身上,不管他們是叫記者還是資料分析師。但是這裡同樣也有疑慮存在:如果主體依然是記者等新聞從業者,那麼他們如何能把握資料、駕馭資料、分析資料?如果主體轉移到資料分析師、程式設計師乃至一段電腦程式上去,那麼新聞的要素和特性該如何保證呢?又怎樣保證新聞專業主義繼續存在呢?
我國現有媒體從業者以文科背景為主,並不一定熟悉資料操作的相關規範,而在視覺化呈現的操作上也存在一定的困難。樣本的選取是否能夠代表總體、量表的信效度檢驗是否合格、問卷的設計是否嚴謹、內容分析的類目是否妥當,諸多統計學原理和資料分析軟體的操作遠非未曾和統計學打過交道的媒體人能完全把握的。
若讓程式設計師成為資料新聞的生產者,其又不具備傳統媒體人所訓練出的專業素養,對新聞敘事的把握則可能會顧及不到新聞的基本原則。“隔行如隔山”,資料要嫁接到新聞行業,還需要慢慢磨合。
3.資料如何呈現
資料本身是“不好看”的,受眾也懶得看大段的描述性文字,那麼資料就需要“視覺化”才能被普通受眾所接受。這其實是一個相當弔詭的概念,資料並非如字面上暗示的那般無形,只是大量的資料無法被方便地呈現在受眾面前。不管資料新聞的實踐者和研究者如何定義資料的視覺化概念,其根本上依然是某個主體對於事實的講述,只不過事實變成了經由各個渠道採集來的資料,講述者變成了資料分析師或圖表設計師。而在浩如煙海的資料的處理中則很難避免主觀性偏倚以及對相關性和因果性的混淆。例如在網易“數讀”的一篇資料新聞《全球百城聲譽排行:中國城市排名落後》中,以圖表形式將全球百城進行了得分排名,雖然後面附以短文對這一調查稍作了介紹,但這一評分考量的方面都有哪些,不同方面的權重如何,受眾則不得而知。這種只見結果不問過程的“視覺化”是對新聞真實性的背棄,這樣的“資料新聞”其實已經不能算作新聞了。
結 語
新聞的主要關注物件依然是人和人的社會,對於資料和計算機程式的依賴不宜過高。過於強調工具理性主義最終會使我們迷失本心,通往烏托邦的指路牌往往會將人帶入歧途。在大資料熱潮下,希望新聞從業者和我們的社會都能不忘初心。但是我們依然有足夠的理由相信,技術進步帶來的社會進步是需要發展的時間與空間的。假以時日,經過試錯,人類對於自身所處的環境與社會的客觀認知定將被更好地實現。
參考文獻:
①喻國明等:《新聞傳播的大資料時代》[M],中國人民大學出版社,2014年版
②丁邁 金梅珍:《資料新聞:基於創新思維的新樣態》[J],《青年記者》,2014年7月下
③喬納森·格雷、露西·錢伯、莉蓮·博納格魯編:《資料新聞手冊》[EB/OL],http://datajournalismhandbook.org/chinese/intro_1.html
④塗子沛:《大資料》[M],廣西師範大學出版社,2013年版
(作者為中國傳媒大學傳播研究院博士生)