導讀:《時代週刊》最新一期封面文章稱,我們每天被資料海洋淹沒,只有讓冷冰冰的資料形象化,變成看得見摸得著的東西,我們才能從中挖掘出意義。
威廉-普萊費爾(William Playfair)生於1759年,在家裡排行老四,父親是上進的蘇格蘭大臣。他年紀輕輕便當上瓦特的個人助理,隨後從事製圖、會計、工程、經濟、銀匠、土地投機、記者等多種職業,取得大小不等的成功。最終他在貧困中去世。
不過在此過程中,他差不多是不聲不響地一手創立了統計圖表學,發明了柱狀圖、線形圖和扇形圖。1786年他出版《商業和政治地圖集》,該書以一副英國曆史進出口圖開場,放在今天的話與本刊的排版看上去並不太脫節。用他自己的話說,“普萊費爾是將幾何原理用於財政事務之第一人”。
他生不逢時。如果他活在當今時代,普萊費爾很可能身居矽谷一家受熱捧創業公司的首席資料官高位。我們周圍的世界發生著看不見但影響巨大的轉變,即從資訊稀缺到資訊過剩的無聲顛覆。人類進化首先面臨的是食物短缺,如今我們卻遭受著普遍肥胖之苦。
與之大同小異的是,過去我們獲得資訊很困難,現在到處都是海量的資訊。谷歌[微博]前CEO斯密特曾經估計,人類每兩天所創造的資料量就相當於有史以來到2003年的資料量總和。他說這話是在五年前。我們從認識上還未進化到這一步。
估計人類創造的總資料量是技術人員的一大愛好。確切數字雖然各不相同,但誰都承認大得驚人。只需想想你的智慧手機就夠了:沒錯,它是一個通訊裝置,但它也是把你周圍的世界轉化為資料的工具。你看到某個東西,把它拍下來或者錄下來,然後上傳到雲端,以位元組的方式永遠存在。每一天人們釋出五億條推文,在Instagram分享7000萬張照片,在Facebook觀看40億條視訊。每一分鐘我們向YouTube上傳300小時的新內容。
創造資料的不僅是人。還有被稱為物聯網的新現象。汽車、自動售貨機、眼鏡、計步器等裝上感測器和傳輸器,與雲端或彼此之間通訊。這些物體也像人類一樣在數字世界留下痕跡。市場研究機構IDC在2014年的報告中估計,數字世界的規模將從2013年的10萬億吉位元組增長到2020年的44萬億或44澤位元組。
我們擁有豐富的資料,但從中獲得的回報卻迅速減少,因為擁有的資料越多,就越難從中挖掘出意義。頗具諷刺意味的是,資訊過多差不多也像資訊不足一樣難以分析和理解。於是,新技術讓我們的世界充斥著越來越多的複雜資訊,我們最終就越需要有著悠久歷史的人類努力,即始終致力於使複雜的東西可以理解、從混亂中求得意義的藝術,尤其是視覺藝術。
正如普萊費爾所發現的那樣,超過某一界限挖掘資料意義的最佳辦法就是使資料形象化。試想Instagram的海量照片。去年紐約市立大學教授曼努維奇(Lev Manovich)對來自紐約、聖保羅、柏林、曼谷、莫斯科5座城市的12萬張照片進行了視覺分析。他和他的研究團隊從中選取自拍照片,估計照片上的人的年齡和性別。然後他們對照片運用面部分析演算法,對所有資料進行統計分析,最後放到selfiecity.net製成互動圖表。
結果這些毫無意義的原始資料現在具有了意義。你可以按照城市、性別、心情、是否歪腦袋、是否戴眼鏡、睜開還是閉上眼睛瀏覽照片。你可以提出問題並得到答案:誰自拍用的多,男人還是女人?(答案是女人)。哪裡的人笑得最多?(曼谷)哪裡的老年人愛自拍?(紐約)……
如果你把資料形象化看作我們抵抗資訊海洋的防洪堤,那麼隨著資料日益增多,防洪堤的壓力總是不斷上升,而壓力上升又改變了資料形象化的方式和作用,這一點甚至普萊費爾也不曾料到。
形象化從對統計資料集的分析呈現發展為實時資料的不斷變化圖景。在Bostonography你可以像上帝一樣鳥瞰波士頓所有按照當前時速進行顏色編碼的公交車位置。Crimemapping.com實時顯示按照報案地點分類的案發地情況,用不同表情符號代表不同性質的案件。fbomb.co網站提供上推特的人何時何地如何說國罵的全球實時圖景。
從“紐約出租:生命中的一天”(NYC Taxis: A Day in the Life)可以得見美觀、免費的資料豐富性。一位名叫Chris Whong的黑客根據《資訊自由法》從計程車與電召車委員會(TLC)下載50G紐約市計程車資料,利用這些資料製作了2013年某一天任意計程車的路線和收入圖。你可以選擇一輛車快進(或以正常速度——如果你有時間)觀看它在曼哈頓大街上行駛,像勤勞的小精靈吃豆子那樣在身後留下一條藍線。
資料形象化並非總是為了鬧著玩。今年4月30日在Kickstarter釋出的一個眾籌專案將從OpenSecrets.org抓去競選資金資料並以多種方式自動影像化,清楚、簡潔地顯示政治家獲得的資金數量和來源。這是超越透明性的下一個必要步驟:不僅公佈資訊,而且要公佈該資訊的意義。今年資料影像化最引人注目、最具革命性的實驗之一是紀錄片製作人、資料專家霍洛蘭(Neil)的“二戰死難者”(The Fallen of World War II)互動視訊。該實驗利用圖表影像講述歷史:表示成千上萬死難者的幾乎獨家的抽象資料形象化地帶領我們回顧二戰和“大屠殺”。
視訊六分鐘左右鏡頭急劇仰拍現出摩天大樓似的柱狀圖,表示前蘇聯軍隊870萬人的傷亡。初一看似乎極不可能,但隨著鏡頭回搖,在二戰的巨大災難中又合情合理。在這種不動聲色的敘述中,人類的死亡更顯觸目驚心。
之後的視訊同樣攝影手法反覆出現:冷冰冰的抽象資料變為視覺藝術,讓我們感同身受,增加知識。現階段人類遭遇普萊費爾也發現無法理解的海量資料。我們也覺得資料多得無法理解,而這些資料又可能使得我們的世界不可理解。不過我們並非毫無辦法。資訊不僅需要自由,它還需要看得見摸得著。