大資料能夠改變我們看待世界的方式,在華盛頓這周有許多專家共聚一堂探討一些有關大資料的問題。下邊是一些他們提及的一些參考例子。

聯合國全球脈搏組織配圖

聯合國建立了全球脈搏,主要目的以更好地方式利用大資料,使各個行業能夠更快和更好的對人道主義危機做出最全面最最廣泛的響應。圖有聯合國提供

作為一個術語和一種概念,如果你不是每天和大資料打交道,那麼大資料對於你來說是相對陌生的。即使在業內專家裡,關於大資料的定義也是激烈爭論的話題。對於一些人來說關鍵的特徵是資料庫的容量,對於另外一些人來說關鍵特徵是資料的複雜性,也有些人說是資料的集中和分析速度。對於你我來說,可能大資料最好的理解方式就是無窮大的資料量,這些資料由一些企業,政府或者一些大的組織團體,他們的一些活動能夠影響到數以萬計的人。在臉譜(譯者注:美國最大的一個社交網站,類似於中國的新浪微博)裡大資料用於處理你的好友推薦,亞馬遜裡是用於推薦購物,還有就是移動手機網路能夠提供給你免費的地理位置。

這些資料庫,比如每一個零售商的銷售詳單是帶有鬆散格式儲存的,這些將來都需要有一個統一的格式。然而對於一些和大資料不相關的商業公司可能不太在意大資料的存在。現在大資料的意義已經有著非常清晰地增長,它將一直對世界產生著非常有意的影響。

下邊是一些參考的列子。

欺詐識別

對於政府希望消減赤字來說,稅務欺騙正在日益的被關注,這時大資料可以用於增加政府識別詐騙的流程。在隱私允許的地方,政府部門可以綜合各個方面的資料比如車輛的登記,海外旅遊的資料來發現個人的花費模式,使稅務貢獻不被疊加。同時一個可疑的問題出現了,這並沒有直接的證據指向詐騙,這些結論並不能用來去控告個人。但是他可以幫助政府部門去明確他們的審計和其他的稽核以及一些流程。

醫療保健和醫學

在醫學的歷史上,人類基因的序列化無疑成為了人類最偉大最有意義的進步。現在人們有了把人類基因檔案序列化的能力,這允許醫生和科學家去預測病人對於某些疾病的易感染性和其它不利的條件。主要是減少治療過程的時間和花費,如果沒有了大資料,這一些都顯得無從談起。

提高在大資料收集,儲存和分析工具效能和速度已經把花費從20億美元降到了2000美元,將時間從十年縮短到了一個周。不管怎麼說這些效益的增長隨時都會發生,這些大跨度收益已經被一些雲端計算服務提供商完全實現了。雲端計算服務提供商有微軟,亞馬遜和美商天睿

人道主義的轉向力

在2011年聯合國建立了聯合國全球脈搏,最基本的目的就是在大資料的時代要以最佳的方式去利用它,使聯合國組織能夠作出更快和更好的方式去應對人道主義危機。在印尼和美國,這個工程利用社交媒體去追蹤公眾關注的問題,這已經展示了非常大的價值,最為一個整體來說這個價值是體現在應對危機反應和社會科學研究。

同時有其他的組織也在朝著這個方向努力,包括DataKing,早年公司創始人傑克在倫敦領導建立了資料驅動,在這裡為了提供分析驅動解決方案的問題,資料科學家與慈善機構通力合作。美國的一個組織aWhere正在實施類似的工作,在一個一流的專案中,使用來自衛星影像中的資料,在發展中國家去尋找和匹配積水池,這些積水池可能就是一些瘧疾攜帶蚊蟲滋生的溫床。

隱私

這些資料經常含有一些詳細的潛在的能夠展示有關我們的資訊,逐漸引起了我們對個人隱私的擔憂,一些處理大資料公司需要認真的對待這個問題。例如美國天睿資訊給人留下比較深刻印象的是他的一個科學家提出,我們不應該簡單地服從法律方面的隱私保護問題,這些遠遠不夠的,公司都應該遵從谷歌不作惡的原則,甚至更應該做出更積極的努力。這種觀念與昨天英國資料科學家鄧肯羅斯發起的“做好事與分析”的承諾的主旨完全吻合,鄧肯羅斯現在引領者英國的大資料分析。簽署國承諾考慮到他們分析和使用資料的影響,他們願意去幫助更多的受益者。充分披露:以犧牲天睿資訊歐洲、中東和亞洲的會議,我在華盛頓花費了四天的時間參加天睿資訊合作會議。