“資料是一項有價值的國家資本,應對公眾開放,而不是把其禁錮在政府體制內。”

–美國聯邦政府

作為大資料的策源地和創新引領者,美國大資料發展一直走在全球最前面。

此中關鍵:

1、動力

首先是多年的技術沉澱和創新積累,包括從計算機革命開始以來的矽谷創新力和影響力,以及一大批的領軍企業,包括谷歌、微軟、EMC、SAP、微軟這樣的巨頭,也包括像Facebook、Splunk、Teradata這些創新的公司,矽谷精神和創新力量在美國大資料發展方面的作用,是任何其他國家短期都無法複製和匹敵的巨大力量。

而且,自上世紀以來美國國會、政府先後出臺一系列法規,對資料的收集、釋出、使用和管理等諸環節都做出了具體的規定。經過幾十年的修改完善,如今美國資料、信用和隱私已形成較為成熟的法律框架和道德規範。2010年,美國國會通過更新法案,進一步提高了資料採集精度和上報頻度,使得美國資料採集和匯聚體系更加成熟。

美國企業也擁有對於資料重視和應用的歷史傳統,IT基礎設施的完善,以及各種精準營銷理論和實踐美國都是走在世界前列,比如基於消費資料、信用卡資料探勘的精準營銷等,還有電話、DM印刷品和郵件營銷在美國都很興盛,隨著網際網路興起,谷歌、IBM、YAHOO等美國企業對基於網路的精準營銷又是走在全球的前列。因而大資料最典型案例中,就包括傳統企業沃爾瑪“啤酒+尿布”案例,以及谷歌公司通過大資料分析成功地預測流感爆發等。

更加重要的是美國政府資料開放和支援力量。美國政府的資料開放一直是走在全球前列的,尤其是在奧巴馬政府簽署《透明和開放的政府》檔案之後。2012年5月美國數字政府戰略釋出,更是提出要通過協調化的方式,以資訊和客戶為中心,改變聯邦政府工作方式,為美國民眾提供更優公共服務。其中關鍵,就是政府必須保證美國民眾可以隨時隨地通過任何平臺或裝置獲取政府資訊和公共服務。

2、資料開放

美國最重要的資料開放平臺就是奧巴馬政府在2009年推出的Data.gov,Data.gov也是美國“開放政府”承諾的關鍵部分。依照原始、地理資料和資料工具三個門類,截至2012年11月,Data.gov共開放出了388529項原始資料和地理資料,涵蓋了農業、氣象、金融、就業、人口統計、教育、醫療、交通、能源等大約50個門類,彙集了“從家庭和企業能耗趨勢分析到全球實時地震通知等,甚至還可以查詢從好奇號火星漫步者發回來的資料中得知火星的天氣情況”。為方便公眾使用和分析,Data.gov平臺還加入了資料的分級評定、高階搜尋、使用者交流以及和社會交網站互動等新功能,比如在Data.gov上提供的白宮訪客搜尋工具,不僅能夠搜尋到訪客資訊,並可以將白宮訪客與其他微博、社交網站等進行關聯,進一步增加了訪客的透明度。

為了更方便民眾使用,方便應用領域的開發者可以利用這些資料開發應用滿足公共需求或者進行創業,Data.gov還彙集了1264個應用程式和軟體工具、103個手機應用外掛。另外,Data.gov還發布了政府API索引,使得這些資源可以更易找到和便於使用。通過開放API介面,Data.gov讓政府的資訊和服務交付更加便捷,也讓公眾和企業家在構建更佳政府、提升服務的過程中成為合作伙伴。美國政府也希望並鼓勵公眾(開發者、創業者和企業家)能夠積極加入進來,成為這一程式中的一部分。據報導有很多的公司已經利用data.gov上提供的氣象資訊來提供服務,另外一些公司則基於data.gov上的地理位置資訊,提供基於位置的服務來盈利。

今年起美國還和印度一道,對data.gov實行了開源,把程式碼託管到GitHub上以供各國的開發者使用或者根據需要修改。通過構建OGPL平臺,提供開源的政府平臺程式碼並允許任何城市、組織或者政府機構建立開放站點,美國政府可以進一步推動資料開放運動程式。美國政府還成立了“數字服務創新中心”,開發了Sites.USA.Gov網站來幫助各機構建設即插即用型網站,同時政府出臺移動應用程式開發專案,幫助各機構對移動應用程式進行規劃、測試、開發和釋出,確保更加安全和高效。

美國政府提出,資料是一項有價值的國家資本,應對公眾開放,而不是把其禁錮在政府體制內。例如在美國fedspending網站上,公眾能夠逐條跟蹤、記錄、分析聯邦政府每一筆財政支出。另外,美國政府資料開放也跟美國民眾對於個人隱私和自由的重視和立法分不開的,正如塗子沛在《大資料》一書中所指出的,和美國人“用納稅人的錢收集的資料應該免費提供給納稅人使用”觀念也密切相關。

3、資料服務

為了確保美國民眾能方便快捷地找到政府服務欄目,美國在各聯邦政府層面實施了“數字分析專案”。“這是政府IT部門第一次摸清公眾都在網站上尋找什麼資訊、在哪裡尋找這些資訊,以及他們是否能夠順利找到資訊等情況。”政府IT部門還對聯邦政府網站在移動裝置上的使用進行了優化,並開發了移動應用程式,確保美國公民隨時、隨地、通過任何裝置都能獲取政府資訊。例如,美國人力管理辦公室開發的USAJobs應用程式,可以方便求職者通過移動裝置查詢和申請職位;交通部開發的SaferBus應用程式,可以讓老百姓查詢到公交公司的安全行駛記錄,也可通過手機提交投訴建議。

佛羅里達州邁阿密戴德縣將數十種關鍵縣政工作和邁阿密市緊密聯絡起來,幫助政府在制定治理水資源、減少交通擁堵和提升公共安全等方面決策時提供了更好的資訊支撐;美國中央情報局的技術長格斯·漢特在舊金山舉行的一次討論會上解釋的大資料技術對追蹤恐怖分子和監控社會情緒的作用。漢特認為,就像可口可樂等消費公司藉助資料分析掌握消費者習慣一樣,中情局也通過大資料技術來尋找恐怖分子的蹤跡。西雅圖兒童醫院通過應用視覺化資料分析技術,有效減少了醫療事故,幫助醫院節省了300萬美元的供應鏈成本。華爾街“德溫特資本市場”公司則通過分析3.4億微博賬戶的留言,判斷民眾情緒,並依據人們高興時買股票、焦慮時拋售股票的規律,決定公司買賣股票的時機,從而獲取盈利。這些都是美國大資料各個領域應用的典型案例。

4、推進

開放資料、創新驅動以及技術研發支援下,美國大資料的研究和應用已是走在全球前列。2013年5月,奧巴馬政府更是宣佈了“大資料的研究和發展計劃。”提出“通過提高我們從大型複雜的數字資料集中提取知識和觀點的能力,承諾幫助加快在科學與工程中的步伐,加強國家安全,並改變教學研究”。根據這一計劃,美國希望利用大資料技術在多個領域實現突破,包括科研教學、環境保護、工程技術、國土安全、生物醫藥等,具體的研發計劃涉及了美國國家科學基金會、國家衛生研究院、國防部、能源部、國防部高階研究局、地質勘探局等6個聯邦部門和機構。在史丹佛這樣的大學裡也開始開設諸如機器學習這樣全新的課程,培養下一代的“資料科學家”。伯克利加州大學、迪肯大學等大學也專門開設了研究大資料的相關課程。如今,美國不僅是全球首個將大資料從商業行為上升到國家意志和國家戰略的國家,也是資料科學家和麵向未來的大資料人才儲備啟動最早的國家。

2013年2月27日,由TechAmericaFoundation釋出的一項新研究顯示,87%的聯邦政府IT官員以及75%的州政府IT官員均認為,大資料對政府工作發揮著立竿見影的實際作用。而由民意調查機構PennSchoenBerland進行的調查顯示,在受訪的近200位聯邦IT官員中,有83%的聯邦政府IT官員表示“大資料解決方案可幫助政府削減至少10%的聯邦預算”,這些受訪官員還相信,“大資料還能通過改善醫療服務,創造挽救生命的奇蹟,並可以降低犯罪率並提高生活品質”。

美國商務部CIOSimonSzykman表示:“(在美國)我們不存在挑戰的領域之一就是我們生成資料的能力。我們生成資料的基本能力提升很大,從很大程度上講,這一能力已超越了我們處理資料、管理資料和轉移資料的能力。”他認為如何管理資料,並將資料從一點轉移到另一點,將是美國政府面臨的一大挑戰。