華盛頓——隨著數字通訊量在過去10年中爆炸式地增長,追蹤恐怖分子的美國分析師為了尋求處理大量電話記錄、電子郵件和其他資料的新方法,求助於矽谷的計算機專家,這些專家曾建立了複雜的方程,阻止了俄羅斯黑社會進行信用卡欺詐的企圖。

為此,國家安全域性(National Security Agency,簡稱NSA)和其他情報界部門與技術公司建立了合作關係,加利福尼亞州帕洛阿爾託的帕蘭提爾技術公司(Palantir Technologies)就是其中的一個,帕蘭提爾由一群來自貝寶(PayPal)的投資者建立,他們正忙於解開“大資料”(Big Data)的祕密。

如今,軟體技術的革命使對規模巨大的數字資訊進行自動及瞬時的分析變成可能,也給NSA帶來變化,使其成為美國人乃至外國人數字資產的事實上的擁有者。這些新技術有史以來第一次使美國間諜能跟蹤世界上幾乎任何地方的人的活動和往來,而無需實際監視他們或監聽他們的對話。

新的爆料揭示,NSA一直在祕密地獲取數百萬美國人的電話記錄,還從9家美國網際網路公司得到外國人的電子郵件、視訊和其他資料。爆料為了解美國這家最大的情報機構不斷增長的能力提供了罕見的一瞥。

為了能利用每天產生的堆積如山的新資料,在幾乎沒有公眾討論的情況下,NSA在迅速擴張。在過去10年裡,政府給該機構投入了數十億美元的資金,在猶他州的山區修建了一座面積達100萬平方英尺(約合10萬平方米)的城堡,顯然是用來無限期地儲存巨量的個人資料。前業界和情報官員稱,NSA在美國各地建立了竊聽站,並幫助建造了一臺世界上最快的計算機,以破解保護資訊的編碼。

有人曾一度認為網際網路流通的資料量太大,以至於超出NSA的分析能力,然而,最近的爆料顯示,該機構的能力遠比大多數局外人所認為的要強。美國全國研究委員會(National Research Council)的電腦科學和通訊專家赫伯特·S·林(Herbert S. Lin)說,“5年前,我會說他們沒有能力監視網際網路流量中的大部分。”現在他說,看來“他們已經接近這個目標。”

上週六,人們得以看到他們到底有多接近。一份由《衛報》(The Guardian)援引的NSA檔案,展示了一張“全球熱度圖”,該圖看似表示了NSA從世界各地汲取的資料量。比如它顯示,2013年3月總共從全世界網際網路上收集到970億條資料;其中14%來自伊朗,有許多來自巴基斯坦,另有約3%來自美國本土,不過其中一些可能是流經美國伺服器的外國資料量。

重點的轉移

資料專家稱,該機構有效地挖掘後設資料的能力,已經使竊聽和偷聽通訊內容的重要性大大降低。後設資料指的是關於誰在打電話或發郵件的資訊。

“美國法律和美國政策把通訊內容視為最為私密且最有價值的,但這在今天已經過時了,”總部在華盛頓的電子隱私資訊中心(Electronic Privacy Information Center)的負責人馬克·盧騰伯格(Marc Rotenberg)說。“如今,與通訊關聯的資訊遠比通訊內容本身更重要,那些從事資料探勘的人都清楚這一點。”

美國法律限制竊聽和偷聽美國公民通訊的實際內容,但對於打電話這個行為所產生的資料只有很少的保護。而且,對於其他與電話無關的資料,例如用信用卡付帳,幾乎沒有法律保護。

當不同的資料流被整合到大型資料庫中後,例如把使用手機的時間和地點與信用卡購物、或使用E-ZPass電子收費系統的資料相匹配,情報分析師能獲得一個人生活的不同側面,而在過去,僅靠偷聽他們的談話絕對無法得到這麼多。《自然》雜誌(Nature)上發表的一項研究顯示,有關打一次行動電話的地點和時間的僅僅四條資料,足以在95%的情況下確定打電話者的身份。

“我們能發現各種各樣的關聯和模式,這方面的技術已有重大的進展。”一名為政府工作的電腦科學家說,由於沒有獲准作公開評論,這位人士要求匿名。

保密專案

2001年10月,喬治·W·布什(George W. Bush)總統祕密啟動了國家安全域性的無授權監聽專案,在無需獲得法院授權的情況下監聽美國公民的國際電話和電子郵件,與這個專案同時進行的是大規模的資料探勘活動。

這些保密專案導致了2004年3月在時任司法部長約翰·阿什克羅夫特(John Ashcroft)病房裡的一次較量,較量的一方是布什的白宮官員,另一方是司法部(Justice Department)和聯邦調查局的幾個官員。願意讓無授權監聽進行下去的司法部律師辯稱,是資料探勘引發了更多與憲法有涉的擔憂。

阿什克羅夫特病房裡的對峙發生前的一個月,哈佛大學的本科生馬克·祖克伯(Mark Zuckerberg)創立了Facebook;Twitter的創立是在兩年多以後。蘋果的iPhone和iPad當時還不存在。

電子前沿基金會(Electronic Frontier Foundation)技術分析師丹·奧爾巴赫(Dan Auerbach)觀察說,“越來越多的像谷歌(Google)和Facebook這樣的服務,正在變成資訊的大型中央貯藏庫。它們所貯藏的大批資料,對執法機構和情報機構來說,是具有極大吸引力的目標。”

據行業分析人士稱,長期以來,情報機構一直是對高階計算和資料探勘軟體需求最強烈的客戶之一,近年來尤其是這樣。一名曾擔任技術高管的人士說,“他們對你說,某地有一個美國人將要被炸死,唯一一個能阻止爆炸發生、讓他活下去的人就是你。”

根據IBM公司的估計,由於智慧手機、平板電腦、社交媒體網站、電子郵件和其他形式的數字通訊的廣泛使用,全球每天產生250億億位元組的新資料。

據IBM估計,在全球現存資料中,有90%是過去兩年中產生的。根據國際資料公司(International Data Corporation)的一項研究,預計從現在起到2020年,數字世界的規模將每兩年翻一番。

和爆炸性的資料增長相伴隨的,是分析這些資料能力的快速進步。

IBM的“沃森”(Watson)是一個最好的例子,它展示了資料密集型的人工智慧的強大力量。“沃森”是一臺超級計算機,在2011年擊敗了《危險邊緣》(Jeopardy!,美國的智力競猜節目——譯註)的人類冠軍。

分析人士說,“沃森”式的計算,正是處理海量資料所需的技術,它能即時分析網際網路通訊資料,發現可疑的線上行為模式,因此能縮小恐怖分子的搜尋範圍。

一名曾給政府提供諮詢的顧問說,過去兩年裡,NSA和中央情報局(Central Intelligence Agency)都在測試用“沃森”,因為他未獲準公開談論此事,所以要求匿名。

三邊測量法

業內專家說,情報部門和執法機構還在使用一種被稱為三邊測量法(trilaterization)的新技術,它能夠從一個時刻到下一個時刻地跟蹤人的位置。從手機蜂窩塔得到的資料能夠跟蹤一個人所在的海拔高度,精度足以確定該人在某棟建築的某一層。甚至還有軟體能夠通過分析手機資料,尋求預測一個人最可能採取的路線。網路和資料中心專家亞歷克斯·菲爾丁(Alex Fielding)說,“這是極端的‘老大哥’(英國反烏托邦小說《1984》中監控全體國民的獨裁者——譯註)”。

最近披露的訊息沒有證據表明,NSA的竊聽者對普通美國人的竊聽違反了法律。上週五,奧巴馬總統為國家安全域性收集電話記錄和其他後設資料的做法辯護,稱其不涉及偷聽談話內容、或閱讀電子郵件內容。

然而,隱私權倡導者說,必須進行全國討論,以制定新的法規,來限制情報界對大量新資料的獲取。

盧騰伯格說,“那種認為政府能繳獲如此大量的資訊,卻不會影響美國公民享有的憲法第四修正案(Fourth Amendment)權利的想法,有點是幻想。”他指的是美國憲法所規定的有關免於不合理的搜查與扣押的權利。