只要手機開機,使用者的位置和行動可被標繪出來。這種資料會以匿名的方式被提供給第三方,從而讓使用者能獲得更好的服務,同時也能讓廣告主更加精確地找到目標客戶。但在《科學報告》(Scientific Reports)上的一份研究報告警告稱,人類的運動模式具有很大的可預見性,以至於僅靠4個資料點就能判定一名使用者的身份資訊。

 

手機和智慧手機應用的日益普及已經帶來了一個新時代。在這個時代中,海量的使用者資料已經變得能被那些管理和分發資料的公司所獲得——有些時候是以“匿名”或是聚合資料集的方式而公開的。

對於廣告主和服務提供商來說,這些資料非常有價值,但對其他人來說也同樣很有價值,比如那些正在規劃購物中心和分配應急服務的人,或是新一代的社會科學家等。但是,“位置服務”的蔓延和發展速度已經超出了人們的理解範圍,使其無法明確把握位置資料能如何對使用者隱私權和匿名造成影響。舉例來說,衛星導航廠商長期以來一直都在使用來自於手機和衛星導航服務本身的資料來改進路況資訊報告,具體方式是計算使用者在特定道路上正在以多快的速度前進。

在這些計算中所使用的資料都是“匿名的”——也就是說,這些資料不會包含手機號碼或個人細節資訊。但有一些例子證明,有名無實的所謂“匿名”資料能通過怎樣的方式與使用者身份聯絡到一起,其中最出名的例子是AOL在2006年釋出的一些資料,這些資料對2000萬次匿名的網路搜尋進行了概括。《紐約時報》在對這些資料略做“偵查”後發現,很容易就能判定其中一位代號為“4417749號搜尋者”的身份資訊。

移動軌跡

最近以來的研究工作日益表明,人類的運動模式無論看起來多麼具有隨機性和不可預見性,但在實際上這種隨機性和不可預見性的範圍都是非常有限的;事實上,運動模式能在某種程度上被作為一種“指紋”,讓人能判斷出人們的身份。《科學報告》上的最新研究報告指出,這些位置資料雖然只具備“低解析度”,但也仍舊能被用作識別人們身份的獨特標記。

麻省理工學院和比利時魯汶大學(Catholic University of Louvain)的研究者對150萬名使用者在15個月中的匿名手機記錄進行研究後發現,通過所謂的“移動軌跡”(mobility trace)——也就是每一部手機顯而易見的行進路線——只需要4個地點和時間點就足以識別出一名特定使用者的身份資訊。

“在二十世紀三十年代,你需要12個資料點才能排他性地鑑別和刻畫一個指紋。”這份研究報告的主要作者、麻省理工學院學者Yves-Alexandre de Montjoye說道。“我們在這次研究中所做的也是同樣的事情,只不過是通過追蹤‘移動軌跡’的方式來進行研究的。人類運動的方式和行為是如此獨特,以至於只需要4個資料點就足以鑑別出95%的人的身份。”

“我們認為,這種資料的可獲得性比人們想象中的要高。這些資料是指,舉例來說,如果你在手機上使用WiFi網路或是開啟任何應用,就會提供我們所說的那種移動資料。”de Montjoye說道。“當你共享資訊時,你會看看周圍,感覺身邊有許多人在——比如說在購物中心或是旅遊勝地——然後就會覺得這並非什麼敏感資訊。”

隱私權公式

這個研究團隊隨後又對這些資料需要具有多“高解析度”——也就是一個位置的精度——才能更加全面地確保隱私權的問題進行了研究,並得出了量化資料。報告的聯合作者之一凱撒·海德爾格(Cesar Hidalgo)稱,移動資料遵循一種天然的數學模式,能被用作分析引導工具,原因是更多的位置服務和高解析度資料已經變得可用。

“我們的想法是,在抓取這種資訊的解析度與匿名性之間存在一種天然的權衡關係,這種權衡所藉助的就是解析度和運動模式的獨特性。”海德爾格在接受BBC新聞頻道採訪時說道。“根據上最根本的問題就在於,由於現在資料已經具有較高的解析度,因此這種權衡就變成了資料的有用性多高與資料到底是否能夠匿名之間的關係。如果你所擁有的資料是在一天以內的,那麼交通流量預測服務就無法運作;你需要一個小時以內或是幾分鐘以內的資料。”

海德爾格指出, 想要把“移動軌跡”與某個人的身份資訊聯絡到一起,那麼就還需要更多的資訊;但是,使用者會通過帶有地理位置資訊的Twitter訊息以及Foursquare等地理位置“簽到”服務提供這種資訊。

但報告作者表示,他們的目的是要提供一種數學上的聯絡——也就是適用於所有移動資料的一個公式——從而量化匿名性與資料有用性之間的權衡關係,並希望這項研究工作能激發有關“大資料”與個人隱私權的優缺點的爭論。

國際隱私權保障組織(Privacy International)的山姆·史密斯(Sam Smith)說道:“我們的手機會向多個組織報告地理位置和上下文資料,而這些組織擁有不同的隱私權政策。”他向BBC新聞頻道表示:“我們從這種服務中所獲得的任何好處都遠遠不及這些趨勢對隱私權帶來的威脅。雖然我們被告知自己在提供多少資訊的問題上擁有選擇權,但在實際上,個人使用者根本就沒有什麼選擇權。”

“科學技術的發展讓我們更加難以生活在這樣的一個世界中:在這個世界裡,人們的隱私權會得到政府的保護,得到公司的尊重,得到個人的珍愛——現在的情況是,文化規範遠遠落後於科學技術的發展程式。”史密斯說道。

但de Montjoye則強調指出,雖然移動資料會讓人們對隱私權問題感到擔心,但這些資料所能帶來的利益則要大得多。“我們真的不認為應該停止收集或使用這種資料——對我們所有人來說,這種資料都能帶來非常大的好處,無論是公司、科學家還是使用者。”他說道。“我們已經在努力嘗試不要把這種情況描述為‘獨裁者’那樣的情景,也就是‘我們知道跟你有關的所有事情’。但有一點是不可否認的,那就是即使沒有姓名或電子郵件地址,個人資料仍舊可以被獲取,因此我們需要這種情況得到相應的對待。”