近年來科技公司掌握了關於人們的大量資料,若它們落入壞人手中,可能帶來巨大危險。為了應對這種危險,歐洲頒佈了《通用資料保護條例》 (GDPR),給予使用者更大的“訪問許可權”。按照規定,任何公司都應向使用者提其收集和託管的個人資料。此外,這些公司應該以一種便於使用者及時閱讀的方式提供資料,並提供足夠的背景資訊,以便使用者瞭解公司是如何收集和使用這些資訊的。
GDPR的原意是,當使用者瞭解公司掌握了關於其哪些資料,就可以利用它來做出明智的決定,比如決定你是否想提供這些資料,並在他們未經使用者同意的情況下收集資料時,讓這些公司付出代價。
然而,問題在於,公司在提供這些資料時往往非常吝嗇。畢竟,如果它們的服務本質上是“強迫同意”(谷歌最近因此而被罰款5000萬歐元),那麼它們可能不想讓使用者輕易看到其收集了多少使用者的個人資料。科技記者約翰·波特(Jon Porter)決定測試四家在歐盟運營的最大科技公司提供的“訪問權”:蘋果、亞馬遜、Facebook和谷歌。他的發現表明,雖然使用者可以獲得原始資料,但實際上卻很難理解它們,也很難依據這些資料做出明智的決定。
按照英國資料保護監管機構ICO的規定,公司必須應使用者要求提供所有個人資料,即任何與個人相關的已識別或可識別資料。資訊必須以“簡明、透明、易懂和易於獲取的形式,使用清晰明瞭的語言”,以“常用的電子格式”提供給個人。這聽起來很簡單,但四大科技巨頭是如何做的呢?
最初,波特很容易下載了自己的資料。谷歌和蘋果的資料下載服務都可以讓你選擇要下載的資料。Facebook沒有,但這三家公司都很容易讓人在各自的網站上找到個人資料。與此同時,在亞馬遜上獲取資料則有點兒繁瑣,需要在該網站的“聯絡我們”頁面中挖掘,以查詢隱藏在列表末尾的選項。而波特等了30天才收到相關連結,以便下載其資料。
然而,當波特檢視收到的資料時,事情開始變得一團糟。有些檔案的標籤模稜兩可,而其他檔案的儲存格式則讓人頭疼不已。實際上,找出波特正在檢視的資料並不像想象的那樣簡單。
谷歌的位置跟蹤資料尤其難以理解。該公司曾多次因跟蹤安卓使用者而受到批評,即使他們關閉了作業系統中的主要位置跟蹤功能。歐洲七個國家的消費者團體已經就此向各自的資料安全監管機構提出了投訴,利用GDPR賦予的許可權下載個人資料,應該是可以檢查這些服務是否使用某些技巧來收集更多資料的方法,也應該是讓谷歌等公司承擔責任的一種手段。
但是當你實際檢視資料時,這些資訊卻很難檢視和理解。波特來自谷歌的所有位置資料都包含在61MB的JSON檔案中,並且使用Chrome開啟它時,卻顯示出令人困惑的欄位陣列,這些欄位標有“timestimpms”、“lattudeE7”、“logitudeE7”和關於其是坐在原地還是坐在某種交通工具中的評估。
波特表示,他毫不懷疑,這是谷歌已經關聯到其帳戶上的所有位置歷史資訊,但沒有上下文,這些資料沒有任何意義。他必須認真努力才能開始理解這些數字,並將其匯入到另一個軟體中以進行正確的解析。如果GDPR的目的是讓人們對從公司那裡收集的資料有更多的控制和理解,那麼谷歌下載的這部分資料幾乎沒有什麼用。如果你想把資料輸入到另一個系統中,JSON是很棒的。但是如果你想評估谷歌有多少資料並據此做出明智的資料隱私決定,它們就不那麼有用了。
當涉及到其他檔案時,波特甚至不清楚最初看的是什麼資料。位於ADS資料夾中、名為“My Activity”的4GB HTML檔案,可能向他展示了許多與谷歌收集到的廣告跟蹤資料相關的內容,但是這裡沒有註釋或後設資料來解釋它。
到目前為止,這些檔案是整個資料下載中最令人困惑的內容,也是最重要的檔案。它們包含了許多潛在廣告商想要得到的個人資訊,谷歌應該更加努力地解釋這些資訊的內涵。該公司已經提供了Index HTML檔案來概述使用者的資料,那麼為什麼不在其中包含有關每個檔案內容的資訊呢?
儘管仍存在問題,但蘋果在資料釋出方面的表現要好於谷歌。蘋果提供的大多數資料都是易於閱讀和理解的檔案型別,比如CSV、TXT和JPG,其中只有幾個JSON檔案。但是,當你進入這些檔案時,仍然有很多資訊是很難理解的。
比如名為“Apple ID帳戶資訊”的檔案,裡面似乎包含11條關於波特蘋果帳戶中幾乎相同的記錄,所有這些記錄都是在2014年完全相同的日期建立的,但蘋果卻沒有解釋它們是什麼。另一個標題模稜兩可的CSV檔案“Apps and Service Analytics”似乎包含了波特在App Store中每次搜尋的完整列表,但它的空單元格太多,當他看到6.7MB大小檔案時,才注意到其中有資料存在。
儘管能夠聽取所有的Alexa請求令人毛骨悚然,但亞馬遜在展示資料方面做得要好得多,不過這可能只是因為它對個人的支援相對較少所致。在大多數情況下,亞馬遜提供的檔案和資料夾都有明確的標籤,儘管該公司仍有些工作要做,以更好地標記其電子表格的內容。
具有諷刺意味的是,Facebook實際上擁有這四家服務中最容易理解的資料。首先,Facebook提供的每個檔案都是HTML檔案,每個文件都被分類到清楚標記的資料夾中,索引檔案為使用者提供每個文件所包含內容的概述。這些檔案本身有清晰的佈局和格式,瀏覽它們感覺就像是在Facebook上瀏覽一個頁面,儘管其中一個頁面完全儲存在使用者的計算機上。
Facebook的下載包括很長的索引檔案,為使用者顯示在哪裡可以找到其所有資訊
看到Facebook儲存的使用者個人資料數量時,令人感覺毛骨悚然,但至少你很清楚這些資訊是什麼,而不是根據每個檔案的內容來猜測。
在實驗結束時,波特在所聯絡的四家服務中找到近138GB的資料。其中,1.1GB來自Facebook、392MB來自亞馬遜、254MB來自蘋果。雖然谷歌有72.5GB的資料可供波特下載,但其中絕大多數是他的Google Drive和Google Photos的備份,分別為44.3 GB和25.7 GB。波特剩下的谷歌資料只有2.5GB。
在試圖梳理和理解所有內容後,很明顯,如果這些公司想要讓我們真正控制自己的資料,那麼它們和管理它們的GDPR法規還有很長的路要走。能夠下載資料是一回事,但要使它變得有用,就意味著要更加努力地確保下載的內容對於普通人來說更容易理解。至少,這意味著這些公司應該提供更好的索引來告訴使用者哪些資料包含在哪個檔案中,但也意味著它們能以自己的方式來組織這些檔案的內容。
來源:網易科技
宣告:本網站所提供的資訊僅供參考之用,並不代表本網站贊同其觀點,也不代表本網站對其真實性負責。
更多資訊: