海量的資料掛牌交易,對於市場秩序和交易雙方,就充滿了法律風險;而且,從社會公正的角度看,還極易損害被記錄主體的一些公民基本權利,包括人格權與財產權,影響到民眾的醫保、生育、就業和人身自由權。
今年,大資料領域迎來了一個里程碑的日子。4月14日,我國第一個大資料交易所在貴陽掛牌,並完成了第一筆交易。買賣雙方都是有名的企業和機構,雖然資料內容和交易金額不詳,資料交易的前景據說十分輝煌。有關方面預測,未來三至五年,貴陽交易所的日交易額將突破一百億元,而整個交易市場可望達到萬億元級別!業內人士稱:貴陽交易所是大資料金字塔頂端的一顆「明珠」,「不但開啟資料交易的『貴陽模式』,更將補齊全國大資料產業鏈的關鍵一環,為整個行業掀起一場革命」(見《貴陽日報》2015年4月15日頭版)。借這個交易所,資料產業向世界正式宣佈:「龐大資料的生產和交換,使資料從抽象概念中逐漸剝離」,「資料這個飄在雲端的枯燥概念,終於走進現實,變為貨真價實的商品。」畫龍點睛,「資料商品化」正是整個事件的關鍵詞。隨著網際網路技術更新換代,資料的大規模採集和分析使用,已是人們生活的常態。高階分析算式的研發,使抽取資料中藏著的有用資訊成為現實。於是資料的魔力大放異彩,給我們帶來了夢寐以求的便利。
例如,商家彷彿鑽進消費者肚子裡的孫悟空,你才轉了個念頭,電腦和手機就奇蹟般地開始推送相關的商品廣告了。真應了那句老話:心想事成。當然,我們也添了許多聞所未聞的麻煩,比如剛接通一個免費WiFi,銀行賬戶資訊就莫名其妙地洩露了。電視臺天天報導,告誡大家警惕。但在市場弄潮兒眼裡,資料還有更為奇妙的神功,那就是取之不盡、用之不竭的廉價原材料——後設資料。後設資料追蹤著我們的生活,一刻不停又無處不在,彷彿一座座富礦,等待著算式處理、點石成金。多少人想挖掘這富礦……現在,終於打通了礦井,而那最後的爆破就是:資料商品化,公開合法的交易。
然而,要把資料交易這顆「明珠」穩穩當當地放上資料產業金字塔的頂端,尚有一道難題需要回答:資料要當做商品,它的所有權何在? 一樣東西之成為商品,一是因為它有某種使用價值,如飲食、觀賞、製作工具等;二是因為有人拿它來買賣,即實現其可交換的價值。如此就有了價格和市場。一般來說,商品的產權清晰,買賣才做得成。明確的所有權(ownership)歸屬,是商品參與市場交易的前提條件,而所有權的界定有賴於一套穩定的社會道德倫理和法律規範;否則就難以有效行使產權,包括市場交易,併合理合法地解決相關的糾紛。顯然,資料作為商品,也不例外。不幸的是,資訊時代雖然來臨,資料的財產所有權卻一直缺乏規範,滯留在法律的灰色地帶。因此,海量的資料掛牌交易,對於市場秩序和交易雙方,就充滿了法律風險;而且,從社會公正的角度看,還極易損害被記錄主體的一些公民基本權利,包括人格權與財產權,影響到民眾的醫保、生育、就業和人身自由權。為了降低並管控這些風險,我們有必要研究一下資料所有權的歸屬,對資料商品化,即新產權的攫取和擴張可能帶來的社會後果考察一番。
資料的所有權到底該歸誰?如,你在網上購物生成的資料,產權屬於網店、網上購物平臺提供商,還是你自己?患者就診,病史資訊歸病人、醫院,還是醫院的電腦系統提供商?社保個人賬戶資料,屬於參保者、政府、共同基金,抑或網路系統外包商?這是迴避不了的問題,現行法律規範和學說卻顯得捉襟見肘,拿不出有說服力又便於操作的答案。為什麼呢?我們仔細思考便會發現,那困境的起因,在於資料的不同尋常的價值特徵,或者說,在於它正在獲得的市場新身份——商品。 資料,若是指記錄下來的一組資訊,並不是什麼新鮮事。自人類發明了記錄工具和手段,如文字元號、紙張和硬碟,資料就一直伴隨著我們。歷史上,所有權不太受關注,是因為資料一般不會被當作商品,不參與市場交易;私下或非法的付費(如賄賂和諜報活動)不算。網際網路技術大規模開發了資料的價值,資料商品化,所有權問題才凸顯了。
作為商品,資料具有類似無形財產的特徵,可以無限複製而無損耗;其所有權、許可使用、收益和轉讓,都依賴法律的保障。一般認為,無形財產的權屬界定有一個特點,初始所有權與財產的生成及價值起源掛鉤。例如,文學藝術作品的版權首先屬於作者,因為作品是透過作者的勞動才產生,並有了價值。同樣的素材,讓不同的作者來創作(包括集體創作),作品的內容風格可以千姿百態。這說明,作品蘊含了作者的思想人格。所以,現代法律才把無形財產的初始所有權視為創作的果實,並把作品價值歸於作者的人格和創造性勞動。恰恰在這一點上,資料與別的無形財產如版權,分道揚鑣了。 我們知道,跟文藝創作和技術發明不一樣,資料的價值不是因記錄者的製作而起的。資料只有忠實於被記錄主體,準確反映後者的身份性格行為習慣等等,才具有價值。換言之,記錄下來的資訊必須「無創見」、「非創新」,客觀得像一面鏡子,才有實用價值。不論血糖血脂的定期測量、消費習慣或借貸信用的曲線,還是網民訪問網頁的點選數、氣候變化同糧食收成或公司營運的相關性資料:脫離了具體的被記錄的人、物、事,資料是無意義、無價值也不能用的。
不忠實的記錄如果不是疏忽,便是編造,是假資料。可見,資料的全部價值,就在百分之百依附於被記錄主體,而不能剝離了獨立存在。於是,根據上述無形財產的一般原理,作品價值與初始所有權統一,資料所有權的生成(subsistence)應是在被記錄主體。 這道理也符合我們的常識。比方說,同樣一套資料,換一個人或一家公司記錄,或者換一臺電腦來處理、儲存,絲毫不會改變資料內容。就資料的價值而言,誰來記錄和用什麼工具記錄並不重要,重要的是被記錄的是誰、是什麼。誠然,資料的採集整理離不開記錄者和記錄工具,乃至投資方的支援。但投資和採集整理產生的是次生的權利,動搖不了資料的初始所有權。因為資料從屬於被記錄主體,兩者不可分離,是資料價值的所在。而記錄者及其工具手段與資料內容的關係則是鬆散的、可置換的,不是資料價值的起源。故而資料的初始財產權屬於被記錄主體,不僅有學理和社會道德的支援,落實在新產權的建設上,似乎也應是權利配置的「自然」選擇。
不過,學理歸學理,現實世界裡大資料的監管,法律法規才剛起步,不太給力。這裡涉及大資料的另一個特徵:所有權人同記錄者 / 佔有者的分離,即資料的財產所有權人一般不是資料的記錄和持有者——所有權人非但不佔有資料,連線觸、支配自己的資料財產也很困難。平常所謂財產問題,財產或者掌握在產權人手中,或者有明確的合同委託監護,如房產、首飾、存款。至少,產權人知曉財產的存在和財產權的歸屬。產權人有意願,且依法有能力,行使自己的權利。但是遇到資料財產,情況就變了。例如,網店的交易雙方可能不清楚,自己的行為已經被平臺提供方記錄在案,更無從瞭解是如何記錄的,放進了哪些資料集,會交付誰使用,怎樣使用。 又如,網際網路搜尋器記錄下的搜尋行為的每一個細節,使用者是無權訪問,也沒法監督的。這就使得被記錄主體處於一個尷尬境地:他雖然擁有理論上的資料所有權,實際上卻很難行使。反觀資料記錄者,儘管沒有初始產權,卻因為擁有記錄工具和手段,就控制了記錄過程、內容、格式和結果,把資料牢牢握在手中。而且,這法律意義上的受委託方,甩開了委託人 / 被記錄主體,成了資料的唯一持有者。
更微妙的是,大資料以量取勝,孤立的單個資料幾乎沒有商品價值;故而多數被記錄主體容易忽視自己的資料產權。但是一個個資料集腋成裘,便是寶藏。而大型資料集的處理使用,須藉助複雜的分析算式與大功率計算機,老百姓和小公司難以問津。漸漸地,大資料的採集整理,便成了財力雄厚的大公司的專利。產權人的疏忽或無力,即佔有者的便利。後者往往隨意使用資料,出了問題,後果也難以追究,包括資料丟失、黑市交易,更不要說個人隱私滿天飛了。這是大資料時代的一道世界性的難題。 正是意識到這種複雜性,資料產業才決定繞開所有權,快刀斬亂麻:成立大資料交易所,掛牌交易,用既成事實「倒逼」社會和法律默許。推手希望透過交易所,給資料披上一件嶄新的外衣,遮住所有權上的瑕疵。同時,利用媒體開展宣傳攻勢,淡化對個人隱私和公共利益的威脅,聲稱:「交易所交易的不是底層資料,而是清洗、分析、建模之後的資料結果。」(見《貴陽日報》2015年5月16日頭版)似乎經過「清洗」,一下子解決了兩個敏感問題:一、資料集經過清洗,遮蔽了身份資訊,個人隱私、技術秘密等就能獲得保護;二、清洗過後,資料便擺脫了初始所有權而有了新的業主,可以合法交易了。但事實上,所謂「清洗」 並不等於「脫敏」。更重要的是,法理上,「清洗」這一技術手段不可能將「底層資料」的所有權轉移到所謂「資料結果」。
就像拿了別人的珍珠項鍊,不會因為把珍珠拆下重新串過,項鍊變長變短,或者鑲在幾隻胸針上,那些珍珠就變成自己的財產,就可以合法出售。所以「清洗」只是迴避問題的一種說法;那被迴避的,才是資料商品化的要害所在:底層資料到底屬於誰?誰說了算? 所以不是偶然,最近美國多個農會的一次聯合行動,正是這樣的質問和拒絕「倒逼」。他們的立場與上述討論殊途同歸,我以為代表了國際潮流,體現了前沿社會在資料所有權歸屬及衍生權利範圍等問題上的基本共識。 2014年中,以迪爾和孟山都為首的幾家美國農業技術和裝置公司推出一項新服務,邀請美國中部的農場主與其簽約合作,對耕地實施全覆蓋資料採集。據說,這可以幫助農戶規劃並監測「精確耕作」(precision farming)。具體做法是,公司給農戶提供一個類似汽車GPS的高精度接收器。收割季節,農戶把它裝上聯合收割機,莊稼的收穫就一寸寸農田、一分一秒地記錄下來。待到播種,農戶便有了公司定製的播種方案軟體,存進閃盤,插入接收器。播種機裝了接收器,就會根據指令,自行調節田畝的播種:土壤肥沃的多撒種,收成少的則少撒種。
農戶可以隨時從「雲端」的公司資料庫下載記錄,查閱耕作資訊。 此項服務看似簡單,技術也是成熟可靠的,卻引起了美國最大的農場主組織——全美農場聯盟(American Farm Bureau Federation)的警覺。聯盟發出緊急通報,警告全體成員:當心!一旦資料放上雲端,它可能飄到任何地方去,威脅到個人隱私和技術秘密;絕不能把資訊制控權交到大公司的手裡!這警告非常及時,讓農戶意識到,大資料時代,不僅要利用大公司提供的資訊科技服務,還要了解可能帶來的損害。而為了保衛自身利益,只有團結起來,維護資料產權。不到半年時間,大豆協會、玉米農戶協會、農戶工會等六個農會聯手,同六個巨無霸農業技術供給商(ATPs)談判。
去年11月,雙方達成協議,簽署了《農場資料的隱私和保護原則》(Privacy and Security Principles for Farm Data)。 協議確立的一條基本原則便是:農戶是自家農場資料的所有者,擁有這些資料的產權和絕對控制權。作為對農業技術供給商服務的回報,農戶允許「直接利益相關者」(stakeholders)分享資料。同時,就所有權的行使、衍生權利和周邊效應,協議也做了規定:首先,任何資料的採集使用都要以合同方式,事先獲得農戶明確的許可。未經農戶同意,供給商不得單方面修改合同。其次,供給商必須 用易懂的語言,事先告知農戶:資料如何採集和使用。第三,供給商應告知農戶,資料採集使用的目的。第四,農戶享有選擇參與或不參與資料採集和分享的自由,即供給商必須允許農戶自由選擇進入(Opt-in)或退出(Opt-out),並且向農戶說明,選擇退出可能帶來的後果。第五,如有締約方之外的第三方要求訪問和使用資料,必須事先通知農戶,獲得許可。
農戶有權禁止自家資料參與其他商家的分享,或納入任何大資料集。第六,農戶可以搜尋、下載自家資料,並在任何系統中使用這些資料。第七,一旦農戶選擇退出並要求銷燬資料,供給商必須銷燬、返還資料。第八,供給商不得用這些資料投機期貨市場。 這份協議言簡意賅,涉及幾乎所有的關鍵問題,是資訊科技前沿社會做出的示範。鑑於改革開放三十多年來,與國際(讀作美國)接軌,一直是各種新舉措的一項正當性依據,資料產業包括交易所似乎也應當好好借鑑協議所確立的原則。其中最重要的一條,便是毫不含糊地排除了資料商品化;只對有條件的資料分享持支援態度。原因很簡單,農戶作為資料的所有權人,絕不想披露個人資訊和技術秘密,讓別人做成商品交易。
而供給商承諾遵守協議,嚴格管理資料,不出售資料,無論其資料集有多大,分析算式的能力有多強。 這表明,至少在美國,人們對資料商品化取審慎、剋制的態度;對互助式資料分享,則頗為鼓勵,以實現雙贏。這樣區別對待資料分享和資料商品化,體現了一種主流社會價值的堅持。相比之下,我國業界和政府部門宣傳資料商品化,所提出的兩個主要理由就明顯是矛盾的:一邊說,資訊開放、資訊分享是現代化的需要;一邊又說,資料商品化可帶來巨大的商機和效益,有利於經濟發展。這是試圖把資料的分享和商品化混為一談,暗示資料商品化會促進資訊分享,反映出來的卻是倫理價值的錯位。
常識告訴我們,資料的商品化和分享沒有必然聯絡,更不是正相關關係。相反,分享常常需要克服商品機制的阻礙,才能擴充。歷史地看,自古以來,有人的地方就有資訊分享。分享資訊是人作為社會動物的一樣自然屬性,是人類為生存繁育而不可或缺的一種本能。大資料技術改變的只是分享的規模、速度和效能,尤其在不同領域的交叉地帶,效果更為顯著。比如,根據網上搜尋語詞的分佈,預測本地區或一國,乃至世界範圍的流行性感冒的爆發模式;雲端計算、智慧生活、智慧網路,以及機器人等人工智慧的開發,也都離不開大資料的資訊分享。政府作為目前最大的資料採集和儲存者,尤其要負起分享和保護責任,如最近上海市政府同騰訊、阿里巴巴簽約,計劃共建「智慧城市」。
但是,如果放棄這些責任,放任業界利用人們對資訊分享的熱情,來不受監管地採集資料,變他人的資料財產為自家商品,那分享就變質了。它不再是互助或愛心,而是市場壟斷、攫取暴利的手段。分享和資料一塊兒成了商品,透過註冊交易,出售給最高出價者;沒有錢,就沒份兒分享。一句話,資料的商品化不但不會促進分享,反而造就了壟斷。 促進資訊分享的說法既然是神話或騙人的廣告,那廣告背後的真相便是:營造商機,賺錢。商機賺錢不是壞事,為什麼非要講一個資訊分享的神話來粉飾它呢?這是因為,資料的商品化除去賺錢,其他效應大多是對被記錄主體和公眾不利的。
如上文所說,資料價值源自被記錄主體,但分散的個人行使資料所有權,很難抗衡財大氣粗的資料商。這就使得資料商品化不易管控,生產、交易、使用過程的每一個環節都危機四伏,波及社會生活的方方面面,文化、政治、經濟、國家安全和國防,誰都無法倖免。因此,清醒地觀察、分析資料商品化的社會後果,對於正確地判斷和有效決策,是至關重要的。我認為以下幾個方面尤其值得注意。 首先,資料交易一旦合法化,以目前漏洞百出的監管,個人隱私、技術秘密等重要權益將完全失去應有的尊嚴和保護。
因為交易所服務的是它的客戶,關心的是資料交易的「順利進行」,「要讓企業認可交易所,賣方可以透過交易所獲得資料收益,買方可以透過交易所得到自己稱心的資料」(見《貴陽日報》2015年4月15日A3版)。那裡,只有買方和賣方的利益,沒有後設資料所有者,更沒有個人隱私跟公眾利益的位置。只要註冊交錢,誰都可以購買資料,為了賺錢或者其他。賣方呢,則會想方設法採集、囤積、提供讓買方稱心的資料,使得個人隱私和秘密飽受困擾。據報導,貴陽有個以「慈善義舉」為名的資料採集專案,就頗具創意:給城市提供免費WiFi,搞一個接入端做蒐集資料的入口。不用多久,即可積累龐大的資料量,清洗了做成產品,就能掛牌交易了。 又如,不久前在華山遊覽,曾遭遇一次巧立名目的資料採集。遊客到檢票口,得交出指紋資料,方能乘擺渡車上山。理由是:觀光票兩天有效,取指紋是防止遊客次日把票轉賣了。
且不說絕大多數遊客在華山只呆一天,一票賣兩天的價,已有盤剝之嫌,居然還成了採集個人體徵資料的藉口,真是「創新」到家了。資料公開交易,只會刺激更多此類的「創新」。也許業界的辯護士會說,沒那麼糟糕,交易所答應,只賣清洗過的資料。資料清洗會隱去資料集裡的個人和企業的身份資訊,隱私和秘密不就得到保護了嗎?別高興得太早,貴陽交易所的負責人告訴我們:「資料清洗不是拿水衝啊,而是用電腦把不規則的資料清洗成規則的資料。」(資料觀網2015年4月29日報導)僅此而已。
再看交易者如何理解清洗:「交易所將我們整合的交通資料放在平臺上對外提供,使它變得更有價值。」「當銀行需要考察一個人信用度時,可透過看他是否有固定出行路線和時間判斷其是否有穩定工作。」(見《貴陽日報》2015年4月16日A3版)是呀,越是私密,越有價值;人家交易的那多少個億,就是隱私和秘密。可見,清洗的承諾是當不得真的。 第二,接著被攻陷的,將是資料的使用;大面積失控的資料使用,後果不堪設想。大資料交易既然被當作賺錢的商機,我們就沒有理由相信,購買資料的人只會用它來行善,而不會幹壞事。監管不力的市場,投機、打擦邊球甚至違法,往往比做好事當好人更容易賺錢獲利。
面對資料使用失控,經濟、科研、國家安全、國防等重要領域尤其脆弱。前不久,美國司法部對六大銀行開出罰單,不就是例證?銀行巨頭利用掌握的資料操縱匯率,搞投機發大財,本質上就是違法使用資料,破壞市場秩序和公共利益。當海量的資料可以隨時上市,幹壞事的人和企業就找到了理想幫手。利用合法取得的資料,影響股市和期貨市場而投機,更是輕而易舉。而且很可能,法律拿投機者毫無辦法,因為交易本身是合法的。這樣看來,美國六農會聯手拒絕資料商品化的選擇,是非常明智的。回頭看,我們真得感謝他們,目前全球農產品期貨市場尚能正常運作,有他們一份實實在在的貢獻。中國作為第二大經濟體,對全球貿易和市場秩序也有著不可推卸的責任。
第三,資料管理必然也會成為資料商品化的淪陷區,無論企業、醫院、政府、國防,跟市場一樣,都將面臨嚴峻的挑戰。雖然媒體和政府部門天天宣傳,描繪大資料的「智慧管理」的各種好處,但資料商品化恰恰是高風險的。如今,資訊科技把資料傳輸的量和速度提高至天文級數,資料的運用,勝負可在千分之幾秒間決出。相應地,資料安全事故頻繁發生。 據美國Verizon公司今年4月釋出的《2015年資料洩露調查報告》,據九十五個國家的不完全統計,僅2014年就發生了近八萬起資料安全事故,涉及上億個記錄。而政府、企業和其他管理機構對資料洩露和不當使用的反應速度,常常要滯後數小時、幾天、幾個月,立法上跟進,更是遙遙無期。攻防雙方的力量對比如此懸殊,我們不得不格外小心。一旦資料交易合法,大量的資料使用必然超出常規的防禦能力,管理將近於不可能。
舉例說,利用在交易所購買的政府和金融資料,投機操縱期貨,市場崩潰只是眨眼間的事,監管部門幾乎不可能及時採取措施制止,或者有效懲罰。這類管理失控的最大受害者是誰?是廣大小股民;而擾亂市場的是誰?是拿著小股民的資訊做成的「高階」資料商品,在交易所賺大錢的資料商兼股市操盤手。在找到有效應對高階資訊犯罪的辦法之前,任何資料商品化「創新」都是莽撞,結局難以收拾。 第四,資料商品化的最嚴重後果是弱勢群體受損害的常態化、社會不公的固化。一般商品範疇,有低檔、中檔、高檔之分,滿足不同人群的需求。各檔次 / 價位的商品之間,沒有直接的競爭。大資料產品就不一樣了,沒有「低檔」商品的位置。資料的力量在新、在全、在隨時跟蹤而精細的算式分析。對於使用者而言,資料只有「高檔」,才能最佳化決策;「低檔」的、粗糙的、不夠及時的資料,則會導致錯誤的決策。因而兩相競爭,一同交易,「低檔」的劣質資料是沒有市場的。然而,「高檔」資料的價格昂貴,只有強勢群體如大公司大富豪才享受得起。其他群體既不能使用劣質資料,又買不起優質資料,在競爭中的地位必然每況愈下。
這會使得社會各個領域走向高度壟斷,導致政治、經濟、教育、醫療,乃至婚姻家庭的組織上,對弱勢群體的全方位不公。這是我們為促進社會公正而不能接受的。因此,在考量資料商品化時,國家的政策和法律保護應當儘量向弱勢群體傾斜,以平衡全社會的得失。 總而言之,資料商品化於社會道德和法律原則都是格格不入的。而這場商品化的挑戰,關乎人們對人格尊嚴、財富分配和社會正義的堅持。歷史地看,資料資訊的用處和價值,前人並非不知。面對誘惑和慾望,他們採取了剋制態度,基於以人為本的道德理想,智慧地選擇了非商品化的互助型分享模式。如今,人類進入了網際網路和資訊時代,大資料作為新時代最具魅力的象徵和無損耗的生產資料,業已滲透了所有產業。
不難預見,對它的需求,包括財產權和商品交易,會日益複雜而急迫。這是我們擺脫不了的。但是,一味商品化,這個「開放市場」的老觀念、老辦法也行不通,因為現有的政策法規和改革措施,已經遠遠落後於形勢,不能勝任保護和促進資料採集、流動、使用和管理的重任。很明顯,這不是修修補補所能對付的,因為要處理的問題太龐大、太精巧、變化太快。 所以,我的建議是,有必要認真考慮為「資料」這一新型生產資料,在法律上另設一財產類別,或可稱之為「資料財產」,把它同別的無形財產分開,區別對待。這將是艱鉅的充滿了鬥爭的一次創新,是對我們的理想、社會共識和民主參與的嚴峻考驗;因為從確立產權開始,到重新定位價值順序,這新財產的出發點是人,不再是物。因為,只有走到這一步,我們才可以真正認定,人是資料的主體,商品應造福於人。
本文選自微信公眾號:上海書評(ID:shanghaishuping),作者利求同。