每天有5億條Twitter訊息釋出,內容涉及人們生活的方方面面,而現在,這家社交網路決定將這一巨大的資料寶庫向科學家開放,幫助他們研究人類的行為模式、預判健康風險並追蹤傳染病的傳播情況。
例如,微軟研究人員通過對Twitter上的懷孕婦女透露出的情緒,開發了一種新的演算法來預測產後抑鬱症的風險。美國地質調查局則可以使用Twitter追蹤地震發生地。
直到目前,多數對相關問題感興趣的科學家都只能使用有限的Twitter訊息。儘管多數Twitter訊息都對外公開,但科學家卻希望能夠隨意搜尋這些內容,他們目前只能通過Twitter的API(應用程式設計介面)實現這項功能,但卻只能訪問1%的資料。
不過,這種情況很快就將改變:Twitter今年2月宣佈,將把2006年以來的所有資料免費提供給研究人員,有望使得Twitter成為一項廣受歡迎的研究工具。藉助如此龐大的資料,科學家可以展開更加複雜的研究,回答更具體的問題。
Twitter的這一計劃令人興奮,但也引發了一些問題。Twitter能否對相關科研結果享有任何權益?由於使用者未必想將自己的內容貢獻給研究人員,因此Twitter的這一工具是否有違道德?
為了解決這個問題,弗吉尼亞理工大學計算機流行病學家凱特琳·裡夫斯(Caitlin Rivers)和布萊恩·劉易斯(Bryan Lewis)今年2月針對Twitter資料的使用方式釋出了道德規範。他們建議科學家不要披露相關使用者的名稱,也不要公佈研究目的。
例如,儘管從公共空間蒐集資訊並不違反道德,而Twitter也的確是一個公共空間,但在未經他人許可的情況下分享其身份資訊卻有違道德。裡夫斯和劉易斯認為,科學家需要將保護使用者隱私列為Twitter研究專案的基本原則——資料越大,責任越大。(樵夫)