經過一系列探索,健康大資料的應用之路開始逐漸變得清晰。圖片來源:百度圖片
“2015年,‘網際網路+’和大資料成為國家戰略,當一門科學成為國家戰略的時候,我們總有好奇心研究一下,大資料到底幫我們解決了哪些實際問題?”在近日召開的2017大資料發展促進委員會年會上,中軟國際資料服務線諮詢服務總監陳濤叩響了大資料從業者的心頭之問。
在陳濤看來,網際網路幫人們解決了連線的問題,而連線實現了資料的線上流動,“資料的線上流動則提供了很多不能直接感受到和看到的資訊,它加快了我們認知這個世界的速度。”
但在健康大資料領域,這種“流動性的魅力”似乎打了折扣。中國疾病預防控制中心慢病中心主任助理蔣煒坦言,“醫療健康這個行業一直都沒有跟資料分開過,但是近幾年大資料的發展,反而讓醫療行業在大資料面前顯得比較茫然。”
這是為什麼?“大資料想要打破我們原來採用抽樣手段通過整體資料來反映健康和醫療全貌的傳統。”蔣煒道出了醫療大資料近年來發展中遇到的困惑,在這種情況下,舊的“資料方法論”難以為繼,而新的“健康大資料應用體系”尚未成熟,健康大資料產業如何打破僵局?
嚴重的資料“孤島”問題
所謂健康大資料,是指無法在可承受的時間範圍內用常規軟體工具進行捕捉、管理和處理的健康資料的集合,蔣煒介紹道。
“健康大資料構架中資料資訊的來源渠道、資料資訊種類和大資料庫的建設與常規大資料是相同的。從資料資訊的來源渠道看,很多健康大資料來源於電子病例、居民健康檔案、國家臨床中心的相關資料、公共衛生及物聯網資料庫等。”蔣煒認為,正是這種資料種類的龐雜造成了健康大資料的複雜性,甚至成為目前整個健康大資料發展的瓶頸,而這種瓶頸在海量資料收集之後更加凸顯。
蔣煒把問題歸結為三個方面:資料“孤島”現象;資料標準不統一;大資料技術未能有效利用,“從2010年左右醫療行業提出大資料至今,一直都沒有很好地解決”。
目前醫療大資料的孤島現象非常嚴重,“橫向來講,所有的醫院都有自己的資料,我們力推醫院資料打通,但是將近20年了一直沒有達成成果”。蔣煒分析,縱向來講,由於個人健康資訊分為很多型別,從國家層面收集資訊就意味著從上到下按不同的型別在地方做不同的資料平臺,“各套縱向體系之間的資訊沒有形成很好的互聯互通,大資料很難得以應用,而且造成很多資料資源的浪費”。
此外,蔣煒還表示,在一些資訊化水平較高的地區,比如東部沿海地區,或由於企業自身原因,或受制於當時的基礎條件,每個地區在建設資訊化平臺時的標準不統一,當多後設資料型別歸集於同一資料庫時,從清洗到達到可預算標準的過程需要消耗巨大的工作量。
業務導向的價值變現
針對大資料分散、總體價值難以變現的問題,陳濤給出了自己的看法。他表示,就目前而言,“大資料還沒有厲害到無所不能的程度”。大資料解決的是相關性,並不能解決因果性的問題。他舉了個例子,“如果來分析北京交通的擁堵情況,資料能夠幫助我們找到很多相關的因素,比如道路建設情況、地鐵路線、公交路線設計等。但是資料並沒有告訴我們這些因素的成因,以及我們如何利用這些因素來解決交通擁堵的問題,最終資料還需要人來處理加工,從而支援決策的作出。”
陳濤認為,基於這種理解,可以梳理出資料的一些獨有特性:業務附著性、真實性、價值不確定性及可複製性。
“資料從業務中來,最終又反饋給業務,支撐業務的改進和創新。大資料應用實際上要做的一件很基礎的事情就是先要樹立業務及相關的業務流程。”陳濤表示,“其次,資料可以被當成一種實證方法,既然是實證方法,就必須要真實,虛假資料毫無疑義。”但陳濤也不諱言具體實踐中存在的掣肘,“靠資料本身以及資料所存在的IT資訊系統並不能保證資訊的真實性,因為資料和人的活動是緊密關聯的,保證資料的真實性一定要人為制定很多流程制度”。
談及資料資產時,很多人會關注,既然資料是資產,是不是可以交易、變現或者“賣錢”?陳濤表示,資料和一般性的商品之間還是有很多區別的,一是資料歸屬權問題,二是“資料的角度”。陳濤所謂的資料的角度,即“它是不是可以以等價交換的方式來支撐”。陳濤解釋道,“比如手機上的位置資訊,它是資料。對於滴滴叫車和外賣公司來講,它們可以根據這個資料為我提供服務;對於公安部門來講,這個資訊可以幫他們快速找到想找的人,但同樣的資料對於其他人可能毫無疑義。資料根據其角色不同、場景不同、目的不同,我們很難認為它的價值像商品一樣具有等價交換價值的唯一性。”
此外,資料的可複製性和流動性也是其特性之一,陳濤說:“如果有一天我們發現資料真的成為資產了,真的可以變現的時候,安全非常重要。”
基於這四個特性,大資料應用其實涉及到一整套完整的方法論。具體到醫療健康大資料行業,其應用價值的體現也要遵循這樣的路徑。
建設規範化互動平臺
事實上,經過一系列探索之後,健康大資料的應用之路開始逐漸變得清晰。在這個過程中,全球智慧穿戴裝置已經突破1億件,我國目前擁有移動醫療使用者2.93億。正如蔣煒所言,“大家都迫切希望利用移動技術得到醫療健康服務”,移動醫療終端為健康大資料的採集和處理帶來了新的思路。
可穿戴裝置能實現諸多人體生命特徵相關資料的採集和連續採集。通過大資料、雲端計算、物聯網等技術應用,實時採集大量的使用者健康資料資訊和行為習慣,已經成為智慧醫療獲取資訊的重要途徑。蔣煒表示,這些資料有望與電子病例、公共衛生大資料進行有效銜接,加以人工智慧分析,從而推進覆蓋全週期的預防、治療、康復、保健的一體化健康服務發展模式,重構健康產業生態鏈。
儘管可穿戴裝置發展蓬勃,但蔣煒認為目前依然存在資料採集單一導致的健康資料分析、健康服務提供不精確和行業資料標準不統一導致的資料難以共享的問題。“哪怕是同一智慧穿戴裝置,根據廠商自己的利益和價值取向,裝置的資料標準也不一樣,當資料真正拿來利用的時候,往往得不到醫療機構的認可。”蔣煒說,“對於健康資料來講,它的保鮮期很短。”
“從整個行業來講,需要一個規範化的平臺。”蔣煒認為,這個平臺要有兩大功能,一個是彙總不同智慧硬體的健康資料,集合成使用者的整體運動健康資料電子檔案,為醫療資料接入、慢病管理等提供可操作的健康資料依據;二是將同一使用者多維度的排重資料,反向傳輸給智慧硬體廠家,用來精確演算法,優化產品,從而形成使用者健康資訊閉環。基於此,中國疾病預防控制中心和中國資訊通訊研究院標準所正在共同探索建立健康管理資訊互動平臺。
為什麼要做這個平臺?蔣煒表示,首先,針對資料來源的問題,力圖使用平臺去衡量、支援可穿戴健康裝置採集資料的質量標準,開展健康服務評估。其次,融合各個採集裝置的資料孤島,實現資料共享,通過大資料演算法提高健康醫療服務準確性。再次,面對大量的運動健康、身體指標、醫療資訊等資料,提供技術、服務、使用者等行業交流平臺,推動我國智慧健康醫療大資料的發展,實現移動醫療健康大資料的真正價值。
蔣煒最後講述了平臺建設的時間表,“2017年底一期試執行,2018年正式釋出,預計2018年底實現300家移動健康裝置平臺接入”。
來源:《中國科學報》 作者:趙利利