醫藥和醫療正在成為大資料的殺手應用。醫藥和醫療行業的管理者們已經意識到,Hadoop、機器學習、自然語言處理等新型資料分析技術是帶來飛躍式發展的關鍵契機。
以下是正在改變醫療行業的八個大資料創新應用:
一、基因組學。這是大資料在醫療健康行業最經典的應用。基因測序的成本在不斷降低,同時產生著海量資料。DNAnexus、Bina Technology、Appistry和NextBio等公司正通過高階演算法和雲端計算來加速基因序列分析,讓發現疾病的過程變得更快、更容易和更便宜。戴爾公司也為兩個醫療研究中心提供計算力,根據每個孩子的不同基因資訊,制定專門的小兒癌症治療方案。
二、醫生的BI。西雅圖兒童醫院的醫護人員如今正在使用Tableau,視覺化分析遍佈醫院各處的伺服器和資料庫裡的數以TB計的資料。視覺化資料分析不但幫助醫護人員減少醫療事故,制定臨床試驗計劃,而且還幫醫院節省了300萬美元的供應鏈成本。
三、語義搜尋。想象你是一位醫生,正需要了解一位新來的病人,或者想知道新治療手段對哪些病人有效。但是病人病歷散佈在醫院的各個部門,格式各異,更糟糕的是,各部門都用自己的術語建立病歷。一家創業公司Apixio正在試圖解決這個問題,Apixio將病歷集中到雲端,醫生可通過語義搜尋查詢任何病歷中的相關資訊。
四、萬能的Hadoop。Cloudera正在與西奈山醫學院合作開發新的生物資料分析方法和系統。Cloudera還與FDA合作偵測多種藥物組合的副作用,與埃默裡大學合作幫助病歷學家更準確地分析醫療影像。Cloudera的客戶之一——Explorys的業務主要是聚合並分析醫療記錄,而英特爾和NextBio則合作使用Hadoop處理基因資料。
五、IBM沃森(Watson)。IBM在醫療領域建樹頗多,但最酷的莫過於與WellPoint合作將智力問答電視節目“危險邊緣”的冠軍系統(Watson)部署到醫生的辦公室裡。Watson能“聽懂”醫生的自然語言問題,同時快速分析堆積如山的醫療研究資料給出答案。
六、疾病預防。如何能不通過昂貴的診斷技術就能診斷早期疾病是醫學界的一大課題,Seton醫療機構目前已經能借助大資料做到這一點。例如充血性心臟衰竭的治療費用非常高昂,通過資料分析,Seton的一個團隊發現頸靜脈曲張是導致充血性心臟衰竭的高危因素。(而頸靜脈曲張的診斷幾乎沒有什麼成本)
七、醫院資料科學家。如今醫療技術公司Alliance Health Networks中也出現了一個新的職位:首席資料科學家。該公司提供醫療專業垂直社交網站,收購了醫療搜尋資料庫Medify,因此需要一位首席資料科學家來領導資料分析工作,向醫療專業使用者提供有價值的反饋。
八、眾包科學。醫療行業的受控實驗往往昂貴而無效,於是人們開始琢磨能否從現實世界的鮮活資料著手。醫療眾包領域最知名的公司當屬社交網站PatientsLikeMe,該網站允許使用者分享他們的治療資訊,使用者也能從相似的患者的資訊中發現更加符合自身情況的治療手段。作為一個副產品,PatientsLikeme還能基於使用者自願分享的資料進行觀測性實驗。(傳統方式的臨床實驗通常非常昂貴)
via:IT經理網