詳解登上《Nature Medicine》的NLP成果,為什麼說這是一次里程碑式的勝利?

動脈網VCBEAT發表於2019-02-15

北京時間12日零時14分,國際知名醫學科研期刊《自然醫學》(Nature Medicine)線上刊登於文章題為《使用人工智慧評估和準確診斷兒科疾病》(Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence)。

這一研究結果由廣州市婦女兒童醫療中心夏慧敏教授、張康教授(加州大學聖地亞哥分校)、資料中心樑會營博士、醫務部孫新主任以及兒內科門診何麗雅主任團隊與依圖醫療倪浩團隊、康睿智慧科技等業內頂級研究團隊及廣東省再生醫學重點實驗室,利用人工智慧技術診斷兒科疾病實現。

詳解登上《Nature Medicine》的NLP成果,為什麼說這是一次里程碑式的勝利?

這是全球首次在頂級醫學雜誌發表有關自然語言處理(NLP)技術基於中文文字型電子病歷(EMR)做臨床智慧診斷的研究成果。其核心是利用兒科疾病的文字病例資料訓練人工智慧,以達成智慧診斷的目的。

那麼,為什麼說這是一次里程碑式的勝利?動脈網記者採訪到了依圖醫療CEO倪浩與廣州市婦女兒童醫療中心的樑會營博士,以瞭解這一專案背後的故事。

如何讓機器像醫生一樣思考?

自然語義處理是人工智慧技術中至關重要的一個分支,其目的是幫助人工智慧在識別影像的基礎上,通過自動學習病歷文字資料(醫生的知識和語言)中的診斷邏輯,逐步具備一定的病情分析推理能力,並更進一步讀懂、分析複雜的病例,逐漸使人工智慧能像醫生一樣“思考”。

將人的智慧以機器形式表現出來是該研究的目的,所以人工智慧的學習是對醫生日常就診流程的學習。

常規的就診包括望聞問切、視觸叩聽,即醫生看病時需要融合患者的主訴、症狀、個人史、體格檢查、實驗室檢驗結果、影像學檢查結果,甚至在來醫院前的用藥資訊,多方面才能做出綜合的病情判斷。

如果人工智慧能把這些資訊都給吃進去,然後消化,並吸收。當醫生或患者輸入病症時,輸出的便是一個診斷結果。

樑會營認為:“要實現人工智慧模擬醫生就診,做臨床推理,必須做到以下幾點;第一,它要自動學習文字病歷中的診斷邏輯,醫生是從書本中去學習的,而人工智慧是從上百萬份電子病歷中去學習;第二,學習後,人工智慧需具備一定的進行病情分析的推理能力;第三,要能夠像人類醫生一樣,讀懂各類兒科文字病歷,並做出準確的智慧推薦。簡單而言,當這個演算法成熟後,患者察覺病情時,無需百度就可以獲得專業的診斷結果。”

在實踐之中,倪浩認為,這將分為兩個階段:“第一個階段是如何去解構各個領域的責任與資料,所謂的解構就是去挖取資料中的資訊點。本篇文章中一個非常重要的基礎就是基於解構後的電子病歷資料,建立一個高質量、結構化的病種庫,並在這個病種庫的基礎之上去做診斷模型。第二個階段是語義理解,即通過訓練讓機器的模型能夠完全去理解人類語言。這個階段相當困難的,整個業界還有很長的路要走,但依圖的工作已經實現了語義理解的初級階段。”

十倍於常量的資料集

過去釋出在頂級期刊上的相關論文,其使用的資料集的資料量級在十萬左右,而本次實驗中的人工智慧理解了近60萬患者,136萬份電子病歷的資料。

這些資料來源的患者均為兒童,平均年齡為2.5歲,其中40%是女孩;資料結構覆蓋了患者主訴、症狀、個人史、體格檢查、實驗室檢驗結果、影像學檢查結果、用藥資訊等多方面的資料。所患疾病包括消化科、呼吸科等55種疾病,覆蓋了超過75%的常見兒童疾病疾病。對於腦膜炎等危急疾病,實驗同樣也做了一些設計,以提高人工智慧的診斷能力。

研究團隊利用依圖醫療的NLP技術建立了一套病歷智慧分析系統,深度挖掘和分析醫療文字的資訊,將非結構化文字形式的病歷資料變成規範話、標準化和結構化的資料,以便AI準確完整地“讀懂”病歷。

為此,醫生、科學家和技術人員通力合作,由30餘位高階兒科醫師和10餘位資訊學研究人員組成的專家團隊手動給電子病歷上的6000多張圖表進行註釋,並持續對模型進行檢驗和迭代。

圖表是研究人員研究疾病的副機碼,作用為找出某一疾病的特徵。一個疾病可能有300個特徵是有意義的,只要按這個特徵填進去的話,人工智慧就可以診斷這個疾病。在現實中,醫生書寫的最完善電子病歷的特徵數在100左右。

同時,不同疾病的圖表結構不同,有的疾病不含診斷,而有的包含家族史、主訴、實驗室檢查、影像學檢查、超聲檢查等多維資訊,研究人員必須對不同情況下的圖表進行區分。

詳解登上《Nature Medicine》的NLP成果,為什麼說這是一次里程碑式的勝利?

優異的訓練結果

由於豐富資料庫的加持,所訓練出的模型也表現出了優異的結果,以部分疾病為例:神經系統的準確性為0.98,呼吸系統的準確性為0.92,全身性疾病的準確性為0.87,最低的消化系統的準確性為0.85。若細化疾病的分類,上呼吸道的準確率為0.89,而下呼吸道的準確率為0.87。

不同的疾病之間準確率的差異源於資料與特徵的差異。某一疾病的特異性的症狀越多,它就更容易被學習,這是因為這些特異性給了人工智慧進行區分的先決條件。同時,學習更多資料的人工智慧將在準確度方面做出更好的表現,這一點人與機器同理。

倪浩對此舉了一個很好的例子:“如果某患者患有急性喉炎,但喉炎發病的部位和症狀與支氣管炎類似,要區別兩種疾病,需找出喉炎的特異性的症狀。由於醫生可能不會描述相關症狀,患者病歷中便會缺失,造成結果的誤診。對此,我們作出了這樣的解決方案:假如系統懷疑患者有可能是急性喉炎,而它的置信度不是排名第一,人工智慧會追問是否出現了呼吸時伴隨卷鼻音(急性喉炎的另一特徵),這是醫生容易缺失的一個操作。儘管現有準確率已達到一定水平,但仍有提升的空間,通過這種方式,我們能逐漸在現有準度的基礎上進一步提升系統準確率。”

NLP的發展是漫長而充滿意義的過程

談及為什麼選擇兒科作為突破口,除了廣州市婦女兒童醫療中心提供的翔實資料,兒科荊棘的現狀也是倪浩團隊選擇這一領域進行實驗的重要原因:“中國兒科醫生非常稀缺,流感季節的三甲醫院總是爆滿。此外,兒科是一們啞科,很多小孩子不具備很強的語言表達能力,他們不能詳細講述自己的病情,這是我們一直堅持在兒科做出巨大投入的原因。”

“我一直在想象這樣的場景,在就診時,當醫生與患者的問答環節結束,關聯電子病歷的語音識別助手就已經寫好了電子病歷,而輔助診斷系統也根據這一病例得出結果,告知患者該去做什麼樣的檢查。這樣下來,醫院的效率將大幅提高,醫生的解放也得已實現。”

總的來說,本次研究是一次成功的嘗試,這為NLP技術在其他科室的發展打下了一個很好的開端。在接下來的研究之中,依圖醫療將沿著就診鏈路進行產品延伸,包括但不限於治療方案、護理方案、給患者家長健康指導以及網際網路醫院場景。 

通過網際網路技術打破地域的限制,通過語音識打破就診方式的限制,通過智慧診斷打破醫院效率的限制,依圖醫療正通過技術不斷打破傳統醫療模式,讓人工智慧技術惠及更多的患者。也許,人們理想中的醫療方式,離我們不再遙遠……

相關文章