隨著美國電子健康檔案(EHR)的普及以及醫療健康資料新來源的快速發展,一場醫療與健康資料的海嘯已經出現。隨著資料的數量增長和複雜度增加,醫療分析和決策正變得越來越耗時、易出錯、結果不理想。在各種臨床決策中,制定理想的治療方案是至關重要並且很有難度的一個。即使在確診的前提下,醫生仍需要伴隨患者病程不斷最佳化治療方案。例如併發慢性心力衰竭和高血壓的慢性腎病患者,因心衰惡化入院,醫生則需要已經使用的抗高血壓藥物進行調整,比如改變利尿劑的種類和劑量等。因此對於新確診的病人,根據入院就診時得到的有限資訊預測該病人在出院時的藥物治療方案對醫生來說是一件具有挑戰的事情。在入院時,醫生會了解病人的就診原因, 病史(包括共病情況, co-morbidities)等,進行相關實驗室或影像學檢查等並記錄在入院病歷中(admission note)。藉助先進的機器學習與深度學習技術,我們從上萬份的患者入院病歷記錄中提取關鍵資訊,對出院用藥實現了更準確的預測。
精準的出院用藥預測能向醫生提供指導,幫助醫生及時發現用藥偏差(medication discrepancy)。用藥偏差是指在患者入院,轉院,出院過程中用藥方案在記錄過程中發生的非計劃性的改變。在美國 70% 的患者受到用藥偏差的影響,其中⅓可能對患者造成中度至重度的危害。為了解決用藥偏差可能帶來的問題,藥物核對(medication reconciliation)作為一個保證患者治療安全的重要環節,要求醫生在患者入院及出院環節對藥物方案進行仔細核實與比對。入院時對出院用藥的預測可以幫助醫生及時發現用藥偏差,避免由於藥物重複或遺漏可能造成的病人安全風險問題,同時這種預測可以作為一種有效的早期預警工具幫助醫生儘早監控管理藥物的處方,並及時減少不必要的用藥疏失(medication error)。
在利用深度學習方法在入院就診時間對出院藥物進行預測的過程中,主要有有兩方面的困難。首先,可用的就診資訊大多數都是非結構化的病歷記錄(稱為入院記錄),比如既往病史、家族史、過敏等情況。與實驗室檢測資料和體徵資料等結構化資訊相比,這些自由形式的文字更難被機器處理和理解。此外,這些記錄還包含了同義詞、縮寫和拼寫錯誤。因此,從這些非結構化且有噪聲的文字中有效提取語義模式是我們需要解決的第一個問題。其次,在臨床上,為了快速並有效的治癒疾病,達到治療目的,常常會使用兩種或兩種以上的藥物,許多聯合用藥的方案在臨床治療指南或專家共識中被廣泛認可。例如,對已服用阿司匹林的中風病人,為了有效預防再次中風的發生,醫生會推薦雙聯抗血小板治療(dual anti-platelet therapy),既同時服用阿司匹林和氯吡格雷。大量研究表明多重藥物的聯合治療對疾病的進展,預後及死亡事件的發生都有一定的影響。如何自動發現和利用藥物之間的這種相關性,對於更準確的多藥物預測是至關重要的,這也是非常有價值的。
論文:基於深度學習在就診時間預測出院用藥(Predicting Discharge Medications at Admission Time Based on Deep Learning)
論文地址:https://arxiv.org/abs/1711.01386
摘要:在病人入院就診時預測其出院用藥可以幫助醫生更好地計劃和核對用藥方案、發現用藥偏差、降低用藥安全風險。由於病人在住院期間病情進展不盡相同,僅利用就診時可用的有限資訊對病人出院情況進行預測會較為困難。本文研究瞭如何使用深度學習技術來協助醫生根據病人就診記錄中的健康資訊來預測其出院用藥。在實現上,我們設計了一種卷積神經網路來分析就診記錄然後預測病人在出院時的用藥。該模型可以從非結構化和有噪聲的文字中提取語義表徵,並能自動學習不同藥物之間的藥理相關性。我們在 2.5 萬份病人就診記錄上對該模型進行了評估,並與 4 種基準模型進行了比較。在宏平均 F1 分數上,該方法相對於最好的基準模型有 20% 的提升。
貢獻
本文提出了一種以電子健康檔案為輸入,預測一種或多種出院用藥的卷積神經網路(CNN)模型。該模型可以從原始文字中學習到豐富的語義表徵,並且可以自動獲得藥物之間的相關性。我們在 2.5 萬份病人就診記錄上對抗高血壓藥這一特定藥物類別上對該模型進行了評估。在平均 macro F1 分數上,我們的方法比最好的基準好 20%。
方法
研究設計
我們在之前收集到的重症監護病房(ICU)病人的電子健康檔案進行了回顧性研究(retrospective study),根據就診記錄構建了一個預測出院用藥的深度學習模型。我們對比了該模型和其他四個基準模型所預測的藥物與醫生給出的藥物的區別,從而評估了模型的效能。
資料預處理
該研究使用了 MIMIC-III 資料集並且重點關注了其中出現的 8 種抗高血壓藥:美託洛爾(metoprolol)、呋塞米(furosemide)、賴諾普利(lisinopril)、氨氯地平(amlodipine)、阿替洛爾(atenolol)、氫氯噻嗪(hydrochlorothiazide)、地爾硫卓(diltiazem)、卡維地洛(carvedilol)。
圖 1:8 種抗高血壓藥物在 MIMIC-III 資料集中的頻率,Hctz 是氫氯噻嗪的簡寫
表 1:左欄顯示 8 種就診時可用的資訊型別,右欄每行顯示了 MIMIC-III 中對應的提取此類資訊的標題字串
模型設計
我們開發了一個可基於就診時可用的資訊來預測出院用藥的深度學習模型。該模型的輸入為就診記錄,輸出是病人的出院用藥(一種或多種)。該模型具備兩種功能:1)能有效地從有噪聲的和非結構化的原始文字中提取高層次的語義並能適當地考慮連續詞彙之間的序列結構;2)其次,該模型能學習不同藥物之間的藥理相關性。
為了同時實現這兩個目標,我們開發了一種基於卷積神經網路(CNN)的模型。從高層面看,該模型:1)使用了多個堆疊的隱藏單元層來獲取輸入記錄的隱含語義;2) 使用了不同視窗大小的卷積運算元來獲取 n-gram 中存在的區域性語義和序列結構;3) 可發現常見的隱含因子,從而學習得到藥物之間的藥理相關性。
圖 2:CNN 模型的網路架構
結果
從宏平均和微平均兩種 F1 分數上來看,CNN 有遠高於其他所有基準模型的準確率。在兩種平均 F1 分數之間,CNN 在宏平均上的提升更為顯著。CNN 在 7 種藥物上都得到了最好的 F1 分數。呋塞米是唯一的例外,其中隨機森林(RF)的表現優於 CNN。CNN 相對於基準的提升主要體現在召回率(recall)上,而其準確率則與基準模型相當。在各類基準模型中,只使用就診藥物作為輸入的 多層感知機(MLP)在宏平均和微平均 F1 上的表現最差;另外,非線性支撐向量機(SVM)和 RF 的表現優於線性的邏輯迴歸模型(LR)。
CNN 相較於其它基準較高的得分來源於它的分層的隱藏層結構。這樣的結構使得 CNN 能在多種粒度(單詞層面、短語層面和文字層面)上提取相關的語義資訊。
表 2:CNN 和 4 個基準模型在 5 次實驗中對每一類藥物的準確率(P)、召回率(R)和 F1 的平均分數。藥物從上到下按照頻率降序排列。模型整體的分數分別透過以上所有分數的宏平均(Macro Avg)和微平均(Micro Avg)得到。
表 3:在單詞嵌入空間中一些詞(Query)和它在空間中的最近鄰(NN)。兩個詞之間的「相似程度」對應它們的嵌入向量之間的歐式距離。
擴充套件閱讀: