機器學習演算法可有效發現艱難梭菌感染

人工智慧快報發表於2018-04-20

美國麻省理工學院、哈佛大學醫學院附屬麻省總醫院和密歇根大學的科研人員開發出了一種機器學習演算法可有效發現艱難梭菌感染,相比傳統方法可較早實現診斷。

每年都有近3萬美國人死於一種名為艱難梭菌(Clostridium difficile)的侵襲性腸道感染細菌。這種細菌對許多常用抗生素具有抗藥性,即使在能夠殺死通常可控制住這種細菌的有益細菌的抗生素治療中,這種細菌仍然能夠繁殖。麻省理工學院(MIT)電腦科學與人工智慧實驗室(Computer Science and Artificial IntelligenceLaboratoryCSAIL)、麻省總醫院(Massachusetts GeneralHospitalMGH)和密歇根大學(University of MichiganU-M)的科研人員現在已開發出研究型“機器學習”模型。這些模型專為各大機構量身定製,可比使用當前診斷方法更早地預測出患者感染艱難梭菌的可能性。

640?wx_fmt=png

“儘管在預防艱難梭菌感染和確診後及早開始治療方面投入了大量精力,感染率仍在繼續上升,”麻省總醫院感染內科醫學博士、研究共同第一作者兼哈佛醫學院(Harvard Medical School)醫學助理教授埃麗卡·謝諾伊(EricaShenoy)說道。“我們需要更好的工具來幫助識別具有最高風險的患者,以便有針對性地進行預防和治療干預,從而減少進一步傳播並改善患者治療效果。”

作者們指出,之前的大部分艱難梭菌感染風險模型都設計為“一刀切”方法,並且僅包含幾個風險因素,因而用處有限。共同第一作者兼麻省理工學院電腦科學與人工智慧實驗室外科學碩士瑪吉·馬卡爾(Maggie Makar)和密歇根大學電腦科學與工程專業研究生傑雷爾·歐(Jeeheh Oh)及其同事採用“大資料”方法分析了完整的電子健康檔案(Electronic Health RecordHER),以此預測患者在住院期間感染艱難梭菌的風險。他們的方法允許開發機構特定模型,可適應不同的患者人群、不同的電子健康檔案系統和特定於各家機構的因素。

“如果僅將資料注入一刀切模型中,患者人群、醫院佈局、檢驗和治療方案,甚或醫務人員與電子健康檔案之間互動方式的機構差異都可能會導致基礎資料分佈出現不同,並可能最終導致此類模型的表現差強人意,”密歇根大學電腦科學與工程助理教授兼研究共同第一作者詹娜·威恩斯(Jenna Wiens)博士說道。“為了緩和這些問題,我們採用醫院特定方法,訓練為每家機構量身定製的模型。”

科研人員藉助其基於機器學習技術的模型,分別以兩年和六年為期限,對在麻省總醫院或密歇根大學醫院(Michigan Medicine,密歇根大學學術醫學中心)入院的257,000名患者的電子健康檔案中去除了身份識別資訊的資料進行分析。這些資料包括每名患者的人口統計資料和病史、其入院細節和每日住院情況,以及患者被艱難梭菌感染的可能性。該模型針對每名患者生成每日風險評分,當超過設定閾值時,患者會被歸類為高風險患者。

整體而言,這些模型在預測最終會被診斷為感染了艱難梭菌的患者方面非常成功。在採集診斷樣本前至少五天,這些模型就已經對其中半數感染患者進行了準確預測,這樣一來,可集中對具有較高風險的患者進行靶向抗菌干預。如果在前瞻性研究中得到證實,風險預測評分可為艱難梭菌的早期篩查提供指導。對於在病程早期確診的患者,啟動治療可抑制疾病嚴重程度加深,且確診的艱難梭菌感染患者可得到隔離並能啟動接觸預防措施來防止感染向其他患者傳播。

研究團隊已在網上免費提供演算法程式碼(https://gitlab.eecs.umich.edu/jeeheh/ICHE2018_CDIRiskPrediction),以供其他人檢視及針對各自所在機構修改。謝諾伊指出,探索將類似演算法應用於所在機構的醫療設施需要召集合適的本地主題專家並驗證相關模型在其機構中的表現。

640?wx_fmt=jpeg

640?wx_fmt=jpeg



相關文章