開發者說 | 雲+AI賦能心電醫療領域的應用

京東科技開發者發表於2020-09-23

以“醫工匯聚 智競心電”為主題的首屆中國心電智慧大賽自2019年1月1日啟動全球招募起,共吸引總計545支來自世界各地的醫工結合團隊,308支團隊近780名選手透過初賽資格審查,經過初賽、複賽、決賽近8個月的激烈角逐,越光醫療透過其演算法成績及答辯結果斬獲大賽總決賽一等獎,同時開啟了企業自身從傳統心電分析演算法到人工智慧和機器學習新一代演算法的戰略轉型。

此文應首屆“中國心電智慧大師賽”舉辦方京東雲與AI和清華資料院的邀請,作為大賽的獲獎單位代表,以及越光醫療CTO,分享和探討越光醫療在心電智慧診斷領域的理解,應用與實踐成果。

一、行業背景

自從Holter(24小時連續動態心電記錄)發明以來半個多世紀,隨著半導體技術的不斷髮展,心電記錄儲存時長已從最初24小時做到14天,裝置也從收音機體積降到貼附可穿戴式。大量心電資料的便宜獲取使得心電自動分析演算法逐漸成為Ambulatory ECG的核心技術門檻。自上世紀80年代開始,美國麻省理工學院和哈佛醫學院,政府機構及多家心電企業專家們探索動態心電診斷演算法行業標準,直到90年代末形成AAMI 標準被美國FDA和CE採納為動態心電產品認證要求,極大推動了以歐美為主導的Holter標準化和市場化。

長期以來,我國Holter以進口Holter產品和技術為主,直到2014年10月國家藥監局正式頒佈了與全球統一的行業YY標準,提供了國產產品與進口產品一致性評價的客觀路徑,將對國產心電診斷技術產品的創新和發展產生深遠影響。

越光醫療自2016年獲得新標準下藥監局批准的長時程可穿戴式動態心電記錄儀,陸續推出了個人心律監測和社群心律患教機等專利創新產品。利用醫療心電感測技術和獨有超低功耗技術實現了無需充電的連續不斷(最長30天)或高頻次(2萬次)心電採集,效能和功能達到或超越美國行業同類產品。極大降低醫生操作門檻,提升患者依從性,並且在全國範圍內200多家醫療機構得到廣泛和穩定的臨床使用。但與此同時,也帶來海量心電原始資料,醫療機構對心電智慧處理的時效性和準確性的要求與日俱增。

二、挑戰與機遇並存

雖然傳統心電圖機發明已超過100年曆史,但臨床心律失常的診斷仍依賴動態心電或Holter。中國有近3億心血管疾病人群。60歲以上超過2億。常見心律失常如房顫帶來5倍以上腦卒中風險,也是造成20%以上腦梗的主要原因。除腦梗猝死等風險,心律失常也將嚴重降低患者生活質量,治療或長期管理不善甚至導致結構型心臟病心衰等不可逆慢病。

據統計,我國每年進行2.5億次10秒常規心電圖和3500萬份動態心電圖檢查,而心電圖醫師約有3萬名。臨床出具1份動態心電報告需要基於15-30分鐘的資料清理。如果每位醫生每日處理超過10份動態心電報告和100份常規心電圖則會帶來巨大工作負擔。因此無論臨床診斷,或健康預防,心電檢查服務都需要供給側改變,這正是我們對人工智慧的應用期望之一。

美國過去10年間,由於其醫療保險特有制度,形成了第三方獨立診斷服務中心,為全國範圍內臨床醫生提供心電處理服務。也由此成就了不少成功企業,例如iRhythm和CardioNet,日均服務上萬人次,市值共計40億美元(約人民幣280億)。

因此,對於如中國、印度等人口眾多,醫療資源地域差異大、相對缺乏的國家或地區來說,需求大,挑戰大,但創新和市場的想象空間更大。

三、AI在心電診斷中的應用

吳恩達領導的史丹佛大學團隊在今年的Nature Medicine發表了深度神經網路學習(DNN演算法)在心律失常自動診斷的應用結果:透過91232份單導聯心電記錄(平均10.6天)對比演算法和普通醫生,發現前者(ROC達0.97)的平均陽性預測率和平均敏感度均超過後者

越光認為AI在醫療領域的應用有三種方向:

(1)比醫生做得更好的AI,因為醫生肉眼有限;

(2)比醫生做得更快、可以輔助醫生提高工作效率的AI;

(3)可以透過大量學習資深醫生或專家經驗,幫助普通醫生或基層醫生達到工作要求的AI。

吳恩達團隊該項研究也驗證了AI在(2)和(3)方面的可行性和共性,即監督化學習和海量臨床資料。

四、越光醫療在心電智慧大賽中的突破

京東雲與AI和清華資料院提供了本次大賽計算基礎設施和計算能力,清華大學醫學院和清華長庚醫院等組織設計了比賽所用常規心電圖資料庫,共計20000多條,包括正常心電圖,八種異常心電圖(心房顫動、一度房室傳導阻滯、右束支阻滯、左前分支阻滯、室性早搏、房性早搏、早復極圖形改變和T波改變),以及“其他心電圖”。“其他心電圖”較廣泛地覆蓋了以上9類無法準確描述的心電圖資料。

越光醫療參賽演算法基於ResNet並進行了如下創新:

(1)結合深度學習與傳統心電處理及特徵工程的特點實現有效平衡,比如透過希爾伯特變換增加心電資訊,對訊號降取樣以提高效率並避免過擬合,提取QRS位置,RR,RR變化率,QRS寬度,ST段高度,電軸方向等諸多傳統特徵,對傳統特徵進行直方圖,求最高、最低、平均、方差等方式進行變換,並進行Z Normalization(歸一化),對於頻繁出現的異常採用Global Pooling,對於偶然出現的異常採用Max Pooling。

(2)使用單一模型預測互斥與共存進行分類

定義損失函式的兩部分及其主要任務,並根據訓練集資料標籤進行頻率加權:

  1. Multi-class softmax cross entropy 區分:正常,待確認異常,和未知異常
  2. Multi-label binary cross entropy 識別:8種待確認異常

(3)根據心電資料特點進行預處理和擴張

在每個Batch中,透過資料隨機擷取至最短長度作為一種資料平移的資料增強,並根據預處理結果保留有效資訊的片段。

(4) 實現更強的可解釋性

考慮到實際臨床工作中醫生可能對“黑箱”式診斷演算法存在顧慮,越光醫療引入Class Activation Mapping技術視覺化神經網路學習的關鍵過程,做到既能打破“黑箱”又能獲取醫生反饋從而進一步學習,該策略獲得總決賽評委的一致認可和好評。

開發者說 | 雲+AI賦能心電醫療領域的應用

(5)結合多種防止過擬合的方法避免過度擬合

透過多工學習共享權重,如各類異常共享ResNet提取的特徵,Global Pooling,對模型採用L2正規化項,提前終止,使用濾波降低噪音,不影響診斷的前提下,降低取樣率,及Bagging等技術。

(6)保證演算法的可擴充性

實現透過對單一模型的簡單修改即可完成對更多互斥或共存的異常分類。

越光參賽演算法一路過關斬將,得到了F1=0.879的總決賽高分以及最高答辯評分,獲得本次大賽的一等獎的同時,也被2019年國際醫學影像計算和計算機輔助領域的頂級綜合性學術會議(MICCAI)論文收錄。越光透過實踐驗證了以上創新點的正確性。

儘管如此,大賽與越光實際臨床業務還存在不少方面的差異。比如:

(1)心電資料型別與採集時間。大賽提供資料為10秒的12導聯心電圖片段。越光業務資料為連續動態心電圖(最長30天)的單導聯心電圖,或30秒的單導聯心電圖片段。雖然10秒12導聯常規心電圖機在臨床和體檢已廣泛應用,但對心律失常的診斷仍是以最少24小時的動態心電為主,而且記錄時間越長、患者佩戴依從性越好,捕捉心律失常的能力就越高,已經形成全球臨床專家共識和指南。

(2)資料規模。大賽共20000多條資料,每條資料幾百KB量級,總量幾百M。而越光業務資料每條數倍於常規心電圖,多數單條資料超過100M,資料總量達TB級別,累計幾十萬人次且保持每月不斷持續高速增長。

(3)比賽與臨床診斷要求。大賽僅要求結論性判斷,使用的F1評分兼顧準確性和敏感度的平衡。而實際臨床診斷不僅要求敏感度和準確度高,對於假陽性或假陰性的容忍度也較低。除了結論性判斷,更要求對於心拍檢出和心率檢出,甚至各類心律失常事件負荷度的統計,才能支援臨床診斷服務的要求。

(4)響應時效要求。大賽是針對離線資料進行調優,而實際臨床診斷需要實時或較短(24小時內)的準確結果才能保證患者就診流暢。

五、越光醫療在現有產品中的應用實施案例

國外臨床文獻早在2009年就進行過大規模和多中心的單導聯與12導聯的單盲診斷對比,發現針對房顫和正常心律檢測的準確性可以高達96%-99%以上。

越光現有產品透過傳統心電分析和心律失常診斷演算法,雖然在國家藥監局和FDA及CE行業標準要求的資料庫(MIT、AHA等DB)評測達到30秒及以上房顫檢出率100%,但在真實臨床使用中,仍存在需要臨床醫生稽核干預去除假陽性檢查的工作環節。因此不斷提升演算法,降低真實世界的假陽性檢出率來不斷減少一線醫生工作是AI在心電醫療應用的真實需求之一。

為此,越光將此次大賽演算法應用到透過越光產品產生的46萬人次30秒單導聯心電資料庫中,與心電醫師確認結果進行單盲比對,發現4.5%的噪聲或偽差之外,房顫檢查的準確性可以達到94.7%。越光與中國和美國心律臨床專家一道將研究結果提交2020年度的國際心律學會(Heart Rhythm)會議論文。

六、可持續性創新合作

本次大賽給予了像越光醫療這樣的醫療器械企業與京東雲與AI和清華資料院的可持續性創新合作機會。除了與臨床機構或客戶端的落地應用,越光認為企業可以在以下方面借力IT基礎設施提供方(如京東雲與AI):

(1)提供流暢和安全的資料服務:中國有3萬家醫療機構和90多萬家基層衛生服務中心,遍佈全國各地。網路條件地區性差異與海量資料上行下傳將是首要需要解決的問題,需要儘可能靠近使用者並且覆蓋多運營商的節點提供資料接收服務。此外,資料安全性要求和級別也將隨著規模的迅速擴大而提上日程。比如,可以選擇京東雲與AI OSS使用者所在地域節點實現接收並儲存資料,以達到需求。

(2)提供高速經濟的規模化模型訓練:實際臨床資料總量量級,如果在自有伺服器訓練需要經由京東雲與AI OSS相關資料服務,有耗時長且自有伺服器能力不足等缺陷。比如,可直接在京東雲上使用GPU雲主機進行資料訓練,並透過內網快速拉取OSS資料供單機使用的測量,以達到需求。

(3)模型部署與彈性伸縮:臨床實際使用中,演算法只需對每條資料一次性處理,並且每日使用頻次波峰波谷將明顯突出,與實驗或回測工作形成鮮明不同。因此,可採取直接使用CPU進行處理,並封裝至docker映象內的策略。並透過京東kubernetes叢集配合彈性伸縮對使用者資料完成及時相應,以達到需求。

在解決了以上問題的基礎上,可以和有心律失常社群化管理需求的地區性中心醫院建立心律失常分級診療醫聯體模式的多方運營合作,形成樣版工程。

七、結束語

首屆“中國心電智慧大賽”雖然順利落下帷幕,但大賽在推動中國心電人工智慧在臨床實踐方面提供了可借鑑、能實踐的案例,屬於推動健康醫療和大資料發展的一次里程碑。

在建立不斷壯大的臨床資料庫持續推動臨床和科研創新的過程中,完善可複製性產品和服務方案,既滿足醫院和患者的實際需求,又實現國家對健康中國的戰略性要求。

再次感謝本次大賽的舉辦單位,清華大學臨床醫學院、資料科學研究院,北京清華長庚醫院,青島大學附屬醫院,天津市武清區人民醫院,中關村醫院,福建省立醫院,京津高村科技創新園,京津高村科技創新園,京東雲與AI雲桌面雲平臺技術支援。

這是筆者第一次參加基於深度學習應用開發的比賽,為了讓更多像筆者一樣才入門的朋友能儘快上手,所以記錄下來了筆者整個初賽解題思路與實踐過程。最後很感謝舉辦方組織的這個比賽,讓參賽選手收穫很多實戰經驗與應用技巧。

相關文章