深度學習判別新冠肺炎準確率達九成,《Radiology》已收錄相關研究成果

動脈網VCBEAT發表於2020-03-27
從武漢封城記起,僅僅一週後,各家企業針對新冠肺炎開發的肺部人工智慧輔助演算法便陸續研發完畢,並登陸了包含武漢市中心醫院、武漢協和醫院在內的最前線醫院。

但從功能上來說,在疫情之中,許多AI的職能更多在於幫助醫生審閱來自患者的CT影像,捕獲其肺部的異常區域,但難以進一步區分肺炎患者究竟是患的哪一類肺炎。

這是一個非常有趣的問題,它關乎到影像學能以怎樣的能力為人類發現如新冠這樣的傳染病。過去已有研究人員將深度學習用於處理小兒胸部X光片,其結果正是這項技術可用於檢測和區分感染細菌性和病毒性肺炎的兒童。而在CT領域,尚無學者對相關問題拿出大樣本有效性研究的試驗結果和高質量論文。

從這個問題出發,許多學者開始了自己的研究,有的嘗試從肺段入手,藉助不同肺炎的肺段引數差異判斷肺炎的種類;有的嘗試聯合病原學,將病原學結果與影像結果一一對應……近日,一篇完全基於肺部CT影像的深度學習判別新冠肺炎的論文《Artificial Intelligence Distinguishes COVID-19 from Community Acquired Pneumonia on Chest CT》被國際頂級放射學期刊《Radiology》所接收,這篇文章使用的演算法似乎在尋覓新冠肺炎的CT影像學特徵方面找到了竅門。 

簡單地說,這一研究是一次針對於新冠肺炎患者CT影像的回顧性研究,研究人員構建了一種特定的3D檢測神經網路,並將其用於檢測4356例CT資料。結果顯示,該演算法對新冠肺炎的鑑別靈敏度和特異性分別高達89.76%和95.77%,受試者工作特徵(ROC)曲線下面積(AUC)為0.96。 

這篇論文由醫療AI影像企業科亞醫療攜手國內六家醫院共同研究發表。科亞醫療是國內首個人工智慧三類醫療器械註冊證獲證企業,一直專注於大資料和人工智慧技術在醫療領域的落地應用,其獲證產品“深脈分數”更是獲得了國家藥監局“具有重大的經濟效益和社會價值“的定調評價。與國內外同類CTFFR產品相比,“深脈分數”各項指標均處於國際領先水平。 

科亞醫療告訴動脈網:“本篇論文的意義在於首次使用基於深度學習的技術,對胸部CT影像進行新冠肺炎(COVID-19),社群獲得性肺炎(CAP),及非肺炎(Non-pneumonnia)的三分類研究,並獲得了令人興奮的結果。在這之前,有學者進行了在二維X-ray胸片上肺炎分類的研究,而在三維CT肺部影像上肺炎的分類還是空白。而此次在全國乃至全球抗擊新冠肺炎時期,我們科亞醫療構建的深度學習神經網路COVNet,從肺部CT中提取各類影像特徵用於鑑別新冠肺炎,並且通過熱力圖的方式對模型做出決策的重要區域進行視覺化,來說明模型識別的關鍵病變區域。

通過多中心醫院的資料驗證,COVNet網路模型對COVID-19,CAP和非肺炎的檢測都有較高的靈敏度和特異性。而對COVID-19的檢測,ROC下曲線面積高達0.96. 本論文開啟了基於深度學習技術的肺部CT影像肺炎多種類分類的研究,對像COVID-19,SARS,MERS等傳染性肺炎,提供了一種快速AI影像篩查方式的思路,希望能為全球抗擊新冠肺炎拋磚引玉。”

實驗設計與模型建立

本次研究採集了來自六家醫院3506位患者,總計4536次三維胸部CT檢查影像。在排除造影CT檢查與單張切片厚度大於3mm的檢查後,研究構建了一個包含3322名患者,總計4356項三維胸部CT檢查影像的資料集。這些患者的平均年齡為49±15歲,其中男性1838名,女性1484名。在這個資料集中,感染COVID-19的患者影像有1296例(30%,均通過RT-PCR檢查確認為陽性);感染社群獲得性肺炎(CAP)的患者影像1735例(40%);非肺炎的患者影像1325例(30%)。 

所有檢查資料均按9:1的比例隨機分為患者的訓練集和獨立測試集。然後將訓練資料集進一步按9:1的比例拆分用以訓練模型和內部驗證。獨立測試集未用於訓練和內部驗證。 

為了減少實驗出現偏差的可能性,這些資料分屬於六家不同的醫院,同時將收錄時間控制於2016年8月16日至2020年2月17日,其中COVID-19部分僅使用採集於2019年12月31日至2020年2月17日間的資料。 

由於不同醫院使用的CT裝置廠家存在差異,所以本次實驗所用的影像均從DICOM檔案匯出,所有CT切片厚度控制在0.5mm至3mm之間,影像矩陣大小為512*512,影像解析度大小在0.29*0.29mm2到0.98*0.98mm2之間。 深度學習判別新冠肺炎準確率達九成,《Radiology》已收錄相關研究成果

Fig.1:演算法流程圖

Fig.1是本論文演算法的整體流程圖,主要包含四個步驟:

第一步,模型訓練和測試資料庫的構建。按照上述資料介紹進行處理。

第二步,是資料集的預處理,包含資料增廣和肺部區域的分割。本論文采用基於U-Net架構的網路進行肺部區域的分割,以便去除非肺區域對後續檢測演算法的影響。

第三步,將預處理後的資料集輸入到COVNet網路進行深度學習演算法的訓練。

第四步,對獨立測試集進行預處理(肺部區域提取),輸入到第三步中訓練好的COVNet模型中進行預測分類。 

科亞醫療將這個用於檢測COVID-19的3D深度學習框架命名為COVNet。這一卷積神經網路以Resnet50為主幹,能夠從輸入CT影像中同時提取2D區域性和3D全域性代表性特徵圖(如Fig.2)。COVNet使用最大池化層和全連線層來綜合分析這些特徵圖,最終產生每種型別(COVID-19,CAP和非肺炎)的概率評分。 

深度學習判別新冠肺炎準確率達九成,《Radiology》已收錄相關研究成果

Fig.2:新冠肺炎檢測神經網路COVNet框架圖

COVID-19:新冠肺炎;CAP:社群獲得性肺炎;Non-Pneumonia:其他非肺炎

統計與結果

統計資料顯示,將COVNet應用在工作站(GPU NVIDIA Quadro M4000 8GB,RAM 16GB和Intel Xeon Processor E5-1620 v4 @ 3.5GHz)上,每次CT檢查肺炎預測所耗費的平均時間為4.51秒,遠遠快於醫生單個CT影像組閱片速度。

而在檢測準確度方面,演算法對於COVID-19檢測的靈敏度和特異性為90%與96%;對於CAP檢測的靈敏度和特異性為87%與92%;而對於非肺炎影像,演算法的靈敏度和特異性為94%與96%。檢測結果詳見Table1。

深度學習判別新冠肺炎準確率達九成,《Radiology》已收錄相關研究成果

Table1:深度學習框架COVNet在獨立測試集上的效能

為了提高模型的可解釋性,科亞醫療採用梯度加權類啟用對映(Grad-CAM)方法,實現推動深度學習模型決策重要區域的視覺化。以下三張圖片(Fig.3a,Fig.3b,Fig.3c)分別以區域熱圖的方式展示了COVID-19、CAP與非肺炎三種情況之下,引導深度學習演算法作出決策的區域。

通過這種方式,我們能夠很輕易地瞭解深度學習關注的影像特徵,而這些影像特徵給研究人員具體研究COVID-19影像特性指出了明確的方向。

深度學習判別新冠肺炎準確率達九成,《Radiology》已收錄相關研究成果

Fig.3a COVID-19預測輸出熱圖,紅色突出顯示與預測類別相關的啟用區域

深度學習判別新冠肺炎準確率達九成,《Radiology》已收錄相關研究成果

Fig.3b CAP預測輸出熱圖,紅色突出顯示與預測類別相關的啟用區域

深度學習判別新冠肺炎準確率達九成,《Radiology》已收錄相關研究成果 Fig.3c 非肺炎預測輸出熱圖

侷限性與發展方向

肺部許多疾病的影像特徵存在大量重疊,這些疾病取決於患者年齡、藥物反應性、免疫狀態、潛在疾病合併症等宿主因素,僅憑胸部CT的影像學表現,很難區分所有肺部疾病。

另外,本研究目前僅對COVID-19進行了分類預測,尚未對感染程度進行分類。科亞醫療表示:“接下來我們將嘗試將試驗進一步細化,在預測COVID-19存在的同時,去預測患者感染的嚴重程度,以幫助醫生進一步監測、治療、管理患者。”

科亞醫療的研究具備足夠的創新性,其臨床應用將在提高基於CT影像診斷新冠肺炎準確度的同時,幫助臨床醫生及早確診感染患者,大幅提升一線醫生診斷效率,優化新冠肺炎篩查流程,實現高效精準篩查、降低醫生工作強度,合理分配醫療資源的作用。 

正如一位醫生所說:“影像科的醫生偏好於給予‘佔位性病變’的判斷,而很少診斷為肺炎。但對於患者而言,佔位性病變的內容太過寬泛,他們需要更為精確的判斷,這種判斷現在很少來源於影像科。如今,很多人工智慧都在處理資料做定量分析,但這些工作並非人工智慧的專長——常規資料處理軟體也能收集挖掘資料。所以,AI要想發揮出真正的價值,需要藉助於定量的資料給出定性的判斷結果。” 

科亞醫療在探索未知的AI潛力中走出了珍貴的一步,影像科到底能夠發揮怎樣的作用,還需AI公司進一步用深度學習探索畫素之中的未知,答案或許便隱藏在點與點之中。

相關文章