深度學習在醫療影象疾病檢測方向上的發展很快,但目前仍面臨著易出現假陽性的問題。近日,百度研究人員提出了 NCRF(神經條件隨機場)方法,在提升腫瘤影象準確率的同時也減少了假陽性的出現機率。該研究的論文已被即將在 7 月舉行的深度學習醫療影象大會 MIDL 2018 接收。
NCRF 專案已經開源:https://github.com/baidu-research/NCRF
目前在醫療領域有很多癌症診斷方法,其中病理學活體檢測被認為是最為可信的標準。然而,對病理學切片進行分析並不是一件容易的事,即使對於經驗豐富的病理學家而言也是有挑戰的事情。一個放大 40 倍的病理切片數字影象通常包含數十億畫素,而在這樣大規模的內容裡,病理學家有時需要找尋微轉移、腫瘤細胞細小群體等早期癌症徵兆。這些任務讓審查病理切片,而不遺漏任何臨床證據成為了一項非常複雜耗時的工作。
隨著人工智慧的發展,人們已經提出了各種基於深度學習的演算法來幫助病理學家有效審查這些切片,並檢測癌症轉移。由於切片的原始數字影象非常大,大多數演算法目前會將圖片切割成大量小圖片 (patch) 進行處理,如 256×256 畫素尺寸的圖片——然後訓練並使用深度卷積神經網路來對腫瘤細胞和正常細胞進行分類。然而,這種方法有時難以在不知曉周圍內容的情況下預測小圖片中是否存在腫瘤,特別是在腫瘤/正常區域的邊界上,經常會出現假陽性。
圖 2 展示了這類方法的困難:
百度研究人員近日提出了一個新的深度學習演算法,該方法不僅分析單個小圖片,也將圖片四周臨近的網格一併輸入進行腫瘤細胞分析。就像放大圖片,看到更大區域從而做出更有置信度的判斷一樣。在這裡,相鄰切片之間的空間相關性通過特定型別的概率圖形模型(條件隨機場)進行建模。整個深度學習框架可以在 GPU 上進行端到端的訓練,無需任何後處理過程。
圖 3 展示了該演算法的架構:
百度研究人員稱,通過考慮相鄰圖片之間的相關性,新演算法發生的誤報次數少了很多。圖 4 展示了在示例腫瘤圖片上,新演算法與不考慮臨近圖片的演算法之間的預測效果比較。我們可以看到,除了基本的真腫瘤區域以外,新演算法的假陽性區域相較基準演算法要少很多。
圖 4.(a) 原始的完整切片影象;(b) 病理學家註釋的影象,白色區域表示癌症轉移;(c) 通過之前的演算法預測癌症區域,不考慮臨近影象塊;(d) 通過百度的演算法預測癌症區域。
在 Camelyon16 挑戰賽測試集上,百度的演算法在癌症定位上的得分(FROC)為 0.8096,超越了專業的病理學家(0.7240)和前一個 Camelyon16 挑戰賽冠軍(0.8074)。此外,百度還在 GitHub 上開源了此演算法,希望能夠促進病理分析領域的 AI 研究。
這種全新的癌症檢測演算法有潛力改進病理切片鏡檢的效率與準確率。這能使得病理學家更加關注演算法重點強調的癌症區域,而不是檢查整個切片。不過,要綜合評估該演算法,還需要在更大資料集上做進一步的臨床研究。
更多資訊可檢視以下論文:
注:在數字病理切片中,在 40 倍的放大下一個畫素大概長 0.243 微米。微轉移一般定義為一組癌細胞最大直徑超過 200 微米,也就是大概 823 畫素。
論文:Cancer Metastasis Detection With Neural Conditional Random Field
論文連結:https://openreview.net/forum?id=S1aY66iiM
摘要:乳腺癌診斷通常要求通過全切片數字化影象(WSI)對淋巴結癌細胞轉移進行準確檢測。近期深度卷積神經網路的發展使得醫療影像分析取得了極大成功,尤其是在計算病理組織學方面。由於 WSI 非常大,大部分方法都將整張影象切分成很多小的影象塊,再對每個影象塊分別進行分類。但是,相鄰影象塊通常具備空間關聯,忽視此類關聯可能會導致預測結果不一致。本論文提出一種神經條件隨機場(neural conditional random field,NCRF)深度學習框架,來檢測 WSI 中的癌細胞轉移。NCRF 通過一個直接位於 CNN 特徵提取器上方的全連線 CRF,來考慮相鄰影象塊之間的空間關聯。整個深度網路可以使用標準反向傳播演算法,以最小算力進行端到端的訓練。CNN 特徵提取器也可以從利用 CRF 考慮空間關聯中受益。與不考慮空間關聯的基線方法相比,NCRF 框架可獲取更高視覺質量的影象塊預測概率圖。我們還展示了在 Camelyon16 資料集上該方法在癌細胞轉移檢測方面優於基線方法,在測試集上取得了 0.8096 的平均 FROC 分數。