該論文由深睿醫療與北京大學王亦洲課題組合作,是其自研演算法在智慧醫療領域的應用,針對乳腺鉬鈀中的微鈣化(直徑<= 1 cm)檢出問題提出了結合生成式和判別式模型的新思路。鈣化檢測對於乳腺癌的早期診斷十分關鍵,根據美國放射學院第五版 BI-RADS 標準,可疑惡性鈣化點通常直徑在 1 cm以內。因此,研究微鈣化的檢出演算法具有重要的臨床意義。
乳腺鈣化檢測
乳腺癌是目前女性最常見的惡性腫瘤。每年發病率不斷增高,影像學對於乳腺癌的早期發現及準確診斷十分重要。鈣化點的出現是乳腺癌最重要的徵象之一,而形態不同的鈣化簇、腫塊都以早期的鈣化點不斷髮育聚集而成,因而可以通過簡單的聚類方法將其識別。因此,鈣化點的檢出是乳腺癌診斷,尤其是早期診斷中最重要的部分,為諸如腫塊、鈣化簇檢測等問題提供了基礎。
由於鈣化點通常體積小於 1 立方毫米,呈現在鉬靶影像上,且往往不超過 14 個畫素;此外,鈣化點的亮度、對比度、形狀變化很大。因此,現有的鈣化點檢測演算法 [1-3] 面臨特徵較難提取的問題。
鉬靶影像中的鈣化點示意圖 (a), (b), (c) 中的左邊分別表示原始影像,右邊是鈣化點放大的影像。(a) 來自 INBreast 資料集 [12],(b), (c) 來自私有資料集
另一方面,真實資料中只有少量樣本含有鈣化點,導致資料呈現樣本不平衡問題。因此,在訓練中,分類器往往會過度擬合負樣本,導致正樣本的檢出格外困難。
異常檢測框架
由於鈣化點形狀不規律,且相對於非鈣化樣本數量較少,因此,我們可以將這一問題轉化為有監督的異常檢測問題,即將鈣化點作為異常點。基於這個先驗知識,我們試圖擬合正常樣本影像,而將鈣化點當成異常點並試圖將這部分檢測出來。為此,我們提出了連續的生成和判別學習框架,主要分為兩步:第一步是異常分離網路(Anomaly Seperation Network,ASN),藉助重構網路強大的表示能力和 T-test 損失函式來幫助我們將正負樣本分開;第二步是假陽性消除(False Positive Reduction,FPR),來消除不屬於鈣化但形態上具有異常的區域,比如血管鈣化、鋸齒鈣化等。
方法示意圖該方法包括兩步:(1) ASN (2) FPR。ASN 即通過 Anomaly Seperation Network 去檢出候選的鈣化點,而 FPR 通過二值分類網路來做進一步假陽性消除。在 ASN 的訓練階段,我們通過 U-Net 來重構鉬靶的 patch 圖,並用 T-test 損失函式來將正常樣本和鈣化樣本分開。在 FPR 中,我們利用 ResNet-50 來做分類,而樣本為 ASN 中檢出的候選鈣化點中的負樣本和正樣本。
異常分離網路(ASN)
由於深度重構網路被證明在多種影像任務中能夠穩定地表現良好,因此我們採用深度重構網路來對鉬靶影像進行重構。具體地,我們採用 U-Net [6] 來進行畫素點的重構。在跳躍式傳遞中,我們用 3 個下采樣和 3 個上取樣階段。每個階段包含了 3 個卷積層。採用這樣的網路設計有如下三點好處:
首先,下采用操作可以帶來有效地感受野大小,這在畫素的重構和影像一致性上方面是有優勢的。
我們每次只按照 8 倍的幅度來進行下采樣。這是因為鈣化點大小通常在 14 個畫素以內,因此可以避免過多地資訊損失。
跳躍式連線可以利用淺層的特徵,進而幫助提升準確率。
我們用 f (·) 重構網路函式。給定一張影像 I,重構的殘差值定義為:
我們希望能夠重構出負樣本(正常點),而把正樣本當成異常值檢測出來。因此,我們希望對這兩類樣本的重構值分佈不同,為此,我們提出如下 T-test 損失函式來讓兩者分佈不同。
與異常檢測的聯絡
假陽性消除(FPR)
ASN 可以較好地重構負樣本,並把鈣化點當成異常值檢測出來。然而,在乳腺鉬靶中,除了乳腺鈣化點之外,還有其他種類的鈣化,它們不屬於乳腺鈣化點。如下圖所示,左邊 patch 中的綠色長方體是血管鈣化,通常是很多鈣化點的組合。而對於 ASN 來說,它們也異常於負樣本,因此被當成異常值被檢測出來。但實際上,它們和乳腺鈣化點在形態等特徵上有較大的不同,如下圖右邊的 patch 上的橘黃色圓圈所顯示的那樣。也就是說,它們和鈣化點並不難區分。因此,我們提出深度分類網路來講其它型別的鈣化和乳腺鈣化點區分開來,從而完成假陽性的消除。
左:血管鈣化;右:乳腺鈣化
更具體地,我們將 ResNet50 [8] 作為分類網路。對於每一個 patch 中的連通區域,我們將其中心作為預測的位置,並計算周圍畫素重構誤差值的和,我們將其記為 ASN 分數。對於每一個 ASN 的 patch,我們將其大小從原來的 56x56 調整為 224x224,並將其輸入到 ResNet50 中。我們使用 ASN 得分和 FPR 得分的乘積作為其最後得分。
實驗設定
我們通過將資料格式為 DICOM 的原始鉬靶資料的每個畫素值線性對映成 0-255,從而轉化為 8-bit 灰度影像。我們應用 Otsus 方法 [9] 來分割乳腺區域,並將其鉬靶影像中的背景去掉。我們採用 Adam 優化演算法,初始化的學習率為 0.0001, 伴隨著 10^(-4) 的引數下降。梯度的平均值和平方值分別為 0.9 和 0.999。β 設為 0.8,正則化引數λ_p 和λ_n 分別設為 1 和 0.1。在訓練階段,鉬靶影像被調整為 112 x 112 的大小。我們將這些 patch 影像放入到 ASN 網路中進行訓練,我們將正負樣本比例控制在 1:1,以提取出更多的候選 patch。
FPR 首先在 ImageNet 上預訓練,我們用 SGD 進行訓練,學習率為 0.001。所有被 ASN 檢出的候選鈣化點和真正的鈣化點被放入到 ResNet 50 中進行再一次訓練。
實驗結果
我們在公開資料集 InBreast [5] 和私有資料集上面,與 Faster RCNN [4] 和 U-Net [6] w FPR 對比了結果。InBreast 資料集包括 115 個病例,410 張鉬靶影像,6880 個已標註的鈣化點。表 1 中彙報了 5 折交叉驗證的結果。可以看到,本文的方法擊敗了目前最有效的幾種鈣化檢測演算法。
表 1 在 InBreast 資料集的結果(%)
為了進一步驗證演算法的有效性,本文建立了一個私有資料集,由 439 個病例,1799 張影像組成,由兩位 10 年資以上的放射科醫生,共同標記了 7588 個鈣化點。本文隨機選擇了 339 個病例 1386 張影像共計 5479 個鈣化點作為訓練樣本,50 個病例 208 張影像 1129 個鈣化點作為驗證集,50 個病例 205 張影像 980 個鈣化點作為測試集。表 2 展示了私有資料集的對比結果,可以看到本文的方法遠遠超越了主流的檢測演算法。
表 2 在私有資料集的結果(%)
為了說明我們的相比較 U-Net,我們模型的優勢不是 FPR 導致的,我們比較了 U-Net 和 ASN 的結果。
表 3 在 InBreast 資料集的結果(%)(無假陽性消除)
表 4 在私有資料集的結果(%)(無假陽性消除)
我們可以比較我們的模型和其它方法在檢出率隨著假陽性變化的曲線,如下圖所示。可以看到,在相同的假陽性下,ASN 要比 U-Net 具有更高的檢出率。加上假陽性控制這一(圖注)步後,檢出率會得到進一步的提升。
各種方法檢出率曲線比較
左圖:INBreast 上的結果;右圖:私有資料集的結果
此外,我們展示了一些用各種方法檢出的鈣化點的例子,如下圖所示。由於一些鈣化點不超過 5 個畫素點,FPN 中只能做到在處理後的影像清晰度為原始影像的 1/4 時才能檢出,但這樣影像過大以至於超過記憶體容量。因此我們從下圖中看出,前三個例子 FPN 都未能檢出鈣化點。而下圖的最後一行顯示了血管鈣化,通過假陽性消除這一步,我們的方法能夠成功將其排除。
各個方法在一些例子上的比價
第二列為真實情況,第三、四列分別為 ASN 模型和我們提出的 ASN+FPR,第五列為 U-net w FPR,第六列為 FPN FRCN
參考文獻:
[1] Viola, P., Jones, M.: Rapid object detection using a boosted cascade of simple features. In: IEEE Computer Society Conference on Computer Vision and Pattern Recognition. (2001) 511.
[2] Bria, A., Karssemeijer, N., Tortorella, F.: Learning from unbalanced data: A cascade-based approach for detecting clustered micro-calcifications. Medical Image Analysis 18 (2014) 241-252.
[3] Lu, Z., Carneiro, G., Dhungel, N., Bradley, A.P.: Automated detection of individual.
[4] Ren, S., He, K., Girshick, R., Sun, J.: Faster r-cnn: towards real-time object detection with region proposal networks. In: International Conference on Neural Information Processing Systems. (2015) 91-99.
[5] Inbreast: toward a full field digital mammographic database. Academic Radiology
19(2) (2012) 236-248.
[6] Ronneberger, Olaf, Philipp Fischer, and Thomas Brox. "U-net: Convolutional networks for biomedical image segmentation." International Conference on Medical image computing and computer-assisted intervention. Springer, Cham, 2015.
[7] Huber, Peter J. "Robust statistics." International Encyclopedia of Statistical Science. Springer, Berlin, Heidelberg, 2011. 1248-1251.
[8] He, Kaiming, et al. "Deep residual learning for image recognition." Proceedings of the IEEE conference on computer vision and pattern recognition. 2016.
[9] Otsu, N. (1979). A threshold selection method from gray-level histograms. IEEE transactions on systems, man, and cybernetics, 9(1), 62-66.