醫學影像 | DualGAN與兒科超聲心動圖分割 | MICCAI

忽逢桃林發表於2021-03-03
  • 文章轉自微信公眾號:「機器學習煉丹術」

  • 作者:煉丹兄(已授權)

  • 聯絡方式:微信cyx645016617(歡迎交流共同進步)

  • 論文名稱:“Dual Network Generative Adversarial Networks for Pediatric Echocardiography Segmentation”

0 準備工作

0.1 生詞

  • Pediatric 兒童的
  • Pediatric echocardiography 小兒超聲心動圖
  • CHD : congenital heart disease 先天心臟病

0.2

1 綜述

為了獲得高質量的分割結果,目前臨床上小兒超聲心動圖的分割主要由超聲工作者手工完成,這既費時費力,又高度依賴於超聲工作者的專業水平。為了解決這些問題,本文提出了一種新的卷積神經網路(CNN)結構,稱為雙網路一般對抗網路(DNGAN)。DNGAN由一個產生器和兩個鑑別器組成,產生器採用並行對偶網路來提取更多有用的特徵以提高效能。我們使用雙重鑑別器來強制生成器學習更多的空間特徵,並更準確地分割左心的邊緣。

2 問題提出

在這裡插入圖片描述
圖中是兒童的心臟的左心室和左心房的分割標註label,可以發現:左心房的變化比較明顯,並且內壁會存在模糊,因此目前的對於四腔的分割存在一下挑戰:
(1)因為噪音和模糊出現的邊界不清晰;
(2)心臟的尺寸對於不同人是不同的;
(3)每一個心動週期心房和心室的變化是不同的。

3 模型結構

在這裡插入圖片描述

這個DNGAN的結構如上所示:包含一個生成器和兩個鑑別器。

3.1 generator

由一個U-net和FCN並行構成,分別從輸入圖片中提取兩種特徵,然後特徵進行畫素相乘.

FCN輸出的特徵圖為\(f_1\),U-net輸出的特徵圖為\(f_2\),那麼由generator輸出的影像分割結果為\(F_G = f_1 \times f_2\).

3.2 discriminator

是一個六層的全卷積網路,然後分別用7,5,3作為卷積核的大小。卷積層後面跟著BN層和LeakReLU啟用層。

使用的是multi-scale L1損失,類似於2014年的影像分割網路Richer conv net。

4 損失

4.1 generator損失

先回顧一下一般的GAN的損失函式:
在這裡插入圖片描述
在公式中:

  • x是real image
  • z是random import for generator
  • G(z)是生成的mask
  • D(x) 是判別起判斷x是true的概率

再來看一下DNGAN的損失函式:
在這裡插入圖片描述

  • N為樣本的數量;

  • \(x_n\)為某一張兒童超聲心動圖四腔圖,\(y_n\)為對應的ground truth;

  • \(l_m\)是mean absolute error,也就是我們說的L1loss;
    在這裡插入圖片描述
    這個可以看到,\(f_D(x)\)是discrimintor提取的特徵,L表示discrimintor的層數,所以\(f_D^i(x)\)表示discrimintor第i層提取出來的特徵圖

  • \(l_{cos}\)就是常說的cross entropy;

  • \(l_{D_2}\)是第二個discriminitor的損失函式,也比較複雜我們來看一下,這個損失函式分辨的是:輸入的是生成的mask還是真實的mask

5 資料描述

  • 資料集包含87個兒童超聲心動圖;
  • 蒐集的是0到10歲的健康的兒童,每個視訊至少包含24幀和一個完成的心動週期;
  • 隨機選擇67個視訊,抽取了1765個圖片作為訓練集;剩下20個視訊抽取451個視訊作為測試集;
  • 原始圖片的解析度是1016x708或者636x432,所有的圖片經過中心crop後變成704x704和448x448;

6 總結

1, 這篇文章的結果和過程存在疑點,文章中出現一處公式的疑似符號錯誤。
在這裡插入圖片描述

2, 文章中的並沒有給出第二個discrimintor的loss使用MSE和BCE的平均值的原因,不確定是否之前就有文章已經討論過這個樣做的優勢。從結果來看,使用GAN的框架來訓練造成的提升並不高,反而提升分割精度的重點應該是分割網路的特徵融合和寬度增加。
3, 文章使用GAN應用在兒童超聲心臟病上的出發點很好,希望可以幫助更多的兒童擺脫先天性心臟病的困擾。

相關文章