乳腺癌是女性最常見的浸潤性癌症,也是繼肺癌之後致女性死亡的第二大癌症。在本文中,作者將構建一個基於WideResNet的神經網路。將幻燈片影像分為兩類,一類使用深度學習分析乳腺癌,另一類不使用深度學習。
浸潤性導管癌(IDC),是最常見的乳腺癌型別。美國癌症協會預估,每年本土有超過18萬名婦女被診斷患有浸潤性乳腺癌。而癌症的型別又大多屬為IDC。
準確識別和區分乳腺癌型別是一項重要的任務。而使用基於人工智慧的自動化檢測可以大大節省時間並減少誤診的可能性。
在本文中,作者將構建一個基於WideResNet的神經網路,並將展示的影像分為兩類,一類是使用深度學習分析乳腺癌,另一類是不使用深度學習。
關於資料集
俄亥俄州克利夫蘭的凱斯·西儲大學的研究員承擔了這次資料集的收集。
(詳見:http://gleason.case.edu/webdata/jpi-dl-tutorial/IDC_regular_ps50_idx5.zip)
資料集中有162個完整的幻燈片影像。這些幻燈片通過了40倍解析度的掃描後,又被劃分成275215個50x50的畫素貼片。然後將0和1的標籤分配給每個貼片。對於包含IDC的貼片,標籤為1,不包括IDC的貼片,標籤為0。
用WideResNet對幻燈片進行分類
在剛才的分類中,我們發現使用RESNET架構連線非常成功。通過對WideResNet體系結構的研究,我們發現如果深度小到16層,也可以實現類似的效能。而這也有助於解決關於Reset的各種問題,如爆炸/消失梯度和退化。
通過閱讀Vincent Fung和Apil Tamang部落格中的資訊,我們可以對ResNet的實際用途有更深的瞭解。
ResNet的核心思想是引入一個或多個層跳過所謂的“身份快捷方式連線”。
作者認為,讓疊加層符合剩餘對映比讓它們直接適合所需的下鋪對映要容易得多。這也表明,深層次的模型應該比淺層模型要有更小的出錯率才行。ResNet也迅速成為各種計算機任務中最常用的體系結構之一。
故而,WideResNet的存在是有原因的:每增加一個百分點改進精度的成本幾乎是增加層數的兩倍。而且訓練非常深的殘餘網路會導致可重複利用特徵的減少,這也將拖慢網路訓練的速度。
為了解決以上問題,Zagoruyko和Komodakis對ResNet模組的結構進行了詳細的實驗研究,並在此基礎上提出了一種新的結構。在這種架構下,他們減少了網路的深度並增加了寬度。他們稱之為廣域網。
現在我們將逐步展示用WideResNet架構解決這個問題的過程。我們正在通過深度學習工作室,幫助我們能夠快速構建神經網路,而無需擔心編碼、語法和資料集的攝入。
1.建立專案
登入本地或雲端執行深度學習工作室,然後單擊“+”建立一個新專案。
2.資料集攝取
然後,我們在“資料”選項卡中設定此專案的資料集。通常,20%-80%是訓練和驗證之間的一個很好的分離。但如果你願意,你也可以使用其他設定。如果你機器的記憶體足夠大,你也可以將全部資料集載入到記憶體中。但請不要忘記將“記憶體中的載入資料集”設定為“完整資料集”。
3.建立神經網路
你可以通過拖放層來建立如下所示的神經網路。
確保將WideResNet 的屬性設定為可訓練。
首先密集層(Dense_3)應該具有20個左右的ReLU作為啟用功能的神經元。最終濃度圖層(Dense_1)應該將輸出尺寸設定為1,並將其啟用為sigmoid。這是因為我們將這個問題設定為迴歸而不是進一步劃分。如果迴歸結果低於0.5,那麼我們可以說輸入屬於0,(即沒有IDC癌症),否則就有IDC癌症。
4.超引數與訓練
我們使用的超級引數如下所示。(你可以隨意的改變圖中資料。)
最後,你可以檢視訓練選項卡,或監視培訓儀表板的進度。
完成訓練後,您可以在結果選項卡中檢視結果。你可以發現,在價格為每小時0.90美元的K80 GPU上,我們的精確度在85%以上。
5.部署模型
部署的模型可以作為webapp或RESTAPI訪問,如下所示:
總結
因此,你可以看到,構建深度學習模型只需花幾分鐘時間。然後在深度工作室中進行部署即可。它可以幫助許多開發人員解決複雜的問題,而不必擔心編碼、API等。