皮膚類疾病是全球最常見的疾病之一,僅次於感冒、疲勞和頭痛。據估計,全球有25%的患者接受的治療都是針對皮膚問題的,在這部分患者中,多達37%的人至少有過一次以上因皮膚問題而就醫的情況。皮膚科龐大的工作量以及全球皮膚科醫生的短缺迫使一些患者只能在全科醫生處進行相關皮膚類疾病就診,而全科醫生在診斷病情方面又不如專家準確。這一趨勢促使谷歌的研究人員研發了一種能夠發現初級護理中最常見的皮膚病的人工智慧系統。人工智慧系統的開發基於深度學習(deep learning)來解決初級保健中最常見的皮膚問題,這項研究旨在增強全科醫生診斷皮膚類疾病的能力。當提供有關患者病例的影像和後設資料時,AI可以在26種不同的皮膚疾病下實現準確發現,其準確度能比肩資深的皮膚科專家。通常來說,皮膚科醫生在診斷任何皮膚疾病時,不會只給出單一診斷,他們會根據病人實際狀況以及疾病原理列出一個可能疾病的範圍,進而再透過後續的問診、測試、成像等方式縮小疾病範圍。這款最新的AI系統也是如此,它處理的輸入資料包括一個或多個皮膚異常的臨床影像和多達45種後設資料型別(例如,病史、年齡、性別、現有症狀等)。研究小組表示,人工智慧系統使用來自兩個州17個初級保健診所的17,777例確診病例對該模型進行評估。他們將訓練AI的語料庫一分為二,將2010-2017年期間病例用作訓練AI的資料集,將2017-2018年病例用作評估AI是否準確地參照資料集。同時在訓練期間,該模型利用40多名皮膚科醫生提供的50,000多例診斷例項不斷自我“精進技藝”。圖片來源:Pixabay接著,為了確保AI的診斷準確性,研究人員彙集三名頂尖的皮膚科醫生的診斷結果來加以驗證。透過對3750多例病例的彙總得出真實標籤,AI對皮膚疾病的排名列表中top 1以及top 3的常見疾病的診斷準確度分別達71%和93%。此外,當系統與三類臨床醫生(皮膚科醫生、全科醫生和實習醫師)在診斷疾病的準確率進行比較時,其以90%的準確度勝於皮膚科醫生75%、全科醫生60%、實習醫師55%的診斷準確率。
圖片來源:Google最後,為了評估對不同皮膚型別的潛在偏差,該團隊根據Fitzpatrick皮膚分型(譯者注:膚色根據對日光照射後的灼傷或曬黑的反應可分為 I-VI 型。I 型:總是灼傷 , 從不曬黑;II 型:總是灼傷 , 有時曬黑;III 型:有時灼傷 , 有時曬黑;IV 型:很少灼傷 , 經常曬黑;V 型:從不灼傷 , 經常曬黑;VI 型:從不灼傷 , 總是曬黑。歐美人皮膚基底層黑色素較少,屬I, II 型;黃皮膚人種為III, IV型,皮膚基底層黑色素含量中等;非洲棕黑色皮膚為V, VI型,皮膚基底層黑色素含量很高)測試了AI系統的效能。
研究人員將注意力集中在至少佔5%資料的皮膚型別上,他們發現該模型的效能表現與驗證AI準確性該步驟相似。當膚色、人種有區別時,AI對top 1常見皮膚疾病的診斷率為69%-72%,對top 3 常見疾病的診斷率為91%-94%。換言之,該AI不會因為膚色的差別而進行誤判。圖片來源:Pixabay目前,該AI系統還是存在一定侷限性。首先,現在的後設資料都源於一個資料出處,資料範圍還不夠廣泛;其次,Fitzpatrick皮膚型別中一些皮膚疾病太過罕見,用於常見疾病的AI系統並不適用;再者,一些類似於黑色素瘤的資料樣本該AI還未學會如何進行分析,所以該人工智慧還有更多上升完善的空間。
相信在不久的將來,這些限制可以透過AI不斷加強學習更多型別的皮膚病型別和資料的方式解決。深度學習為皮膚病的鑑別診斷提供資訊,這一實驗的成功無疑會減輕醫生許多負擔,未來也可更多用於幫助分類病例、指導臨床護理的優先順序、或幫助全科醫生更準確地啟動皮膚病治療程式,從而改善皮膚病患者的治療與護理。[1] Google says its AI detects 26skin conditions as accurately as dermatologists Retrieved Sep 16, 2019 from https://venturebeat.com/2019/09/13/googles-ai-detects-26-skin-conditions-as-accurately-as-dermatologists/[2] A deep learning system for differential diagnosisof skin diseases Retrieved Sep 16, 2019 from https://arxiv.org/abs/1909.05382