協和眼科牽頭 ,5 家眼科中心同發力,用 AI 助力 13 種眼底疾病檢測

發表於2024-02-21

眼睛方寸之間,疾病千差萬別。去年底,由愛康集團與鷹瞳 Airdoc 聯合釋出的《四百萬體檢人群健康藍皮書》顯示,近年來眼底異常的總檢出率連年上升,已從 2019-2020 年的 76.1%,上升至 2022-2023 年的 78.7%。眼底疾病的發病率持續攀升,已成為世界範圍內最常見的不可逆致盲因素。

由於眼科疾病的診斷高度依賴於影像識別,眼科專業非常適合深度學習等技術的應用。為了進一步挖掘深度學習在眼底疾病診斷中的潛在價值,由北京協和醫院眼科主任陳有信牽頭、全國 5 家眼科中心(北京協和醫院眼科、四川大學華西醫院、河北醫科大學第二醫院、天津醫科大學眼科醫院、溫州醫科大學附屬眼視光醫院)與北京致遠慧圖科技有限公司、中國人民大學資訊學院李錫榮教授合作,透過開發深度學習系統 (DLS, deep learning system),助力初級眼科醫生的診斷一致性提高了約 12%,為 13 種主要眼底疾病的自動檢測提供了一種新的方法

研究亮點:

  • 本研究透過前瞻性臨床試驗,旨在評價 DLS 在協助初級眼科醫生檢測 13 種主要眼底疾病方面的診斷效能
  • 採用 DLS 後,初級眼科醫師的診斷一致性提高了約 12%
  • DLS 應該能夠檢測到至少一種現有疾病,這與定義新指標的初衷一致

在這裡插入圖片描述

論文地址:
https://doi.org/10.1038/s41746-023-00991-9
關注公眾號,後臺回覆「DLS」獲取完整 PDF

DLS:開啟眼底疾病診斷新思路

資料集:網羅眼底影像,確保結果準確

相比此前研究,本研究收集了更多的彩色眼底攝影資料,將資料總量擴大到 81,395 張影像(訓練集 77,181 張、 驗證集 1,087 張,測試集 3,127 張)。

模型構成:兩大研究模型,協同構建流程

DLS 由影像質量評估模型 (quality assessment model) 和診斷模型 (diagnostic model) 兩部分組成,工作流程如下圖所示:

在這裡插入圖片描述

DLS的工作流程

影像質量評估模型是建立在 ResNet-34 CNN 之上的迴歸模型,透過輸入單幅眼底影像,從影像質量評估模型入手,判斷影像質量是否適合診斷。如果適合,診斷模型將生成診斷建議;反之,系統會發出警報,提示影像質量不適合診斷,但系統無法提供診斷建議。

眼底疾病診斷模型是基於此前工作的擴充套件,以 CNN 模型 seResNext50 為主要結構。全連線層設計有兩個分支,用於確定是否存在疾病,以及存在哪些特定疾病。為了更好地穩定預測結果,該研究訓練了 3 個具有後期融合的並行 seResNext50 模型。

研究設計:五大醫院聯動,多因素確保結果可靠

本研究在北京協和醫院、四川大學華西醫院、河北醫科大學第二醫院、天津醫科大學眼科醫院、溫州醫科大學眼科醫院 5 家三級醫院開展。從 2020 年 8 月至 2021 年 1 月,共有 750 名參與者進行了前瞻性篩選,其中 748 人完成了所有手術。參與者均為年齡介於 18 至 75 歲的門診病人,平均年齡為 51.7 歲,分別患有糖尿病 152 例 (20.3%)、高血壓 216 例 (28.9%) 和高血脂 104 例 (13.9%)。其中,男性患者 324 例 (43.3%)。他們都曾到 5 家醫院的任意一家接受眼底影像檢查,均有完整的醫療記錄,並接受了全面的眼科檢查。

研究邀請到了 6 位眼科專家(至少工作 5 年的副教授)對影像進行標註,最終以他們共同討論決定的診斷結果最為核定標準。此外,還有 9 名初級眼科醫生(住院醫師或年資少於 3 年的主治醫師)接受了培訓,並在研究中閱讀影像進行評估。

經過一週的洗脫期後,他們會再次對同一組影像進行標註,這些影像被隨機重新排序並貼上 DLS 先前標註的標籤,形成試驗組。同時,每位初級眼科醫生均被分配獨立標註部分資料集,作為對照組。另外,所有入組眼底影像均經 DLS 標記為 DLS 組。

該研究可完全分析的影像子集為 1,493 張,根據 6 名資深眼科醫師的批註和討論,其中 477 張 (32.0%) 眼底標記為正常。另有 1,016 張 (68.1%) 影像標記疾病,其中有 1,386 張 (92.8%) 僅標記一種疾病,78 張 (5.2%) 標記了兩種疾病,29 張 (1.9%) 標記了 3 種疾病,共有 251 張 (16.8%) 的影像被標註為「其他異常」。

在這裡插入圖片描述

研究流程及各組主要研究指標結果

眼底影像由熟練的技術人員用雙眼(非)散瞳眼底相機拍攝,採用標準操作程式,以確保後續標註和讀取的影像質量。

在這裡插入圖片描述

入選和排除標準的參與患者和眼底影像

本研究的疾病選擇是根據其流行程度和對視覺功能的威脅來決定,同時也考慮到使用眼底影像進行篩查的臨床潛力。最終,研究選擇了 13 種具有標準診斷標準的主要眼底疾病,包括可轉診的糖尿病視網膜病變 (DR)、視網膜靜脈阻塞 (RVO)、視網膜分支動脈阻塞 (RAO)、病理性近視、視網膜脫離 (RD)、原發性視網膜色素變性 (RP)、萎縮性和新生血管性老年黃斑變性 (AMD)、視網膜前膜 (ERM)、黃斑裂孔 (MH)、中心性漿液性脈絡膜視網膜病變 (CSC)、疑似青光眼性視神經病變 (GON) 和視神經萎縮等。如果影像中包含其他疾病的徵象,但不包括在所選的 13 種疾病中,則將其歸入「其他眼底異常」類別。

在這裡插入圖片描述

三組實驗針對不同疾病診斷的敏感性、特異性及 F1 值

實驗結果:DLS 可有效發現特定眼底疾病,也會影響診斷準確性

與對照組相比,初級眼科醫生有 888 張 (59.4%) 影像的標註發生了改變。其中 801 張 (53.5%) 圖片根據 AI 的建議進行了修改。雖然在某些情況下,初級眼科醫生會根據 DLS 的建議誤將原本正確的診斷決定改為錯誤標籤,但其也確實從中得到了很多幫助。

在這裡插入圖片描述

各類別醫生改變診斷決定的情況
藍色是變更為錯誤診斷標籤,紅色是變更為正確標籤

該研究表示, 這是首次證明 DLS 可以幫助初級眼科醫生在多種重大眼底疾病的檢測中顯著提高診斷一致性的臨床試驗,同時也證明了初級眼科醫生基於 DLS 輔助的多重眼底疾病篩查影像閱讀模式是一種有效的臨床方法。

在該研究中,DLS 的總體疾病診斷敏感性和特異性分別達到 96.6% 和 81.8%,可以有效地發現特定的眼底疾病,發現眼底異常,並協助患者轉診進行專門的調查和評估。此外,高特異性有助於減少不必要的轉診和醫療費用。

該研究設定了 3 個對照組,分別為 AI 輔助醫生閱片組(試驗組),醫生獨立閱片組(對照組)和 AI 閱片組(AI組)。

結果顯示,試驗組、對照組和 AI 組診斷一致率分別為 84.9%、72.9% 和 85.5%,即在 AI 輔助下,低年資醫師讀圖診斷能力可提高約 12%。在本研究中,試驗組和 DLS 組的診斷一致性相似,這表明單獨使用 DLS 可以充分發揮作用。然而,讓人類醫生參與進來仍然至關重要。儘管基於人工智慧的疾病篩查和識別已經被廣泛應用於實際臨床實踐,但其也引入了誤診等相關風險。

此外,在本研究中,試驗組和對照組對眼底疾病的敏感性相當,且試驗組明顯優於對照組,特別是對包括疑似 GON、視神經萎縮、萎縮性 AMD、和 CSC 等疾病。這些結果表明,初級眼科醫生能夠區分眼底異常與正常,但對特定疾病的診斷仍有缺失,這一缺陷可以透過 DLS 輔助來解決,從而大大降低漏診率,同時也減少了初級眼科醫生對眼底疾病診斷的專業化程度限制

但是,對照組的診斷準確率 (60.5%) 高於試驗組 (44.2%)。透過回顧標註,該研究發現 DLS 傾向於為一張影像標註更多的標籤,這將有助於減少初級眼科醫生的漏診,但同時也會影響診斷的準確性。

此外,該研究仍然具有一定的侷限性。首先,儘管資料集選定了眼底疾病的真實影像,但其中一些類別僅包含少量影像,這可能導致結果存在偏差,而且所有參與者均為中國漢族患者。在未來的工作中,還需要進一步擴大前瞻性資料集,豐富患者的型別。

其次,本研究選擇的一些疾病需要從視網膜周圍區域開始收集,這超出了眼底影像的範圍。因此,DLS 在初始階段無法檢測到它們。研究採用寬視場彩色眼底攝影,可以在一定程度上解決這一問題。

第三,由於在 DLS 的幫助下,初級眼科醫生的診斷能力得到了很大的提高,該技術也可以作為用於教育目的應用場景,這也是一個有意義的課題,需要在今後的工作中進行更全面的考察和評價。

陳有信教授深耕眼底醫學,推進 AI 應用

「北京協和醫院有多牛?」——這是某中文社交媒體上活躍的一個帖子,下面無數的跟帖用一個個罕見病例論證著北京協和醫院的醫術高超。作為「東方的維也納眼科中心」,協和醫院眼科也長期活躍在行業第一梯隊,其現任現任科主任陳有信可謂是中國眼科發展史的見證者和創造者。

1993 年,初入眼科領域的陳有信醫師,作為張承芬教授的眼底病學博士來到協和醫院。2001 年,遠在美國留學的陳有信教授收到了來自當時中華醫學會眼科學分會的主委趙家良教授的郵件,郵件中提到希望他能早日回國幫助籌備次年的第8屆全國眼科學術大會。經過深思熟慮,陳有信最終提前終止學業,選擇回國搭建全國眼科年會這個後來幫助了無數中國眼科醫生開啟視野的平臺

在眼底醫學方面,陳有信教授深耕久遠。1982 年,美國 Yannuzzi 教授在一場黃斑學會的會議上,首次報導並命名了一種眼底病:特發性脈絡膜息肉樣血管病變 (Polypoidal choroidal vasculopathy, PCV)。隨著研究的深入,學者發現此病在亞洲人群中發病率最高,龐大人群基數也導致我國此病病患較多。2017 年,由陳有信教授發起的中國眼科界首個「PCV 研究聯盟」成立。

隨後,陳有信教授牽頭聯合國內多家單位開展了 START 研究,即康柏西普眼用注射液治療 PCV 的真實世界研究。最終,由陳有信教授團隊領銜的「息肉狀脈絡膜血管病變診療體系的建立及理論創新」榮獲 2022 年度華夏醫學科技獎二等獎

此外,本論文的第一作者李冰師從陳有信教授及北京協和醫院眼科眼底病專家葉俊傑教授,目前任北京協和醫院眼科住院醫師,已經作為第一作者發表 SCI 及中文核心期刊論文 10 餘篇,多次在全國眼科年會、全國眼底病會等學術會議作報告。

在 AI 輔助識別眼底病方面,協和眼科走在時代最前沿。早在 2021 年,陳有信教授已經透過人工智慧成功識別了靜脈阻塞、糖尿病病變、黃斑變性等多個病種,這個也獲得了北京市重點課題的資助 500 萬元。

目前,協和醫院眼科已經開展了人工智慧在眼科疾病篩查、治療預測、眼與全身病關聯性、多模態和廣角眼底病變及多病種病變識別研究,並且在很多基層場景得到了應用推廣,為解決因醫療資源發展不均衡導致的看病難看病貴的問題,提供了思路和解決辦法。

在陳有信教授看來,所有的努力都是旨在把醫療資源下沉下去,為那些遠離大城市的患者提供更好的診治。藉由人工智慧等技術的發展,陳有信教授的努力已經初見成效,未來也將持續攻堅克難,在相關疾病的發病機制、發病規律、診斷及治療等方面持續發揮人工智慧的力量。

參考資料:
1.https://mp.weixin.qq.com/s/zctJN7Q7PYjsPypkStWcoA
2.https://mp.weixin.qq.com/s/LoXWmWVpYnrr1-vKBrpL6A
3.https://mp.weixin.qq.com/s/IFS5JWIyb_5mqfJccAQO2g
4.https://mp.weixin.qq.com/s/zxP9n_vGWNcH2rPW-dq37g
5.https://www.pumch.cn/detail/34540.html

相關文章