劍指全球第一大癌症,中國學者建立乳腺癌預後評分系統 MIRS

發表於2024-02-12

世界衛生組織國際癌症研究機構 (IARC) 釋出的 2020 年全球最新癌症負擔資料顯示,2020 年全世界乳腺癌新發病例數的快速增長達 226 萬,首次正式取代肺癌成為全球第一大癌症。其中,我國女性新發乳腺癌病例數 42 萬例,位居第一,遠超女性其他癌症型別。

由於具有高併發率和高死亡率的特點,乳腺癌嚴重威脅著全球女性的健康。但如果能夠做到及早發現、並按照最佳實踐進行治療,則有望大大改善存活率。根據美國癌症協會的資料,1989 年至 2016 年間,乳腺癌的死亡率已經降低了 40%。

近年來,人工智慧在醫學影像、病理、輔助決策系統等方面取得的巨大進步,其在乳腺癌病理領域已經形成了三大主要研究方向:細胞層級的核分裂象檢測、區域層級的腫瘤區域檢測與分割等、針對免疫組化的量化分析。

腫瘤浸潤免疫細胞 (TIICs) 以及腫瘤轉移是人體出現腫瘤的重要特徵。前不久,來自美國肯塔基大學、澳門科技大學、澳門大學、廣州醫科大學第一附屬醫院的研究人員採用神經網路模型,建立了一個精準的預後評分系統——MIRS (metastasis and immunogenomic risk score) ,用於腫瘤轉移與免疫基因組風險評分,提供了一項幾乎普遍適用於乳腺癌患者的預測工具,為乳腺癌人群的治療選擇提供了新方向。

研究亮點

  • MIRS,一種預測乳腺癌預後和治療的評分系統,可用於指導乳腺癌患者治療策略的制定
  • 本研究分析了轉移與免疫浸潤對乳腺癌預後的影響
  • MIRS 可為不同 BRCA 亞型提供指導, IVL 在 TNBC 亞型中的表達水平最高

本文的通訊作者 Xiaohua Douglas Zhang,是美國肯塔基大學生物統計學教授,獲得了卡內基梅隆大學的統計學博士學位,北京大學光華管理學院的管理學 EMBA 學位,北京大學的遺傳學碩士學位和北京師範大學的生物學學士學位。值得一提的是,其還曾在 Merck 工作了 14 年,曾擔任高階首席科學家。
個人主頁:

https://cph.uky.edu/directory/xiaohua-zhang

在這裡插入圖片描述

獲取論文:
https://doi.org/10.1016/j.isci.2023.108322

關注公眾號,後臺回覆「MIRS」獲取完整 PDF

資料集:差異表達基因千里挑一

該研究首先應用單樣本基因集分析 (ssGSEA),從 TCGA (The Cancer Genome Atlas,癌症基因組圖譜) 資料庫中篩選出乳腺癌患者與腫瘤微環境相關的 45 個免疫特徵的富集評分。

在這裡插入圖片描述

MIRS 工作流程

基於這些資料,該研究進一步採用分層聚類法,將患者分為高免疫細胞浸潤組和低免疫細胞浸潤組。隨後,研究人員透過 Wilcoxon 秩和檢驗 (Wilcoxon rank-sum test),鑑定出高、低免疫細胞浸潤組的差異表達基因 (DEGs) 有 1222 個。

與此同時,為了檢測與轉移相關的基因,該研究還基於 GSE10893 (n=18) 和 GSE3521 (n=75) 兩大 GEO (Gene Expression Omnibus,基因表達綜合資料庫) 佇列,在乳腺癌轉移患者與原發患者之間進行 Wilcoxon 秩和檢驗,篩選出了 2159 個差異表達基因 (DEGs)。經過與之前的 1222 個基因進行重疊,發現其中包含 52 個重疊基因。

基於這 52 個重疊基因,研究人員進一步篩選了 12 個與患者總生存期 (overall survival,OS) 相關的基因,並對這 12 個基因建立了一個神經網路框架預後模型,即 MIRS。根據 MIRS 評分,該研究最終將患者分為 MIRS-high 和 MIRS-low 亞型,並透過 MIRS 評分來指導化療或免疫治療。

模型架構:神經網路模型表現出最佳預測效能

研究人員將上述從 52 個基因中篩選得到的 12 個候選基因,進一步分為保護基因和危險基因。對於保護基因,基因的表達狀態高於樣本平均值的賦值為「0」,低於平均值的賦值為「1」;對於危險基因,基因的表達狀態高於樣本平均值的賦值為「1」,低於平均值的賦值為「0」。

隨後,研究人員將 TCGA 佇列 (N = 1100) 按 7:3 的比例隨機分為訓練資料和測試資料,並使用神經網路 (NN)、統計迴歸 (LR)、隨機森林 (RF) 和支援向量機 (SVM) 四種機器學習方法,建立了基於 12 個候選基因的預後評分系統。

如下圖顯示,ROC 曲線分析,無論訓練集或測試集如何變化,神經網路模型都表現出最佳預測效能。

在這裡插入圖片描述

4 種預測乳腺癌患者生存率的機器學習方法

在此基礎上,研究還如下圖採用了一個具有隱藏層的經典神經網路來建立預後模型,定義了 netn1 = W1,1i1 + W2,1i2 +…+ W12,1i12 + b1,其中 W 是每個輸入節點的權重,ij (j = 1,2……12) 是基因的「0-1 」狀態。

在這裡插入圖片描述

MIRS 神經元網路模型示意圖

在輸出層,該研究使用 Tensorflow 和 Keras 來構建神經網路,在隱層使用 ReLU 作為啟用函式,用 Softmax 函式應用於輸出層的 「生存」和 「死亡 」兩個節點,用交叉熵誤差作為損失函式,用 Adam 演算法來最佳化預後基因權重。訓練完成後,每個預後基因的係數由隱層的最大權重決定。

以下是兩個 MIRS 實際計算的案例:

在這裡插入圖片描述

具有代表性的MIRS分數計算

研究結論:MIRS-low 亞型更容易轉移,化療對 MIRS-high 亞型更有利

該研究透過 ESTIMATE 演算法進一步研究了乳腺癌患者的免疫基因組圖譜與 MIRS 的相關性。結果顯示,MIRS-low 亞型的免疫細胞和基質細胞比例較高,但腫瘤純度較低。這表明 MIRS-low 亞型中存在較高水平的腫瘤浸潤免疫細胞。

另外,該研究還對兩個 MIRS 亞型之間的 17 條免疫相關通路進行了 ssGSEA 評分。結果表明,與 MIRS-high 亞型相比,幾乎所有通路中 MIRS-low 亞型的免疫浸潤水平都明顯更高。

在這裡插入圖片描述

MIRS與免疫基因組的關聯

此外,該研究還探討了 MIRS 評分與癌症轉移之間的相關性。在 MIRS-low 亞型中,轉移訊號因子的活性有上調跡象,包括缺氧、tgf - β 訊號、血管生成和上皮-間質轉化 (EMT) 評分 (下圖 F、H)。同時,研究人員在 MIRS-low 亞型中觀察到巨噬細胞 M1 (下圖 D) 和血管生成 (下圖 F) 的活性增加,這與之前的觀點一致。此外,MIRS 與血管生成標記基因呈負相關 (下圖 G)。

綜上所述,具有高免疫浸潤的 MIRS-low 亞型可能更容易轉移

在這裡插入圖片描述

MIRS-low的轉移訊號分析

由於 MIRS-low 亞型在 TME 中的 TIICs 高浸潤,理論上講,MIRS-low 亞型的患者應該對免疫檢查點阻斷 (ICB) 治療敏感,MIRS 最終也表明 MIRS-low 亞型可能比 MIRS-high 亞型對 ICB 治療更敏感。

在這裡插入圖片描述

MIRS亞型中的T細胞炎症評分(TIS)

和免疫表型評分(IPS)

該研究還分析了 MIRS 與化療之間的相關性。生存分析顯示,MIRS-high 亞型患者化療後的生存率高於 MIRS-low 亞型患者。此外,研究還發現接受化療的 MIRS-high 患者的生存率明顯高於未接受化療的 MIRS-high 患者。這些結果表明,化療可能對 MIRS-high 亞型更有利

在這裡插入圖片描述

化療佇列中MIRS亞型Kaplan-Meier生存分析

三陰性乳腺癌亞型:MIRS 揭示潛在預後基因靶點

在乳腺癌的亞型中,三陰性乳腺癌 (TNBC) 的治療進展仍然面臨重重挑戰,亟需尋找更多可改善預後的生物標誌物。與 MIRS-low 亞型相比,由於 MIRS-high 亞型的生存率較低,所以可以將其作為 TNBC 進展的候選靶基因,有 58 個基因在 MIRS-high 亞型中明顯高表達。

隨後,研究人員使用 XGboost、Borota RF 和 Elastic net lasso regression (ElasticNet) 三種機器學習演算法來選擇最關鍵的基因。最終在 4 組基因的維恩圖中發現了 9 個顯性基因。生存曲線顯示,IVL (Involucrin) 的表達水平會影響不同乳腺癌亞型的生存結果。

在這裡插入圖片描述

乳腺癌生存患者的 IVL 表達水平
與腫瘤亞型的關係

此外,IVL 在 TNBC 亞型中的表達水平最高,而在 BRCA 亞型中的表達水平較低。透過對細胞遷移相關途徑標記分析,高 IVL 組的細胞遷移途徑顯著豐富,這些結果表明,IVL 可能是探索 TNBC 亞型預後的潛在靶點。

在這裡插入圖片描述

IVL 高表達組與 IVL 低表達組之間
存在顯著的 METASCAPE 通路

乳腺癌診療仍處於弱人工智慧階段

在乳腺癌診療過程中,醫生的作用至關重要。但是,要培養一名合格的乳腺科醫生需要花費大量的時間和精力。如今,人工智慧的應用為乳腺癌提供了更多醫療力量,有望降低居高不下的乳腺癌發病率和死亡率。

然而,目前針對乳腺疾病診療的人工智慧研究,主要集中在乳腺鉬靶、超聲、病理影像資料深度學習技術以及乳腺癌診療決策、醫院管理等分支和領域,缺乏多種深度學習模型融合的頂層設計,即缺少將真實資訊實時更新與全面儲存、分析,與人工智慧讀圖診斷、個體化治療、風險預測於一體的深度學習模型

為加快推進人工智慧相關技術創新和產業發展,我國早在 2016 年釋出的《“健康中國2030”規劃綱要》中就提出,乳腺疾病診療關口前移,未來人工智慧在乳腺疾病診療應用中將取得長足發展。《CSCO 乳腺癌診療指南 2021》更是提出:專家組鼓勵開展人工智慧相關的臨床研究,發展我國自主智慧財產權的人工智慧系統。

在中國,每年約有 40 萬新發乳腺癌患者,其中三、四線以下城市患者佔比超過 70%,並呈現年輕化、城鎮化的趨勢。近年來,各地政府不斷加大對女性乳腺癌篩查工作的投入力度,有越來越多的女性從中收益,也希望人工智慧未來能夠為癌症探索出全新解決方案。

參考資料:

https://www.chinanews.com.cn/life/2023/02-20/9956815.shtml

相關文章