CVPR 2021 | 時間序列疾病預測的因果隱馬爾可夫模型

北京大学前沿计算研究中心發表於2022-07-18

專案主頁:https://sites.google.com/view/causal-hmm

論文連結:https://arxiv.org/abs/2103.16391

01 研究背景


在醫學診斷中,對不可逆型疾病(如視盤萎縮症)進行時間序列的疾病預測非常重要,對未來疾病發展的預測可以幫助患者進行提前干預,對於疾病的有效控制有很大的意義。

但是這類預測目前存在兩個大問題。首先,目前的很多時間序列疾病預測的方法都是提取所有的時序影像特徵來進行未來疾病的預測。然而影像中通常存在很多與該類疾病無關的資訊或特徵,當加入這些疾病無關的資訊進行訓練時,會引入偽相關關係,即它們本身與疾病無關,但訓練時使用它們參與了疾病的預測,引入了統計上的相關關係。當模型使用這些偽相關的資訊對新的分佈下測試集的樣本進行疾病預測時,很容易導致失敗。其次,很多時間序列的預測方法建立在時序標籤完整的情況下。然而由於醫學標籤標註成本高昂,實際情況下很多時候過去時間步的疾病標籤是缺乏的,標籤的缺乏也給未來階段的疾病預測帶來了很大的挑戰。

02 方法介紹


CVPR 2021 | 時間序列疾病預測的因果隱馬爾可夫模型

圖1. 因果隱馬爾可夫模型

為了解決上述問題,本文對時間序列疾病預測建立了一個基於時序的因果隱馬爾可夫模型(Causal-HMM),即針對現有的觀測資料,包括每個時間步的影像資料xt,臨床測量資料A(如角膜厚度、角膜曲率等),個體屬性資料Bt(如年齡、性別等)以及在未來階段的疾病標籤YT,建立一個描述其相關關係的因果圖(如圖1),用該因果圖去刻畫每個時間步從隱空間到觀測值的生成過程。其中隱空間中一部分是與疾病無關的因子zt,一部分是疾病相關的因子st和vt。vt 代表與疾病相關的臨床測量資料的隱變數因子,st 代表其他與疾病相關的參與影像生成的因子。而個人屬性Bt會對所有的隱變數帶來影響。本文對影像在隱空間內進行解耦,旨在透過分離疾病無關因子來去除訓練中所帶來的偽相關關係。在理論上作者透過可識別性定理(如圖2所示)對監督場景下的時間序列資料給出了隱變數解耦的可識別性保證。

CVPR 2021 | 時間序列疾病預測的因果隱馬爾可夫模型

圖2. 可識別性定理

為了學習本文所提出的因果隱馬爾可夫模型,作者使用了基於 VAE 的變分框架去學習時間序列下的影像及臨床屬性的生成過程以及進行疾病標籤的預測(如圖3所示)。具體來說,在每個時間步下先驗網路接受個人屬性特徵及上一個時間步的隱變數作為輸入,得到當前時間步的隱變數先驗;而後驗網路的編碼器接受當前時間步的影像及臨床屬性特徵,及上一步的個人屬性特徵進行輸入,相應地得到隱變數後驗。同時每一步的解碼器會對隱變數進行解碼,完成對當前步的影像及臨床屬性的重構。隱變數的後驗和先驗透過 KL 距離進行約束。在最後一個時間步下,透過所提取出的疾病相關的因子進行未來時間步的疾病預測。

CVPR 2021 | 時間序列疾病預測的因果隱馬爾可夫模型

圖3. 左:Causal-HMM的時間序列網路架構;右:每個時間步的先驗網路,後驗網路及生成網路構成

03 實驗結果


本文收集了507個個體樣本,每個樣本包括一到五年級的視網膜影像資料以及相應年級的屬性資料,以及六年級的視盤萎縮疾病標籤資料。作者對507個樣本進行了資料集的劃分,其中訓練集驗證集測試集的數量分別為300,100,107。為了更好地驗證本文方法的泛化效能,作者將訓練集驗證集和測試集按照性別劃分為兩個不同的分佈,其中前兩者資料集的性別分佈為男女比2:3而後者測試集性別分佈為3:1。作者對包括一到五年級的十個所有可能的時間序列設定下進行了實驗,並與多個現有的疾病進展預測和時間序列預測的方法進行了對比。本文的方法在幾乎所有的實驗設定及平均情況下的 ACC 和 AUC 指標均高於已有方法(如表1所示),展示了該方法在解決時間序列疾病預測問題上的優越性。

CVPR 2021 | 時間序列疾病預測的因果隱馬爾可夫模型

表1. 與對比方法RGL, Devised RNN, LogSparse Transformer在一到五年級所有時間序列上的ACC與AUC結果對比

同時作者對本文的方法進行了消融實驗(如表2所示),分別測試了他們所使用的時間序列結構(CNN vs Seq VAE, CNN+LSTM vs Seq VAE),屬性資訊(Seq VAE vs Seq VAE + Att)及隱空間解耦機制(Seq VAE + Att vs Ours)的有效性。

CVPR 2021 | 時間序列疾病預測的因果隱馬爾可夫模型

表2. 針對時間序列網路結構, 屬性資訊以及解耦機制的消融實驗在一到五年級所有時間序列上的ACC與AUC結果對比

此外作者設計了一個第二階段的疾病分類器證明解耦出來的隱變數的魯棒性,將已經訓練好的 Causal-HMM 模型的疾病相關因子和無關的因子分別取出,在訓練集驗證集及新分佈下的測試集上進行預測。疾病無關的因子在新分佈下的預測準確率有很大下降,而解耦出的疾病相關因子在不同分佈下的有著穩定和魯棒的表現(如表3所示)。

CVPR 2021 | 時間序列疾病預測的因果隱馬爾可夫模型

表3. 在一到五年級所有時間序列上使用不同隱變數(s+v vs z)對疾病進行預測,在訓練集,驗證集及測試集上的ACC與AUC結果對比

作者對 Causal-HMM 模型所學習到的隱空間因子s 和 z透過 Grad-CAM 進行了視覺化(如圖4所示),結果表明疾病相關的因子s在視盤周圍顯示了高響應,而疾病無關的因子z的高響應處更多地散佈在視網膜影像的其他區域如黃斑區等。本文的方法透過將z解耦出來可以去除其和疾病的偽相關關係,從而在不同分佈下的疾病預測上有更為魯棒的表現。

CVPR 2021 | 時間序列疾病預測的因果隱馬爾可夫模型

圖4. 不同隱變數(s vs z)的特徵圖視覺化

04 結  語


本文針對時間序列疾病預測問題提出了一個因果隱馬爾可夫模型進行未來階段的疾病預測。為了保證模型的泛化效能,作者對每個時間步下的隱空間進行了顯式的解耦和分離,並透過可識別性的結果對該解耦機制給出了理論保證。針對因果隱馬爾可夫模型,作者提出了一個新的時間序列變分框架進行該模型的學習和推斷。實驗上,作者將其方法應用在了視盤萎縮疾病的時序預測問題中,並和當前現有的最優方法進行了對比,在新的測試集分佈下取得了更優越的效能,展示了該方法的有效性和魯棒性。

參考文獻

[1] Judea Pearl. Causality. Cambridge university press, 2009.

[2] Maxime Louis, Raphael Couronne, Igor Koval, Benjamin Charlier, and Stanley Durrleman. Riemannian geometry learning for disease progression modelling. In IPMI 2019.

[3] Ilyes Khemakhem, Diederik P Kingma, and Aapo Hyvärinen. Variational autoencoders and nonlinear ICA: A unifying framework. In AISTATS 2020.

[4] Xinwei Sun, Botong Wu, Chang Liu, Xiangyu Zheng, Wei Chen, Tao Qin, and Tie-yan Liu. Latent causal invariant model. arXiv preprint arXiv:2011.02203, 2020.

圖文 | 李靜

Computer Vision and Digital Art (CVDA)

相關文章