【因果推斷】中介因果效應分解彙總與理解

子豪君發表於2021-12-30

原文網址 : https://www.cnblogs.com/zihaojun/p/15747529.html

中介因果效應分解彙總與理解

中介因果效應分解彙總與理解

1. 前言

在學習因果推斷相關文章時[4,5]，對因果效應的分解產生了一些困惑，查閱相關資料[1,2,3]後，將因果效應分解的相關概念彙總形成此文，希望幫助有需要的同學理清概念，加深理解。

關於因果推斷更基礎的知識請參考相關書籍[6,7]。

2. 問題描述

中介效應，是指在因果模型中，Treatment X 對Outcome Y的因果效應可能有一部分是通過中介變數M（Mediation）傳遞過去的。例如：

抽菸（X），患肺癌（Y），血脂水平（M）
國家（X），新冠死亡率（Y），新冠患者年齡分佈（M）[8]，參見【因果推斷論文】中國新冠死亡率更高？- 新冠死亡率的辛普森悖論
物品的曝光特徵（如文章標題、視訊封面）（X），使用者對物品的興趣（X），使用者的點選行為（Y）[4]
服用藥物（X），病情緩解（Y），阿司匹林服用量（M）[1]，參見【因果推斷經典論文】Direct and Indirect Effects - Judea Pearl
- 服用藥物有一個副作用——頭痛，這會導致患者服用阿司匹林的劑量增加。而阿司匹林的服用劑量增加有利於藥物效果的發揮。

在這種因果模型中，我們感興趣的問題是，X對Y的因果效應中，有多大比例是通過M傳遞過去的？

中介效應分析對於政策制定[1]、理解資料[8]都有重要作用。
例如
- 藥物（X）對病情（Y）的影響有多少是通過阿司匹林劑量（M）造成的？藥物（X）通過直接路徑有多大效果？如果副作用被消除，藥物的效果會受到多大影響？[1]
- 不同國家（X）之間新冠死亡率的差異（Y）有多少是由於患者年齡分佈（M）造成的？[8]

3. 符號定義

當\(X=x，M=m\)時，Y的取值記為\(Y_{xm}\)。

當\(X=x\)時，M的取值記為\(M_x\)。

簡單起見，假設X是二元變數，例如：

當\(X=1,M\)取\(X=1\)時M的值時，Y的取值記為\(Y_{1M_1}\)。
當\(X=1,M\)取\(X=0\)時M的值時，Y的取值記為\(Y_{1M_0}\)。

在很多論文中，也將X=1記為X=x，將X=0記為\(X=x^\star\)，對應的，\(M_1\)記為m，\(M_0\)記為\(m^\star\)，則\(Y_{1M_1}\)記為\(Y_{xm}\)，\(Y_{1M_0}\)記為\(Y_{xm^\star}\)。

4. 總體效應、直接效應與間接效應

以下以第二部分敘述過的藥物和阿司匹林的例子[1]來說明各個效應的含義。

總體效應（Total Effect, TE）：

\[\begin{align} T E =\mathbb{E}\left[Y_{1}\right]-\mathbb{E}\left[Y_{0}\right] = \mathbb{E}\left[Y_{1M_1}\right] - \mathbb{E}\left[Y_{0M_0}\right] \end{align} \]

服用藥物對病情緩解整體上有多大作用？

控制直接效應（Controlled Direct Effect, CDE）：

\[\begin{align} CDE = \mathbb{E}\left[Y_{1m}\right] - \mathbb{E}\left[Y_{0m}\right] \end{align} \]

如果在服用藥物時，囑咐患者將阿司匹林用量調整到m，則藥物會有多大作用？
- 注意這裡的m是人為定義的，既不是服藥前的自然用量，也不是服藥後的自然用量，相當於\(do(M=m)\)
- 由於控制變數——阿司匹林用量是被人為控制的，不是自然的，且衡量的是直接路徑的影響（控制了中介變數為m），因此稱為“控制直接效應”。

自然直接效應（Natural Direct Effect, NDE or Pure Direct Effect, PDE）:

\[\begin{align} NDE = PDE= \mathbb{E}\left[Y_{1M_0}\right] - \mathbb{E}\left[Y_{0M_0}\right] \end{align} \]

如果病人在服用藥物的同時，保持阿司匹林服用量不變（不因為藥物副作用而改變阿司匹林用量），則藥物會有多大效果？
- 保持阿司匹林的服用量和服藥之前一致，這個用量對於不同患者來說是不同的——患者由於基礎疾病和身體情況不同，有各自不同的用藥習慣。
- 由於控制變數——阿司匹林用量是“自然”的，且衡量的是直接路徑的影響（控制了中介變數為\(M_0\)），因此稱為“自然直接效應”。

自然間接效應（Natural Indirect Effect, NIE or Pure Indirect Effect, PIE）：

\[\begin{align} NIE = PIE = \mathbb{E}\left[Y_{0M_1}\right] - \mathbb{E}\left[Y_{0M_0}\right] \end{align} \]

如果病人不服藥，但是將阿司匹林用量調整到服藥後的量，病情會有多大程度的緩解？
- 只調整阿司匹林的量，估計通過間接路徑產生的因果效應。
- 由於控制變數——不服藥是“自然”的，且衡量的是間接路徑的影響（控制了服藥量為0），因此稱為“自然間接效應”

總體直接效應（Total Direct Effect, TDE）

\[\begin{align} TDE = \mathbb{E}\left[Y_{1M_1}\right] - \mathbb{E}\left[Y_{0M_1}\right] \end{align} \]

服藥且改變阿司匹林用量，與只改變阿司匹林用量相比，治療效果有多大提升？
- 控制阿司匹林用量都是服藥後的量，比較服藥和不服藥的區別。
- 控制變數——阿司匹林用量是服藥後的自然服用量（包含了服藥的影響），且衡量的是直接路徑的影響（控制了中介變數為\(M_1\)），因此稱為“總體直接效應”。

總體間接效應（Total Indirect Effect, TIE）

\[\begin{align} TIE = \mathbb{E}\left[Y_{1M_1}\right] - \mathbb{E}\left[Y_{1M_0}\right] \end{align} \]

在服藥的條件下，因為副作用而增加阿司匹林用量對治療效果有影響嗎？
- 控制變數——服藥量為1（不是自然情況，自然情況應該是0），衡量的是間接路徑的影響，稱為“總體間接效應”。

5. 總體效應的分解

總體效應TE可以被分解為直接效應和間接效應[1,2]，或分解為直接效應、間接效應和互動效應[3]。[9]

\[\begin{equation} \begin{aligned} \mathbb{E}\left[Y_{1}\right]-\mathbb{E}\left[Y_{0}\right] =&\mathbb{E}\left[Y_{1M_1}\right]-\mathbb{E}\left[Y_{0M_0}\right] \\ =&\underbrace{\left(\mathbb{E}\left[Y_{1M_1}\right]-\mathbb{E}\left[Y_{0M_1}\right]\right)}_{T D E}+\underbrace{\left(\mathbb{E}\left[Y_{0M_1}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right)}_{P I E/ N I E}\\ =&\underbrace{\left(\mathbb{E}\left[Y_{1M_1}\right]-\mathbb{E}\left[Y_{1M_0}\right]\right)}_{T I E}+\underbrace{\left(\mathbb{E}\left[Y_{1M_0}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right)}_{P D E/ N D E} \\ =&\left[ \underbrace{\left(\mathbb{E}\left[Y_{1M_1}\right]-\mathbb{E}\left[Y_{1M_0}\right]\right)}_{T I E} - \underbrace{\left(\mathbb{E}\left[Y_{0M_1}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right)}_{P I E/ N I E} \right] \\ &+\underbrace{\left(\mathbb{E}\left[Y_{1M_0}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right)}_{P D E/ N D E} + \underbrace{\left(\mathbb{E}\left[Y_{0M_1}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right)}_{P I E/ N I E}\\ \end{aligned} \end{equation} \]

分析\(\left[ \underbrace{\left(\mathbb{E}\left[Y_{1M_1}\right]-\mathbb{E}\left[Y_{1M_0}\right]\right)}_{T I E} - \underbrace{\left(\mathbb{E}\left[Y_{0M_1}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right)}_{P I E/ N I E} \right]\)這一項：

如果\(M_1\) = \(M_0\)，則此項為0，且總體間接效應和自然間接效應都為0——中介變數不帶變的，就沒有間接效應了。
如果\(M_1=1, M_0 = 0\)，則

\[\begin{equation} \begin{aligned} &(M_1-M_0)=1，\\ &\left(\mathbb{E}\left[Y_{1M_1}\right]-\mathbb{E}\left[Y_{1M_0}\right]\right) - \left(\mathbb{E}\left[Y_{0M_1}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right) = \\ &\left(\mathbb{E}\left[Y_{11}\right]-\mathbb{E}\left[Y_{10}\right] - \mathbb{E}\left[Y_{01}\right]+\mathbb{E}\left[Y_{00}\right]\right)(M_1-M_0) \end{aligned} \end{equation} \]

如果\(M_1=0, M_0 = 1\)，則

\[\begin{equation} \begin{aligned} &(M_1-M_0)=-1，\\ &\left(\mathbb{E}\left[Y_{1M_1}\right]-\mathbb{E}\left[Y_{1M_0}\right]\right) - \left(\mathbb{E}\left[Y_{0M_1}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right) \\ =&\left(-\mathbb{E}\left[Y_{11}\right]+\mathbb{E}\left[Y_{10}\right] + \mathbb{E}\left[Y_{01}\right]-\mathbb{E}\left[Y_{00}\right]\right)\\ =&\left(\mathbb{E}\left[Y_{11}\right]-\mathbb{E}\left[Y_{10}\right] - \mathbb{E}\left[Y_{01}\right]+\mathbb{E}\left[Y_{00}\right]\right)(M_1-M_0) \end{aligned} \end{equation} \]

因此，(7)式可進一步推導為：

\[\begin{equation} \begin{aligned} \underbrace{\mathbb{E}\left[Y_{1}\right]-\mathbb{E}\left[Y_{0}\right]}_{TE} =&\underbrace{\mathbb{E}\left[Y_{1M_1}\right]-\mathbb{E}\left[Y_{0M_0}\right]}_{TE} \\ =&\underbrace{\left(\mathbb{E}\left[Y_{1M_1}\right]-\mathbb{E}\left[Y_{0M_1}\right]\right)}_{T D E}+\underbrace{\left(\mathbb{E}\left[Y_{0M_1}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right)}_{P I E/ N I E}\\ =&\underbrace{\left(\mathbb{E}\left[Y_{1M_1}\right]-\mathbb{E}\left[Y_{1M_0}\right]\right)}_{T I E}+\underbrace{\left(\mathbb{E}\left[Y_{1M_0}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right)}_{P D E/ N D E} \\ =&\left[ \underbrace{\left(\mathbb{E}\left[Y_{1M_1}\right]-\mathbb{E}\left[Y_{1M_0}\right]\right)}_{T I E} - \underbrace{\left(\mathbb{E}\left[Y_{0M_1}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right)}_{P I E/ N I E} \right] \\ &+\underbrace{\left(\mathbb{E}\left[Y_{1M_0}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right)}_{P D E/ N D E} + \underbrace{\left(\mathbb{E}\left[Y_{0M_1}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right)}_{P I E/ N I E}\\ =&\underbrace{\left(\mathbb{E}\left[Y_{1M_0}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right)}_{P D E/ N D E} + \underbrace{\left(\mathbb{E}\left[Y_{0M_1}\right]-\mathbb{E}\left[Y_{0M_0}\right]\right)}_{P I E/ N I E}\\ &+\underbrace{\left(\mathbb{E}\left[Y_{11}\right]-\mathbb{E}\left[Y_{10}\right] - \mathbb{E}\left[Y_{01}\right]+\mathbb{E}\left[Y_{00}\right]\right)(M_1-M_0)}_{Interactive\ Effects} \end{aligned} \end{equation} \]

至此，我們得到了非線性模型總體效應的分解方法：

分解為直接效應和間接效應[1]，有總體直接效應+自然間接效應和自然直接效應+總體間接效應兩種。
分解為直接效應、間接效應和互動效應[3]，則是自然直接效應+自然間接效應+互動效應。

如果是線性模型，則互動效應為0，\(NDE=TDE, NIE=TIE\)。[1,2,3]

參考文獻

[1] J. Pearl, “Direct and indirect effects,” in Proc. 17th Conf. Uncertainty Artif. Intell., 2001, pp. 411–420

[2] Robins J M, Greenland S. Identifiability and exchangeability for direct and indirect effects[J]. Epidemiology, 1992: 143-155.

[3] VanderWeele T J. A three-way decomposition of a total effect into direct, indirect, and interactive effects[J]. Epidemiology (Cambridge, Mass.), 2013, 24(2): 224.

[4] Wang W, Feng F, He X, et al. Clicks can be cheating: Counterfactual recommendation for mitigating clickbait issue[C]//Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2021: 1288-1297.

[5] Wei T, Feng F, Chen J, et al. Model-agnostic counterfactual reasoning for eliminating popularity bias in recommender system[C]//Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. 2021: 1791-1800.

[6] Pearl J, Glymour M, Jewell N P. Causal inference in statistics: A primer[M]. John Wiley & Sons, 2016.

[7] Imbens G W, Rubin D B. Causal inference in statistics, social, and biomedical sciences[M]. Cambridge University Press, 2015.

[8] von Kügelgen J, Gresele L, Schölkopf B. Simpson's paradox in Covid-19 case fatality rates: a mediation analysis of age-related causal effects[J]. IEEE Transactions on Artificial Intelligence, 2021, 2(1): 18-27.

[9] Direct and Indirect Effects 饅頭and花捲部落格園 https://www.cnblogs.com/MTandHJ/p/14615052.html

因果推斷與中介效應
2024-10-07
因果推斷在騰訊遊戲中的應用
2022-11-17
遊戲
大模型視角下的因果推斷
2023-11-28
大模型
淺談因果推斷與在內容平臺的實踐
2023-02-24
如何在因果推斷中更好地利用資料？
2023-01-09
【因果推斷經典論文】Direct and Indirect Effects - Judea Pearl
2021-12-27
「深度」A/B測試中的因果推斷——隨機化分流
2019-03-02
隨機
「深度」A/B測試中的因果推斷——潛在結果模型
2019-01-14
模型
特徵工程在營銷組合建模中的應用：基於因果推斷的機器學習方法最佳化渠道效應估計
2024-10-19
特徵工程機器學習
騰訊如何用因果推斷擴大遊戲帝國海外版圖？
2023-04-07
遊戲
ACM BCB 2018 CausalTriad: 從醫學文字資料中推斷出新的因果關係假設
2018-06-28
ACM
貝葉斯統計和因果推斷在轉轉估價中的落地實踐
2023-10-27
再談《莎莉之定律》——選擇、人生與因果。
2019-06-28
再談《莎莉之定律》——選擇、人生與因果
2019-06-25
【因果推斷論文】中國新冠死亡率更高？- 新冠死亡率的辛普森悖論
2021-12-28
美團內部講座 | 清華大學崔鵬：因果推斷技術最新的發展趨勢
2022-03-21
因果模型：邊緣結構模型MSM
2020-11-01
模型
《TRIZ培訓》第3章因果分析
2023-02-20
軟體Bug、耦合以及因果推理 - Michael Feathers
2020-02-15
永不靜止的暗流：資料跨境流通的因果與新機
2020-01-05
如何使用六西格瑪工具--因果矩陣
2022-07-27
矩陣
《最後生還者》裡錯位的因果論
2020-06-19
黑盒測試方法之因果圖和判定表——一
2020-10-25
從因果關係來看小樣本學習
2020-10-09
讀書筆記---選擇情緒---因果思維
2018-03-06
筆記
機器學習不是研究因果邏輯的 - yudapearl
2021-11-11
機器學習
資料的相關性或因果關係 - KDnuggets
2022-05-12
NeurIPS 2024 | 用LLM探尋隱秘的因果世界
2025-02-08
如何理解供應商關係與績效管理？
2021-09-28
軟體測試用例設計方法-因果圖法
2020-06-20
常用的MySQL中介軟體網址彙總
2019-03-14
MySql
因果推理和監督學習的統一概念框架
2018-03-03
框架
認知研究論文：因果資訊如何影響決策
2021-12-11
資料關係比較：相關性 vs 因果關係
2021-09-24
因果迷境：為什麼我們會問“為什麼”？
2021-02-05
從《別拿相關當因果》看“消費升降級”之爭
2018-09-18
NeurIPS 2021 | 一文洞悉因果機器學習前沿進展
2021-12-18
機器學習
EfficientNet-resDDSC：一種整合殘差塊和擴充套件卷積的混合深度學習模型推斷單細胞資料中的基因因果關係
2024-12-01
套件卷積深度學習模型

【因果推斷】中介因果效應分解 彙總與理解

中介因果效應分解 彙總與理解