阅读James M. Robins的文章Marginal Structural Models and Causal Inference in Epidemiology[1]后的笔记


文章目录

  • 基本概念
  • MSM的基本思想
  • 因果效应的估计函数
  • 单时刻建模以及MSM释义
  • 逆处理概率加权法(IPTW)
  • 从二分类到多分类:多层处理与非饱和MSM模型
  • 稳定权重(Stabilized Weights)
  • 从分类到离散:连续处理下的稳定权重
  • 多时刻建模:时依性处理(Time-dependent Treatments)
  • 多时刻建模:稳定权重的求解
  • 多时刻建模:预处理协变量带来的效应修饰作用(Effect Modifier)
  • 失访情况下的因果效应分析
  • MSM的局限性
  • 参考



基本概念

  边缘结构模型(Marginal structural models,MSMs)是一种因果模型,用于调整影响随时间变化的处理/治疗方案(time-varying treatments)的时依性混杂因子(time-dependent confounding),使得我们能无偏估计因果效应(unbiased estimation of casual effects)[2]

  传统的估计时变性处理的因果效应的方法是对结果的概率建立回归方程,将过去的处理(past treatment/exposure)和过去的混杂因子(past confounder)作为方程的变量,通常使用分层法等(比如逻辑回归或者Cox比例风险回归模型)。这些方法,无论是否对混杂因子进行调整,都会存在偏倚(biased)。所以提出了MSM模型。

  时依性混杂因子的定义:⑴是时依性的协变量,能够用于预测目标事件(是目标事件的风险因子),且能预测处理;⑵过去的预测方案能预测此变量;⑶自身过去的状态能预测现在的状态。

MSM的基本思想

因果机器学习政策评估_机器学习,将可观测的对结果有影响的风险因子记为因果机器学习政策评估_机器学习_02,将不可观测(即无法收集这个变量的值)的对结果有影响的风险因子记为因果机器学习政策评估_sed_03,将时变性处理记为因果机器学习政策评估_sed_04,将结果记为因果机器学习政策评估_因果机器学习政策评估_05。MSM假设不存在影响处理的不可观测风险因子,即不可测假设(untestable assumption),因此MSM假设下的因果图应该如图(a)所示。

因果机器学习政策评估_机器学习_06


图(a) 左侧为多个时间构成的因果图,右侧为单时刻的因果图(未去混杂)

  MSM使用逆处理概率加权法(Inverse Probability of Treatment Weighting,IPTW)消去可观测的混杂因子对处理的影响。也就是说采用IPTW生成各对象组的伪分布,每组处理(treatment)的伪分布都相同,使得处理相对于混杂因子独立,反映在图上就是删除了从混杂因子到处理的弧,处理后的因果图如图(b)所示。

因果机器学习政策评估_权重_07


图(b) 左侧为多个时间构成的因果图,右侧为单时刻的因果图(已去混杂)

因果效应的估计函数

  取单个时刻(如图(b)右侧子图所示)为例,假设取值都是二元的,处理不受混杂因子影响。使用粗风险差/粗危险差/粗率差(crude risk difference,RD)、粗风险比/粗相对危险度/粗危险比/粗率比(crude risk ratio,RR)、粗优势比/粗比值比(crude odds ratio,OR)估计处理对结果的影响(因果效应)。三者的计算公式如下:
因果机器学习政策评估_sed_08
因果机器学习政策评估_建模_09
因果机器学习政策评估_因果机器学习政策评估_10
  前者是从观测数据角度得到因果的。从因果分析角度出发,处理的因果对比形式与以上计算公式相同,但是涉及了反事实(counterfactual)变量的概念。将被处理后的结果记为因果机器学习政策评估_因果机器学习政策评估_11,将未受到处理的结果记为因果机器学习政策评估_sed_12,以上两者无法被同时观测到,这就是反事实的概念。则这个个体的因果效应为因果机器学习政策评估_权重_13。相应的,因果风险差(causal risk difference)、因果风险比(causal risk ratio)、因果优势比(causal odds ratio)的计算公式如下:
因果机器学习政策评估_sed_14
因果机器学习政策评估_权重_15
因果机器学习政策评估_sed_16
  当处理不受混杂因子影响时,以上六个公式两两相等。

单时刻建模以及MSM释义

因果机器学习政策评估_机器学习_17因果机器学习政策评估_建模_18因果机器学习政策评估_机器学习_19可以分别表示为自变量是处理因果机器学习政策评估_建模_20的三种模型,分别为线性(linear)、对数线性(log linear)和线性逻辑模型(linear logistic model),考虑单时刻情况,将(7-9)记为因果模型:
因果机器学习政策评估_权重_21
因果机器学习政策评估_sed_22
因果机器学习政策评估_sed_23
  分别将因果机器学习政策评估_机器学习_24因果机器学习政策评估_建模_25代入(7-9)式,再代入到(4-6)式,可以得到因果机器学习政策评估_机器学习_26因果机器学习政策评估_机器学习_27因果机器学习政策评估_权重_28。将(7-9)记为饱和MSM模型(saturated MSMs)。

  同样的,从观测数据角度可以得到粗风险差、粗风险比和粗优势比的饱和线性、对数和线性逻辑模型,将(10-12)记为数据模型:
因果机器学习政策评估_权重_29
因果机器学习政策评估_机器学习_30
因果机器学习政策评估_权重_31
  可以得到因果机器学习政策评估_建模_32因果机器学习政策评估_权重_33因果机器学习政策评估_sed_34。(10-12)表示的模型是为观测到的数据关联关系构建的模型,因此仅当处理是非混淆的情况下,因果模型(7-9)的参数才与数据模型(10-12)的参数相同。

  对边缘结构模型MSM的解释如下:

  • 边缘性(marginal):对反事实随机变量因果机器学习政策评估_sed_35因果机器学习政策评估_权重_36建立了边缘分布((7-9)式左半边)而不是联合分布,也就是不对因果机器学习政策评估_sed_35因果机器学习政策评估_权重_36之间的相关性建模。
  • 结构化(structural):对反事实变量的概率进行建模,在计量经济学和社会科学中常常把反事实变量的建模称为结构化。
  • 饱和性(saturated):因果机器学习政策评估_因果机器学习政策评估_39因果机器学习政策评估_机器学习_40是两种未知的概率,模型也有两个未知的参数,因此模型未对两种未知的概率值进行限制。

逆处理概率加权法(IPTW)

  当处理存在混淆时(受混杂因子影响),因果模型的参数将与数据模型的参数不相等。MSM模型假设不存在不可观测的混杂因子(No unmeasured confounders),那么就可以采用加权分析方法去除混杂因子的影响。

因果机器学习政策评估_机器学习_41为种类(Subject)编号,每个种类的权重记为式(13)。
因果机器学习政策评估_因果机器学习政策评估_42
  因果机器学习政策评估_权重_43是第因果机器学习政策评估_机器学习_41类的因果机器学习政策评估_因果机器学习政策评估_45观测值。因果机器学习政策评估_权重_46的值可以通过式(14)使用回归方法进行估计,统计不同的因果机器学习政策评估_建模_20因果机器学习政策评估_因果机器学习政策评估_48并回归得到参数。
因果机器学习政策评估_建模_49
  当取因果机器学习政策评估_sed_50时,因果机器学习政策评估_机器学习_51;当取因果机器学习政策评估_sed_52时,因果机器学习政策评估_权重_53。这种方法能消除混杂因子影响的原因在于,IPTW为每类复制因果机器学习政策评估_权重_46份,形成伪总体分布,这种情况下,⑴相同的因果机器学习政策评估_sed_55取值时,任意的因果机器学习政策评估_因果机器学习政策评估_45取值概率都相同,因此因果机器学习政策评估_sed_55是非混淆的;⑵因为因果机器学习政策评估_sed_55是非混淆的,因此在上述伪分布数据中,数据模型得到的因果效应将与因果模型得到的结果一致。

从二分类到多分类:多层处理与非饱和MSM模型

因果机器学习政策评估_sed_59的序列值(比如为服药剂量,0~15mg共因果机器学习政策评估_建模_60种取值,且剂量是线性变化的)时,相应的潜在结果(potential outcomes)也将有多种取值(比如16种)。这种情况下,为了构造饱和模型必须设置多个参数(比如16个),因此无法再使用饱和模型进行建模。
  为了克服这种问题,假设处理效果是线性变化的(即简化剂量反应关系,parsimonious dose-response relationship),那么可以将因果模型写作非饱和的式(15)。
因果机器学习政策评估_机器学习_61
  其中,因果机器学习政策评估_权重_62是斜率参数。当剂量增加1时,因果机器学习政策评估_机器学习_19增加因果机器学习政策评估_sed_64。对应的数据模型就可以写作式(16)。
因果机器学习政策评估_权重_65
  与前面的分析相同,当处理是非混淆的情况下,两者估计的参数是相同的。当处理仅受可观测混杂因子因果机器学习政策评估_因果机器学习政策评估_45影响时,可以使用IPTW调节种类分布达到去混杂的效果。对于序列变量,因果机器学习政策评估_因果机器学习政策评估_67可由式(17)进行估计。
因果机器学习政策评估_权重_68
因果机器学习政策评估_权重_69
  式(16)可以理解为类Softmax多元逻辑回归函数,在不处理时(剂量为0)分子设为常量1。

稳定权重(Stabilized Weights)

因果机器学习政策评估_sed_55与混杂因子因果机器学习政策评估_因果机器学习政策评估_45高度相关时,很有可能某些状态组合会缺乏观测数据。这会导致样本数量非常少,继而由因果机器学习政策评估_权重_46调整得到的伪总体分布中该部分占比非常大,会影响分析效果。稳定权重因果机器学习政策评估_权重_73记为式(18)。
因果机器学习政策评估_机器学习_74
  估计因果机器学习政策评估_权重_73的值需要计算分子和分母两部分,分母可以采用式(16)计算,分子计算公式见式(19)。
因果机器学习政策评估_建模_76
因果机器学习政策评估_因果机器学习政策评估_77
  因果机器学习政策评估_权重_78的星号表明当因果机器学习政策评估_sed_55是混淆的情况时此参数与因果机器学习政策评估_机器学习_80不相同。这是因为在计算因果机器学习政策评估_机器学习_80时是以不同的因果机器学习政策评估_因果机器学习政策评估_45作为条件的,也就是说分别对不同的子集进行计算,当存在混淆时,各子集的分布不相同,与总体的分布自然不同。

从分类到离散:连续处理下的稳定权重

因果机器学习政策评估_权重_46的方差趋于无穷,因此不能使用。假设因果机器学习政策评估_sed_55服从正态分布,则因果机器学习政策评估_权重_73可写作式(20),其中因果机器学习政策评估_机器学习_86是概率密度函数。
因果机器学习政策评估_权重_87
  为了估计因果机器学习政策评估_权重_88,给定因果机器学习政策评估_因果机器学习政策评估_45因果机器学习政策评估_机器学习_90,因此因果机器学习政策评估_权重_88可表示为式(21);为了估计因果机器学习政策评估_机器学习_92,给定因果机器学习政策评估_因果机器学习政策评估_45因果机器学习政策评估_权重_94,因此因果机器学习政策评估_权重_88可表示为式(22)。
因果机器学习政策评估_机器学习_96
因果机器学习政策评估_sed_97

多时刻建模:时依性处理(Time-dependent Treatments)

因果机器学习政策评估_权重_98为时序处理序列(历史剂量),因果机器学习政策评估_sed_99。其他变量不再赘述。在最简单的情况下,即每个处理因果机器学习政策评估_因果机器学习政策评估_100都是二值的,那么因果机器学习政策评估_权重_101因果机器学习政策评估_因果机器学习政策评估_102种可能取值。因此,在这里假设仍然服从简化剂量反应关系,则线性逻辑MSM因果模型可以写作式(23)。
因果机器学习政策评估_因果机器学习政策评估_103
  式中因果机器学习政策评估_机器学习_104是历史处理的累计剂量和。相应的,数据模型可以写作式(24)。
因果机器学习政策评估_建模_105
  多时刻建模传统方法的不足:使用未调整权重的逻辑回归模型将不可避免地引入偏倚。这是因为⑴因果机器学习政策评估_机器学习_02是后续处理的混杂因子,因此必须调整;⑵但同时因果机器学习政策评估_机器学习_02是由前面处理影响的,因此不能被标准回归方法调整。因此使用因果机器学习政策评估_机器学习_02计算因果机器学习政策评估_权重_73用于处理因果机器学习政策评估_sed_04的去混杂,而不是将因果机器学习政策评估_机器学习_02加入回归方程中,这也是本文的目的所在。

多时刻建模:稳定权重的求解

因果机器学习政策评估_机器学习_02的混淆影响下,可以使用因果机器学习政策评估_权重_73得到无偏估计,见式(25)。
因果机器学习政策评估_机器学习_114
  对因果机器学习政策评估_权重_73的求解分为两部分,第一部分建立回归模型,第二部分进行参数估计并代入回因果机器学习政策评估_权重_73计算公式。

因果机器学习政策评估_权重_73的分母和分子建立回归模型,需要考虑处理和混杂因子的实际物理意义。例如若处理的概率与日期因果机器学习政策评估_机器学习、前两天的处理、今天和昨天的混杂因子、昨天的处理和今天的混杂因子相互作用、和基线混杂因子(baseline covariates)有关,那么模型可以写作式(26)(这里同样假设处理是二值的)。
因果机器学习政策评估_因果机器学习政策评估_119
因果机器学习政策评估_sed_120
  对于每类因果机器学习政策评估_机器学习_41,可以由式(25)求得因果机器学习政策评估_sed_122的最大似然估计值因果机器学习政策评估_机器学习_123因果机器学习政策评估_建模_124。当因果机器学习政策评估_sed_125时,显然估计值为因果机器学习政策评估_权重_126,不再赘述。因此,将估计值代入式(24),可得因果机器学习政策评估_权重_73的计算式(27)。
因果机器学习政策评估_sed_128

多时刻建模:预处理协变量带来的效应修饰作用(Effect Modifier)

因果机器学习政策评估_sed_129)[3],其中因果机器学习政策评估_机器学习_130表示效应修饰作用,因果机器学习政策评估_机器学习_131表示混杂因子。

因果机器学习政策评估_建模_132


图(c) 效应修饰作用与混杂因子

因果机器学习政策评估_机器学习_133是预处理协变量因果机器学习政策评估_因果机器学习政策评估_45的子集,由于因果机器学习政策评估_机器学习_133已被IPTW调整过,因此仅当因果机器学习政策评估_机器学习_133确定对因果效应有很大影响时,才会考虑将其加入回归方程。将因果机器学习政策评估_机器学习_133加入到式(24),一个数据模型的例子如式(28)所示,相应的因果机器学习政策评估_权重_73概率调整如式(29)所示。
因果机器学习政策评估_建模_139
因果机器学习政策评估_机器学习_140

失访情况下的因果效应分析

因果机器学习政策评估_机器学习时刻失访为因果机器学习政策评估_sed_142,未失访为因果机器学习政策评估_建模_143,并假设失访后目标不会再次接受随访。将失访加入模型中的思想也比较简单,是在因果机器学习政策评估_sed_144因果机器学习政策评估_机器学习_02间插入因果机器学习政策评估_建模_146,即因果机器学习政策评估_因果机器学习政策评估_147。其物理意义例如,当病人服用一定剂量的药物后,可能失访,导致结果不可知。

因果机器学习政策评估_建模_146加入MSM回归模型的问题。结果因果机器学习政策评估_因果机器学习政策评估_05能观测必然的前提是因果机器学习政策评估_权重_150,也就是说在整个随访周期中均未发生失访现象。因此,各个类别的权重因果机器学习政策评估_权重_73就需要加入对随访丢失的考虑,随访丢失越严重,类别所占比例越小,权重调整就越大。失访情况下的权重可写作因果机器学习政策评估_sed_152因果机器学习政策评估_权重_73仍然使用式(25),因果机器学习政策评估_sed_154是逆审查权重概率(inverse probability of censoring weighting),写作式(30)。
因果机器学习政策评估_权重_155

MSM的局限性

  当混杂因子在某个状态下,所有观察对象的处理都是相同的,这时无法使用MSM模型进行计算。(因为有的概率值为0,连乘也为0。这表明MSM服从正值性Positivity假设)


参考



[1] James M. Robins, Miguel A. Hernan, Babette Brumback. Marginal Structural Models and Causal Inference in Epidemiology[J]. Epidemiology, 2000, 11(5): 550-60. [2] Thomas Fuchs. Slide 1 of MSM[DB/OL]. 2006. (Accessed in October 29, 2020) [3] Tyler J. VanderWeele. Confounding and Effect Modification: Distribution and Measure[J]. Epidemiologic Methods, 2012, 1(1): 55-82.