文章目录
- 1.1 潜在结果(Potential Outcome)
- 1.2 基于潜在结果定量干预效应
- 1.3 潜在结果的因果建模实例
1.1 潜在结果(Potential Outcome)
因果推断的一个重要基本认识是:针对某一个对象/单元,我们总是只能观测到其接受干预或不接受干预两种情况之一。由此我们引入 Rubin 的潜在结果框架(potential outcome)作为因果推断的数学语言。
所谓潜在结果,我们的讨论是基于对象采取或不采取干预时潜在的结果。这也引出了事实(factual)与反事实(counterfactual)的概念,那些真实发生的潜在结果称为事实潜在结果(factual potential outcome),相对而言未真实发生的结果变为反事实潜在结果(counter factual potential outcome)。
我们引入相关的 notation:
记
T
i
T_i
Ti 为 单元
i
i
i 所接受的干预:
T
i
=
{
1
如果单元 i 接受干预
0
其他
T_i=\left\{\begin{array}{l} 1 \text { 如果单元 i 接受干预 } \\ 0 \text { 其他 } \end{array}\right.
Ti={1 如果单元 i 接受干预 0 其他
记
Y
i
Y_i
Yi 为 单元
i
i
i 的观测结果变量。对于潜在结果,可记为
Y
T
i
i
Y_{T_ii}
YTii
Y
0
i
Y_{0 i}
Y0i 是未接受干预的单元
i
\mathrm{i}
i 的潜在结果;
Y
1
i
Y_{1 i}
Y1i 是接受干预的同一单元
i
\mathrm{i}
i 的潜在结果。
有时我们也采用
Y
i
(
t
)
Y_i(t)
Yi(t) 进行记录,即
Y
i
(
0
)
Y_i(0)
Yi(0)和
Y
i
(
1
)
Y_i(1)
Yi(1).
1.2 基于潜在结果定量干预效应
引入潜在结果框架是为了科学的定义干预的效应,我们定义个体干预效应为( individual treatment effect):
Y
1
i
−
Y
0
i
Y_{1 i}-Y_{0 i}
Y1i−Y0i
这对应上述例子里,接受消费券这一干预对小刘在电商平台购买行为为平台产生利润的增长。
但是,考虑到因果推断的重要基本认识,即针对某一个对象/单元,我们总是只能观测到其接受干预或不接受干预两种情况之一。也就是针对任一实验单元个体,我们总是只能观察到
Y
1
i
Y_{1 i}
Y1i或
Y
0
i
Y_{0 i}
Y0i两种潜在结果之一。所以,我们需要引入平均干预效应 (Average Treatment Effect, ATE),定义为:
A
T
E
=
E
[
Y
1
−
Y
0
]
A T E=E\left[Y_1-Y_0\right]
ATE=E[Y1−Y0]
另一个更容易估计的量是被干预者平均干预效果(average treatment effect on the treated, ATT),定义为:
A
T
T
=
E
[
Y
1
−
Y
0
∣
T
=
1
]
A T T=E\left[Y_1-Y_0 \mid T=1\right]
ATT=E[Y1−Y0∣T=1]
1.3 潜在结果的因果建模实例
举个例子,我们考虑电商平台的优惠券发放,某个用户小刘记为 i i i ,其得到消费券即为接受干预 T i = 1 T_i=1 Ti=1,未得到消费券即为没有接受干预 T i = 0 T_i=0 Ti=0,公司关注用户得到或没得到消费券时的消费行为公司产生的利润 Y i Y_i Yi。如果小刘得到了平台的消费券,我们可以确实观察到 Y 1 i Y_{1i} Y1i,这便是所谓事实。在这一情况下,虽然无法观察到小刘没得到消费券时的 Y 0 i Y_{0i} Y0i,但 Y 0 i Y_{0i} Y0i依然可以定义,并称为反事实潜在结果。
文章目录
- 1.1 潜在结果(Potential Outcome)
- 1.2 基于潜在结果定量干预效应
- 1.3 潜在结果的因果建模实例
1.1 潜在结果(Potential Outcome)
因果推断的一个重要基本认识是:针对某一个对象/单元,我们总是只能观测到其接受干预或不接受干预两种情况之一。由此我们引入 Rubin 的潜在结果框架(potential outcome)作为因果推断的数学语言。
所谓潜在结果,我们的讨论是基于对象采取或不采取干预时潜在的结果。这也引出了事实(factual)与反事实(counterfactual)的概念,那些真实发生的潜在结果称为事实潜在结果(factual potential outcome),相对而言未真实发生的结果变为反事实潜在结果(counter factual potential outcome)。
我们引入相关的 notation:
记
T
i
T_i
Ti 为 单元
i
i
i 所接受的干预:
T
i
=
{
1
如果单元 i 接受干预
0
其他
T_i=\left\{\begin{array}{l} 1 \text { 如果单元 i 接受干预 } \\ 0 \text { 其他 } \end{array}\right.
Ti={1 如果单元 i 接受干预 0 其他
记
Y
i
Y_i
Yi 为 单元
i
i
i 的观测结果变量。对于潜在结果,可记为
Y
T
i
i
Y_{T_ii}
YTii
Y
0
i
Y_{0 i}
Y0i 是未接受干预的单元
i
\mathrm{i}
i 的潜在结果;
Y
1
i
Y_{1 i}
Y1i 是接受干预的同一单元
i
\mathrm{i}
i 的潜在结果。
有时我们也采用
Y
i
(
t
)
Y_i(t)
Yi(t) 进行记录,即
Y
i
(
0
)
Y_i(0)
Yi(0)和
Y
i
(
1
)
Y_i(1)
Yi(1).
1.2 基于潜在结果定量干预效应
引入潜在结果框架是为了科学的定义干预的效应,我们定义个体干预效应为( individual treatment effect):
Y
1
i
−
Y
0
i
Y_{1 i}-Y_{0 i}
Y1i−Y0i
这对应上述例子里,接受消费券这一干预对小刘在电商平台购买行为为平台产生利润的增长。
但是,考虑到因果推断的重要基本认识,即针对某一个对象/单元,我们总是只能观测到其接受干预或不接受干预两种情况之一。也就是针对任一实验单元个体,我们总是只能观察到
Y
1
i
Y_{1 i}
Y1i或
Y
0
i
Y_{0 i}
Y0i两种潜在结果之一。所以,我们需要引入平均干预效应 (Average Treatment Effect, ATE),定义为:
A
T
E
=
E
[
Y
1
−
Y
0
]
A T E=E\left[Y_1-Y_0\right]
ATE=E[Y1−Y0]
另一个更容易估计的量是被干预者平均干预效果(average treatment effect on the treated, ATT),定义为:
A
T
T
=
E
[
Y
1
−
Y
0
∣
T
=
1
]
A T T=E\left[Y_1-Y_0 \mid T=1\right]
ATT=E[Y1−Y0∣T=1]
1.3 潜在结果的因果建模实例
举个例子,我们考虑电商平台的优惠券发放,某个用户小刘记为 i i i ,其得到消费券即为接受干预 T i = 1 T_i=1 Ti=1,未得到消费券即为没有接受干预 T i = 0 T_i=0 Ti=0,公司关注用户得到或没得到消费券时的消费行为公司产生的利润 Y i Y_i Yi。如果小刘得到了平台的消费券,我们可以确实观察到 Y 1 i Y_{1i} Y1i,这便是所谓事实。在这一情况下,虽然无法观察到小刘没得到消费券时的 Y 0 i Y_{0i} Y0i,但 Y 0 i Y_{0i} Y0i依然可以定义,并称为反事实潜在结果。