因果推论(PSM vs RDD vs IV)
此文内容总结自 胡安宁 《倾向值匹配与因果推论方法述评》
一、倾向值匹配(PROPENSITY SCORE MATCHING)
1. PSM思想的来源
倾向值( propensity score) 这一概念最早出现在 1983 年罗森鲍姆和鲁宾合写的一篇名为《倾向值对于观察研究中因果效应的中心作用》的论文中( Rosenbaum & Rubin, 1983) 。倾向值指被研究的个体在控制可观测到的混淆变量( confounding variables) 的情况下受到某种自变量影响的条件概率。在一般的实证研究中,由于存在很多其他变量混淆自变量和因变量之间的关系,研究者很难直接探索二者之间的“净效果”( net effects) 。这些混淆变量的影响通常被称为选择性误差( selection bias) 。
2. PSM的逻辑
匹配的基本逻辑是将受到自变量影响的个体与没有受到影响的个体进行配对。罗森鲍姆和鲁斌通过逻辑回归方法将混淆变量“总结”成一个倾向值,而倾向值匹配就是保证匹配起来的个体的倾向值(一般为事件的概率)相等或者近似。
二、 Heckman“两步估计法”
Heckman 从样本选择的角度出发,认为在研究某个自变量效果的时候会不自觉地选择一些样本而忽视另外一些。面对这种情况,Heckman 认为在进行研究时需要做到两步工作。第一步是建立模型来拟合个体参与到某种研究项目中的可能性,第二步则是在控制这种参与可能性的前提下来考察我们所关心的自变量对因变量的效果。因此,Heckman的方法也被称为“两步估计法”(two-step estimator)(Heckman, 1978, 1979)。
三、工具变量
假定我们希望探索变量X对Y的因果关系,混淆变量U的存在会影响我们的研究。这时,我们寻找到一个工具变量Z,该变量的特点在于和X相关,但不和Y直接相关,(除非是通过X)。同时Z也不与混淆变量U相关,这样我们就不直接考察X是否能影响Y,而是转而考察Z对Y的影响。如果Z很明显的影响了Y,我们就能够得出X影响了Y的结论。由于混淆变量 U和 X 互相影响,我们很难直接探索 X 对 Y 的“纯”作用。所以我们找到工具变量Z。Z 和 Y 的关系只能通过 X, 因此如果我们能够发现 Z对 Y 有作用, 我们就能间接得出结论说 X 对 Y 有作用,从而确定了一种因果关系。
【三种方法的区分】
Round1 :PSM vs TSE(两步估计法)
基本逻辑一致:在考察自变量效果之前通过模型估计并控制个体受到自变量影响的概率。(PSM中使用逻辑回归的方法将混淆变量“总结”呈一个倾向值;Heckman两步估计法中的第一步通过模型估算个体参与某项研究的概率)
处理倾向值得方式有一定的差异。在得到倾向值之后,罗森鲍姆和鲁斌提出了多种控制倾向值的方法,除了匹配之外,还可以将倾向值分层(stratification)或者细分(sub-classification),然后在每个层次或类别内探索因果关系,或者也可以将倾向值作为新的变量进行回归分析。而在Heckman的计量经济学传统中,倾向值主要是作为一个新的变量被纳入到已有的计量经济模型中,例如选择模型(selection model)工具变量(instrumental variable)或者双重差分法(difference-in-differences method)。
Round2 :PSM vs RDD(断点回归)
PSM将对多个混淆变量的控制转化为对单一倾向值的控制,以此满足非混淆假设,而RDD则是通过控制一个变量就能完成这一点,RDD之所以不需要考虑多个混淆变量,就在于一个个体是否能够接受变量某个变量的影响完全取决于单一变量x。换句话说,RDD中只有一个混淆变量X,这个X完全决定个体是否进入实验组或者对照组。而在社会学的调查研究当中,很难找到这种单一混淆变量的情况。此外,RDD的另一个缺陷在于:如果存在其他自变量也出现某种中断的情况,我们就很难知道什么原因造成了一面量取值的中断。
Round3 :PSM vs IV(工具变量)
从严格的统计学意义上来说,利用工具变量进行因果推论需要满足很多假设条件,因此使用工具变量方法存在诸多限制。首先,我们所推论出的因果关系被称为“局部平均治疗效果(local average treatment effect)”;其次,工具变量方法能否带来因果推论,很大程度上取决于我们能否找到好的工具变量。如果工具变量本身不够好(比如工具变量和我们关心的自变量的联系很弱,或者和其他混淆变量有关系),那么我们的结论就站不住脚了;最后,工具变量的实施需要满足一定的随机性,以满足非混淆假设,但在社会学研究中类似于随机抽签这样完美的工具变量几乎很少见。