定性比较分析文献导读之Extension of Boolean Methods of Qualitative Comparison

2020年12月20日的质性研究研读小组第五十八次研读活动中,研究小组继续研读关于定性比较分析(qualitative comparative analysis, QCA)方法的文献,即Charles C. Ragin于1987年出版、2014年再版的Moving Beyond Qualitative and Quantitative Strategies: The Comparative Method一书。本次由高岭负责导读该书的第七章“A Boolean Approach to Qualitative Comparison: Basic Concepts”(定性比较布尔方法的拓展)。
第六章中用来介绍定性比较的布尔技术的假设例子是不现实的。它们的简单性简化了呈现基本布尔原理的任务,但留下了许多重要的问题没有解决。本章也使用假设数据,但示例更为复杂。这些假设数据更接近第八章中用来说明布尔方法的各种应用的经验例子。因此,第七章衔接了第六章和第八章。
第六章回避了几个关键问题。其中最重要的是促使布尔技术发展的一个问题,即自然发生的数据缺乏足够的多样性,无法进行类似实验的比较分析(见第二章和第三章)。如前所述,统计控制技术的发展部分是为了解决多样性有限的问题。布尔技术对这个问题的反应是一样的,但方式截然不同。统计技术能够通过对社会因果关系的本质做出(有时是紧张的和不现实的)假设来近似于实验式的比较。布尔方法试图避免这些假设,并允许最大限度的因果复杂性。将多样性问题的布尔分析方法直接纳入到有限多样性问题中。这一战略在下文第一个主要部分有详细解释。
第六章所回避的另一个重要问题是“自相矛盾的行”问题。为了构造真值表,案例在自变量上被分类成不同的值组合,形成真值表的行,然后每行被分配一个输出值,即因变量的分数为1或0。如果在具有相同输入值组合的情况下没有明显的趋势,则很难确定因变量(行的输出值)的适当分数。下面的第二个主要问题是讨论这个问题。第三个问题是评估理论的论据。第六章所提供的基本材料给人一种错误的印象,即理论只在选择原因条件和构造真值表时才进入基于布尔的比较分析。从那以后,这个程序似乎是相对归纳的。事实上,关于原因组合的理论论证可以纳入布尔分析。本章的第三个主要部分概述了评估基于理论的因果论证的程序。这些技术说明了布尔方法的灵活性及其与理论测试和理论构建目标的兼容性。
本章的最后一节总结了布尔方法的主要特征,并根据第五章概述的综合策略的理想特征对其进行了评估。
有限多样性问题
社会科学家对自然发生的社会现象显示出有限的多样性这一事实有一种爱恨关系。一方面,如前所述,有限的多样性严重限制了检验因果论证的可能性。这使得比较社会科学成为一个挑战。然而,另一方面,社会现象的多样性有限,这是有充分理由的。例如,所有美国总统都是白人男性,这一事实显然是多样性有限的一个有意义的例子。
由于多样性有限,关于因果关系的陈述(在没有简化假设的情况下)必然局限于实际存在的原因条件的组合。例如,如果分析表明,迅速的商业化与农民社会中的传统主义相结合会导致农民起义/叛乱/革命,那么一般的说法将局限于具有已知因果相关特征组合的现有农民社会。完全有可能的是,具有不同形态的因果相关特征的农民社会可能在过去存在,也可能在未来存在(或被简单地忽视),这些农民社会因完全不同的原因而经历叛乱。在这些情况下,迅速的商业化和传统主义可能无关紧要。当然,这不会改变分析的结果,但重要的是要认识到多样性的局限性。
回顾一下,定性比较方法的主要目标之一是允许最大程度的因果复杂性,以避免像大多数传统统计分析中那样,在一开始就对原因做出简化假设。简化假设不是不可以考虑,而是只有在进行了允许最大复杂性的分析之后才能考虑。
为了说明这个问题,请考虑下面的简单的真值表。有研究认为,周边地区少数民族政党出现的原因有三:民族不平等(A)、政府集权(B)和民族机构被侵蚀(C)。周边地区有少数民族集中的几个国家的真值表如表7所示。
简单的检查表明,条件C是政党形成(F)的唯一原因,因为侵蚀的存在/不存在与少数民族政党的存在/不存在之间存在着完美的对应关系,但需要注意,没有任何案例将民族机构的侵蚀、民族不平等和政府集权结合起来。
因此,F=aC+bC,而不是F=C。在第一个语句中,C是必要的,但不是充分的;在第二个语句中,C既是必要的也是充分的。请注意,从第一个方程中可以明显看出,为了得出更简单的因果关系(F=C),需要什么样的简化假设:在A和B同时存在的情况下,C导致F。这种多样性的方法与一开始就对原因作出一般性的假设是完全不同的。
在大多数统计分析中,由于对总体和样本、变量及其关系、因果关系的假设(例如,原因是加性的;见第四章),有限多样性的问题被掩盖了。在定性比较研究中,这些假设被避免,因为案例被视为特征的可解释组合,而不是样本值的数组。
可以使用布尔真值表方法来解决多样性问题。案例的因果相关特征被用作输入变量,遵循第六章例子中的模式,但输出变量不是结果或某种类型的历史突发现象。它只是一个存在/不存在的二分法,表明是否存在某种原因的组合。因此,分析的重点直接放在案例的多样性程度上。当原因条件的所有组合都存在时(最大多样性),方程简化为统一(所有组合都存在;无一不存在)。将这些程序应用于简单真值表(表7)会产生以下布尔方程建模多样性:
现有组合=a+b
这个等式表明,现有的所有组合都显示不存在A或B(或者,根据逻辑含义,A和B都不存在)。利用德摩根定律(见第6章),将其转化为不存在的原因组合的明确陈述是很简单的:
不存在的组合=AB
考虑一个更复杂的例子。表8列出了农民起义的四个原因的假设数据。在试图评估导致叛乱的各种情况组合之前,可以初步评估农民社会中原因组合的多样性存在。参见表8:农民起义原因假设真值表(包括相互矛盾的行)
这一步很重要,因为任何对农民起义原因的分析结果都局限于分析中实际包含的农民社会所表现出的因果组合。
在表8的真值表中,考察了四个原因条件:A表示农民传统主义的持续存在(1=是,0=否);B表示农业的商业化(1=是,0=否);C表示存在大量中农阶级(1=是,0=否);D表示地主精英(1=不存在,0-存在)。并非所有逻辑上可能的这四个特征的组合都存在。因此,如果存在具有行中所述特征组合的农民社会实例,则输出变量P编码为1,否则编码为0;输出变量R表示存在反抗的现有农民社会的子集。
为了评估这些情况之间差异性的局限性,有必要简单地将第6章中提出的最小化算法应用于该真值表,使用P而不是R作为输出值。导出了一个对现有组合进行建模的方程;然后将德摩根定律应用于该方程,以创建不存在的原因组合的显式布尔语句。
布尔分析的第一步是生成“prime implicants”。
P=ac+aD+BD+Abd
方程表明,农民社会有四种基本类型:缺少农民传统主义(a)和缺少中农(c)相结合的社会;缺少农民传统主义(a)和缺少地主精英(D)相结合的社会;存在农业商业化(B)和缺少地主精英(D)相结合的社会;存在农民传统主义(A)、缺少农业商业化(b)和存在地主精英(d)相结合的社会。参考真值表,我们可以看到一些混合类型的例子。例如,符合组合aBcD的农民社会具有前面等式中确定的前三个术语的元素。
把德摩根定律用于真值表中,可以显示不存在的原因组合,这个等式说明了任何真值表分析的局限。
p=ABd+aCd+AbD+BCd
第二步是寻找子集方程。因为农民起义的例子是农民社会实例的一个子集,所以,起义方程是农民社会方程的一个子集。探讨起义原因的最简单的方法是假定,如果不存在的任何一种农民社会确实存在,他们就不会经历起义。在这种方法中,数据中不存在的原因组合应被编码为无起义的实例(因此,在表8中的R列中被重新编码为0)。表8的真值表简化为
R=ABD+aCD
从简单的检查中可以明显地看出,方程R中的ABD项是方程P中BD项的子集,而aCD(R方程)是aD(P方程)项的子集。因此,农民起义只在多样性的布尔分析中揭示的四种基本农民社会类型中的两种。
前面的等式说明有两个主要的组合产生农民起义的条件。第一种类型结合了传统主义(A)、农业商业化(B)和缺少地主精英(D)。第二种结合了缺少传统主义(a)、存在中农阶级(C)和缺少地主精英(D)。这两种类型的区别在于传统主义的存在与否,因此是相互排斥的。根据这些结果,一个共同点是缺少地主精英(D),这可以被认为是起义的必要条件,因为这两个词都出现了。在随后的农民起义研究阶段,研究者将使用这两种原因组合来对农民起义进行分类,并解释每一类中的案例。
第三步是进一步简化方程。方程R可能是布尔分析的一个适当的停止点,但是可以通过简化假设,进一步简化(R)方程。这里,可以使用一个简单的快捷算法,而不是逐个检查不存在的组合。
这条捷径有两个步骤。这两个步骤都涉及到用于推导R方程的程序的微小改变。第一,在prime implicants式的推导中,不存在的组合被视为输出变量的实例(在本分析中,被视为起义的实例)。第二,当用prime implicants图进一步简化方程时,不存在的项被排除在prime implicants必须覆盖的原始表达式中。
将这些程序应用于农民起义的真值表(表8),可得出以下简化方程:
R'=AB+CD
很明显,这是上一个等式(R=ABD+aCD)的超集(superset),因为这两个术语已经被扩展。
最后一个等式说明,如果农民传统主义(A)和农业商业化(B)相结合,或者如果中农阶级(C)与缺少地主精英(D)相结合,农民起义就有可能发生。为了得到一个最小的解,有必要假设(1)存在地主精英(d)、农民传统主义(A)和农业商业化(B)的结合会导致农民起义(R);和(2)存在农民传统主义(A)和缺少农业商业化(b)的条件下,中农阶级(C)和缺少地主精英(D)的结合会导致农民起义。
当然,做这样的假设是不必要的,在涉及农民起义的例子中,这两种假设在理论和实证上都可能受到质疑。关键是真值表方法使其他过程中通常隐含的内容变得很明确。它允许直接考虑数据中不存在的原因条件的组合,从而迫使研究者面对允许更一般的因果陈述的理论假设。
在这一点上,重要的是在更抽象的层次上总结这些处理有限多样性的程序的逻辑。
首先,推导一个描述现有案例中原因条件配置(configurations)的方程。该方程模拟了多样性,用集合(大写)P表示,表明“存在”。把德摩根定律应用到这个方程中,产生一个用于描述不存在的案例的集合p(小写)。然后,在此基础上,导出了一个描述农民社会发生起义(R)子集的原因组合的方程。最后,利用描述不存在案例的一个子集(p)进一步简化起义方程(R),导出描述可能发生农民起义(R’)的一些案例的方程。请注意,R是P(存在的原因组合)和R’(可能的农民起义原因组合)的交集。因此,如果不限制农民社会的多样性,也就是说,如果农民社会表现出各种可能的农民起义原因的组合,那么R'可以被视为农民起义的模式。
因此,布尔技术的定性比较分析提供了一个非常直接的方法来解决有限多样性的问题。对多样性的有限性进行建模;隐含的、简化的假设都明确提出并可检验;如果需要,可以推导出包含这些假设的方程。事实上,研究者能够以一种把具体的、经验性的假设客观化的方式来规避有限的多样性问题,达到规模问题的目标。这样,一个基于现有的可得证据的模型,就可以对不存在的原因的组合进行推测。
当然,这些程序不是强制性/僵化的。完全有可能的是,更复杂的方程(R)可能出于几个原因而被优先考虑。当然,它更为保守。此外,并没有对不存在的组合进行简化的假设。最后,最大限度的简约可能并不是理想的,特别是如果解释、评估理解复杂性的目标是给定的,优先于节俭目标时。一般来说,当相关案例的数量相对较少时,如本例中所述,解释单个案例或类似案例组是可行的。这种情况更适合使用更复杂的方程(R=ABD+aCD),而不是包含了简化假设的方程(R'=AB+CD)。
自相矛盾的问题
为了使用真值表方法,有必要为每一行确定一个输出值(也就是说,对数据中存在的每个原因的组合,赋值为1或0。到目前为止,人们认为这并不是问题。然而,经验性的案例只是偶尔会如此整洁,对于感兴趣现象,当符合某些原因组合的案例没有表现出明显的存在或不存在的趋势时,有必要考虑该怎么做。
有几种方法可以解决这个问题。最好的方法是追随以案例为导向的研究者。回想一下,当案例导向的研究人员遇到与矛盾行类似的不一致或悖论时,他们通常会更详细地检查这些棘手的案例(troublesome case),并试图找出遗漏的因果变量(见第3章)。例如,在农民起义的假设分析中,如果Abcd的10个案例中有5个经历过起义,那么遵循案例导向的研究者将涉及到对这10个案例进行更详细的研究。这项检查可能会得出结论,第五个原因E被忽视了。如果增加变量E能把10个案例分成更一致的起义组/无起义组,那么,第五个原因可以在添加到真值表中。因此,遵循案例导向的方法,就是将任何有关因果条件的设定都视为试探性的,并在简化真值表之前,利用理论和实质性(substantive)知识来实现对原因条件的恰当的设定。
可以使用真值表方法来帮助分析棘手的因果组合,从而简化识别遗漏的因果变量的任务。从本质上讲,一个模拟矛盾性原因组合的方程是派生的。然后,这个方程用于指导人们寻找更多的因果变量,或者以某种方式改进现有的分析。考虑表9,它是农民起义真值表(表8)的修订版本。
注意,四个因果组合(用问号表示)在起义和不起义之间被相当平均地分割。要分析这四个组合的共同点,只需将它们编码为1,并将其他现有组合编码为0。新的输出被标记为X,表示逻辑上矛盾的(contradictory)因果组合。
这个新的真值表可以通过使用标准的最小化程序来简化。简化的第一步是将不存在的组合(真值表中编码为“—”的组合)编码为0。其假设是,如果存在这些原因组合的实例,它们可以在R上明确地编码1或0。分析结果如下:
X=ABD+Abd
方程表明,当这两种基本的原因组合在农民社会出现时,起义可能发生,也可能不发生。在其他的组合中,反抗要么倾向于发生,要么倾向于不发生。
这个方程可以通过简化假设进一步简化。这个程序遵循上面给出的大纲:首先,使用重新编码的不存在组合(现在编码为1)来生成prime implicants;然后,使用prime implicants程序,将不存在的组合从prime implicants必须覆盖的原始项中排除。得到以下方程
X'=A
(参见表9进行验证)。X的方程表明,当A(农民传统主义)与BD或bd结合时,就会出现矛盾的原因组合。X'的方程表明,只要A(农民传统主义)出现,就会出现矛盾的原因组合。
方程X'为解决真值表中的矛盾提供了两种可能的途径。一是试图厘清什么是农民传统主义。可能在某些情况下,农民传统主义是对一种古老而持久的生活方式的严格坚持。在另一些国家,它可能意味着一种期望和义务体系,把农民社区与地主精英和国家联系起来。简言之,这种布尔分析的结果可能表明传统主义的概念化存在问题。
第二,结果可能表明,寻找第五个变量的重点应该放在促成农民传统主义革命的(尚未明确的)条件上。可以说,农民传统主义必须与表中没有包括的条件(例如农民直接接触世界市场力量)相结合,农民传统主义才能具有革命性。
上面概述的处理不明确的原因组合的程序主要是为了完善研究人员的概念或对原因的理解。因此,他们迫使研究人员返回数据,并最终构建一个新的真值表来分析革命。
但是,有时很难返回到数据中,必须使用不遵循案例导向的方法的替代策略。这里将简要介绍几个方案。
一个简单的解决方案是把所有不明确的因果组合编码为0。这里的论据是,如果在符合某种特定因果组合的案例中没有明显的趋势(例如是否有反抗),那么输出应该保守地编码(根据调查人员对引起叛乱的条件的设定的信心)。因此,分析将显示哪些原因组合与结果(农民起义)明确相关。将此规则应用于表9可得出以下简化方程:
R=aCD
实际上,这个方程是原始方程的一个子集,它显示R=ABD+aCD。
或者研究者可能希望将相互矛盾的组合重新编码为不存在的组合,在这种情况下,带有“?”的行将被编码为“—”,以表明这些组合被视为不存在。这个程序的特征是让算法决定出现矛盾的行应该接受哪一个最终输出值。如果它们有助于产生一个更小的解,它们将得到一个数值为1的编码;如果没有,它们将得到一个数值为0的编码。这种分析的结果同样表明
R=aCD
沿着同样的思路,第三个选择是撒一个大网,这样,导致农民起义的所有可能的原因组合都能被这个等式捕捉到。这种方法与允许更复杂的总体目标是一致的。正如前几章所述,对因果复杂性更敏感是解释方法的一个特点。因此,如果在真值表中,模糊的原因组合被编码为1(出现了反抗),那么就可以推导出一个方程,它允许包含更多的原因组合。这个分析结果表明
R=ABD+aCD+Abd
不难看出,这一方程是原方程R的超集(superset),它增加了原因组合Abd(农民传统主义与小商品化和农民地主的组合)。这是最初出现在上述的方程C(矛盾性原因组合)的原因组合之一。请注意,这个等式回答了一个问题:在什么条件下农民起义是可能的?
一般来说,最好是通过检查案例来解决矛盾性原因组合,即上面提到的第一种策略,而不是通过假设出现矛盾的行是感兴趣的现象的实例(1)、缺失的实例(0)或不存在的原因组合(—)来解决。
自相矛盾的原因组合问题并不像看上去那么严重。在一些研究中,可以结合频率或统计标准来解决矛盾。一般来说,如果案例少,矛盾性组合也就少了。随着案例数量的增加,矛盾性组合的数量也会增加。但是,随着案例数量的增加,用简单的统计标准来帮助构建真值表会变得更加可行。
在一些研究中,每一个原因组合都可能是自相矛盾的,研究者可能会遇到每一个原因组合的成功概率(即积极结果)问题。为了将这些概率重新编码为正(1)和负(0)的结果组合,可以评估每个概率与定义为标准的有实质意义的概率之间差异的显著性(例如,将整个案例组视为一组的成功概率)。概率显著小于标准的原因组合可以被编码为失败(0);概率显著大于标准的原因组合可以被编码为成功(1);而概率与标准没有显著差异的原因组合可以有选择地使用,以产生一个更小的解,因为前面的例子中使用了不存在的原因组合(Ragin和其他人1984年在一项关于歧视的研究中使用了这一程序的变体)。一般来说,这些显著性检验可能应该使用一个高的临界值(例如,0.33显著性水平),以尽量减少归为第三类的原因组合的数量(模棱两可的结果)。
第二种更为复杂的统计过程可能是使用一个附加的logit模型,来计算独立变量中每个组合的期望值。观察到的比例与期望值的偏差可以作为在真值表中编码输出值的基础(较大的正偏差将编码为1;较大的负偏差将编码为0)。这些程序的特征是使用布尔技术的同时交叉使用统计分析,从而可以对原因组合进行彻底检查。当然,如果案例数量很多,也可以对相同的数据进行布尔分析和对数线性分析(测试复杂的统计交互作用),用其中一个来帮助解释另一个。
所有解决矛盾问题的办法,除第一种外,都违背了以案例为导向的定性研究精神,只有在无法回到原来的案例,构建更好的真值表时,才应该使用这些策略。在许多方面,一旦真值表完成(或至少被视为最终值),研究者的目标就是破译真值表中所呈现的复杂性。这里的教训是,不应将现有的数据集视为不可撤销的起点。在定性比较研究中,用真值表刻画经验世界是研究中的一个重要部分。
评估理论论据
理论的作用不仅仅是设定原因变量,还设定了原因组合。例如,对农民起义的理论文献进行回顾,可以作为确定因果关系的基础。有一种理论可能会认为,农民社会的简单(simple)商业化是激发革命的原因。另一种可能会认为,如果一个农民社会缺少农民传统主义,中农阶级和地主精英并存,可能最容易发生农民起义。这两个理论很容易用布尔术语来表达。第一个理论可简单地表示为T=B,其中T表示是理论推导出来的模型。第二个理论是T=aCd。这两者可以用一个方程来表示:
T=B+aCd
显然,这并不是农民起义的假设数据分析所显示的那样。从对农民起义的分析中得出的不那么保守的方程(包含了对不存在的组合的简化假设)揭示了
R'=AB+CD
一个重要的问题是使用布尔代数来反映理论推导出来的模型(T)与真值表(R’)。这一分析很重要,因为它为评估理论和解释与理论预期相关的实证案例提供了基础。
例如,T和R'的交集显示了假设和发现的原因组合的子集:
实际上,这个结果表明第一个理论假设的原因条件的子集得到了验证。这一理论预期,所有经历商业化的农民社会都应该经历起义。而实际结果显示,只有一小部分这样的社会真正经历了起义。
也可以使用这些程序来模拟那些实际发生了起义但理论上没有做出假设的原因组合。这个集合是由R'和t的交集形成的。集合t包含所有的没有做出假设的原因组合,并且把德摩根定律应用于方程T的结果:
bCD这一项指出了现有理论的主要缺点。具体地说,这个结果表明,在没有商业化的情况下,这些理论对农民起义的原因的解释是脱离实际的。实际上,在没有商业化的情况下,如果没有地主精英,革命会发生于存在中农阶级的农民社会。
(t)(R’)的这个等式很重要,它为没有经历商业化的农民社会发生的农民起义提供了一条解释途径。即在没有商业化(一种假设的原因)的情况下,中农和地主精英的结合导致了农民起义。在解释CD案例时,研究者可能想要确定CD组合的什么因素,使得CD组合的效果等同于B(商业化)或等同于商业化和传统主义(AB)的结合。如果把现有理论仅仅作为解释农民起义的指导,这种解释性的引导就是重要的。
最后,还可以对理论假设上会发生革命但实际未发生的原因组合进行建模。这个集合是由T和r'的交集形成的。集合r'包含了所有未发生起义/革命的案例,可以通过方程R’对应用德摩根定律得到:
这些结果表明,强调原因组合aCd的第二种理论,并没有得到证据的支持,因为它强调的因果组合(aCd)出现在前面的方程中。该方程还表明,第一种理论夸大了商业化力(B)的作用。当农业社会的商业化与农民传统主义缺失和少数中农(c)或地主精英(d)相结合时,农民起义就不会发生。最后一个等式显示了现有理论的主要缺点;它改进了第一个理论,完全否定了第二个理论。
这些程序显示了把布尔方法应用于定性比较分析的巨大好处之一。当用传统的统计技术检验理论时,研究者很少被迫考虑因果联结(causal conjunctures)。统计分析技术使研究者倾向于将不同的原因视为竞争性解释,并试图解释他们之间的差异。相比之下,在布尔方法中,关于原因组合的争论比关于单一原因的争论更受青睐。因此,研究人员不得不从组合/并发联结(conjunctures)的角度来思考。至少,典型的布尔分析会迫使倾向于单变量解释的研究者去考虑组合限制的影响。
布尔技术普遍被认为是阐释性(interpretive)分析的利器,但布尔技术不应被机械地使用。布尔分析的结果不会取代解释性分析;一旦得到解决方案,将结果应用于案例的任务仍然存在。而且,重要的是要强调,构建真值表需要付出相当大的努力,在所有这些例子中,这是理所当然的智力劳动。要构建一个有用的真值表,就必须熟悉相关理论、相关研究文献,最重要的是要熟悉相关案例。因此,一个真值表需要大量的背景(background)研究。
在以上所有的例子中(以及在这三个问题中考察了有限的多样性、模糊的原因组合和理论的评价),强调了布尔方法在定性比较分析方面的一般灵活性。当然,用实际数据(第8章的目标)来证明这种灵活性要容易得多,因为非假设性的数据要求更高,也更容易解释。然而,在对实证数据进行分析之前,我想回顾一下布尔方法的基本特征,并评估其作为广泛的比较研究策略的基础的潜力。
作为中间道路的布尔方法
第五章提出了综合性(synthetic)比较研究策略的五个理想特征。包括:
1. 检验大量案例的能力
2. 处理复杂的因果联结(causal conjunctures)的能力
3. 做出简洁的解释(如果需要的话)的能力
4. (整体和部分地)检查案例的能力
5. 评估竞争性解释的能力
布尔方法是否提供了必要的工具?
第一,很明显布尔方法可以处理许多情况。事实上,实际的案例数量并不是主要的考虑因素。如果许多案例在感兴趣的因果变量上具有相同的值组合,则它们都被编码在一起,作为真值表的一行,因为它们是相同的。布尔方法更关心存在的值的不同组合及其输出值,而不是每个组合的实际实例数。与案例数量相比,更相关的是相关原因条件的逻辑可能组合的数量——这一数字由所考虑的原因条件的数量决定。
第二,很明显,布尔方法解决了多重联合因果(multiple conjunctural causation)交互的复杂模式。布尔方法以最大的因果复杂度假设为起点,然后将每个原因条件的组合分配给各自的输出值。然后,通过使用一些基本的布尔原理在逻辑上简化这种复杂性。这个程序与统计方法形成鲜明对比,后者以简单假设为出发点。
注意,布尔方法完成了案例导向的研究想要实现的目标,但案例规模要大得多。在以案例为导向的研究中,研究者分析相似性和差异性,以确定共同的潜在模式和类型。然而,正如第三章所提到的,相似性和差异性的网络经常失控。布尔真表方法及其简化复杂性的规则为管理这种复杂网络提供了基础。它允许以案例为导向的研究者看到并理解复杂的模式和并发联结/组合。
第三,布尔方法通过其最小化程序能够产生简洁的解释。简洁问题在本质上是一个理论指导下的数据简化问题。所有的数据简化技术都会产生简洁。原始数据矩阵的构造与从原始数据矩阵中构造真值表一样,都是一种简洁形式,因为复杂性大大降低了。它被捕捉并转换成编码变量。一个简洁的解释超越了这些简单的数据简化,它以一种基于理论和有意义(可解释)的方式将因果联系起来。这种复杂性的进一步降低是在统计分析中实现的,即估计每个独立变量对某些结果变量的唯一加性贡献。在布尔方法中,通过确定获得某个结果的最大类条件来实现一个简洁的解释。简单地说,布尔数据简化技术的应用最终以产生特定结果的不同条件组合的逻辑最小陈述为顶点。
第四,布尔方法既有整体性又有分析性;它将案例作为整体和部分进行检查。在布尔分析中,案例被视为零件的组合。这些组合可以解释为不同的情况。整体论的一个基本原则为这种看待案例的方式提供了元理论基础:改变一个整体的任何一个部分,任何一个元素,都有可能至少改变整体的特征。这种方法与大多数统计方法直接对比,后者的目标是估计每个变量(每个部分的因果重要性)对其他变量所有值的平均影响。
然而,布尔方法的整体性并不极端。在其最极端的形式中,整体哲学认为每个实体都是独一无二的,一旦理解了它们的复杂性和个性,它们就不能相互比较。显然,布尔方法没有走到这一步。在构建真值表时,将相关因果变量值组合相同的案例集合在一起。在布尔分析中,它们是等价的整体。此外,通过检验的唯一性,选择了因果边界的唯一性。这种约束限制了案例可能显示的个性。例如,如果选择了四个因果条件进行分析,那么只有16个可能的整体。简言之,布尔方法在其处理案例的方法中是分析的,因为它在每个设置中检查相同的因果条件。然而,它是整体性的,它比较不同的情况,并且以这种方式保留了面向案例的方法的最佳特性之一。
第五,也是最后,布尔方法可以用来评估不同的解释。案例导向研究的一个缺点是,它们通常是围绕一个单一的视角来组织的。通常,案例被选择性地用来说明或阐述某一理论。在布尔方法中,竞争性解释可以在原因变量中以类似于统计方法的方式进行操作。然而,在统计分析中,变量相互竞争。如果一组变量获胜,那么它们所代表的理论就得到了支持。在布尔方法中,理论之间的竞争被超越了。原因条件的不同组合定义了不同的情况。在某些情况下,与某一理论相关的变量可能很重要。在另一些情况下,它们可能不会。这一特征为评价相互竞争的解释和推进理论提供了基础。布尔分析的典型的终端产品一种是用不同理论确定的原因变量限制的陈述,而不是机械地拒绝或接受它们。
关于实现布尔算法的一点注记
虽然可以用简单的笔和纸解决上述的相对较小的问题,但是,用计算机实现这些算法要容易得多。有经验的程序员可以在计算机上实现它们,在刚刚描述的实现中,程序并不是完全没有问题的,但是对于想要自己动手的人来说,这是一个很好的起点。
Drass和Ragin(1986)在一个专门为社会数据设计的称为QCA(定性比较分析)的计算机包中实现了布尔算法。与McDermott的程序相比,它有很多优点,在处理社会数据方面有更大的灵活性。此外,它需要一个数据矩阵作为输入,而不是一个干净和完全指定的真值表。
高岭,中国人民大学经济学院博士生。