在社会抗争研究等领域,研究对象往往涉及多案例,单独的个案已经不能满足研究的需要。 同时,作为一种复杂的社会现象,此类事件的成因存在着多元并发组合的原因变量,以线性因果关系为基础的定量统计分析方法也很难提供有效的分析结论,而定性比较分析方法(qualitative compar-ative analysis ,下文简称QCA)由于能够有效、系统地处理多案例比较的研究数据,其已在社会抗争研究等领域得到广泛运用。 QCA产生于20世纪80年代末, 由查尔斯·拉金 ( Charles C. Ragin) 在1987 年提出,它是一种以案例研究为导向的理论集合研究方法。①它强调通过实证资料以及相关理论的不断对话, 从小样本数据中建构出研究议题的因果性关系。 这是基于集合论与布尔代数的分析,即从集合而不是相关的角度考察条件与结果的关系,并使用布尔代数算法形式化人们分析问题时的逻辑过程。QCA尝试超越传统的个案研究方法,系统地考察事件发生的成因以及内部生成因子之间的互动关系、可能性关系组合,试图解释促成事件产生的关键因子、因子之间的相互联系以及激发事件产生的复杂的成因组合,以期深化对事件产生的复杂因果关系的理解。
本文首先介绍了采用布尔代数算法的QCA的基本原理、分析逻辑及操作模式;其次,简单梳理了QCA方法论的演变过程及具体操作方法的发展情况;最后,总结了QCA在中国社会科学研究中的应用状况并简要分析了其优缺点及发展趋势。
一、QCA的基本分析逻辑
QCA采用布尔代数算法形式化人们分析问题时的逻辑过程。 在逻辑比较时,布尔代数方法将任何一个个案都看成是由多个原因条件与结果条件结合而成的。如果个案数量较多,这种关于原因条件与结果条件的深度分析将超出人脑力的可乘载负荷,就需要以基于变量的定量分析来做替代。而QCA的产生,使得在个案数较多的情况下仍然可以不用求助于传统的定量分析方法,它利用布尔代数运算法则简化原因条件与结果条件之间的关系。 以下将通过具体的例子对QCA的分析逻辑及具体操作程序进行说明。
首先,QCA方法的基础是将变量先做两分处理,即解释变量和结果变量各有两种,变量取值为0或1. 表示某条件发生或存在时,变量用大写字母来表示,取值为1;反之,表示某条件不发生或不存在时,变量用小写字母或-来表示,取值为0(其中,小写字母表示不发生,-表示不存在)。 +代表“或”,*代表“和”,→及=均代表“导致”. 比如A*B=Y表示A和B同时发生导致Y的发生。
其次,QCA的分析逻辑与定量分析不同,主要体现在对因果关系的理解上。 定量研究假定社会现象的因果关系是线性的,而定性比较分析则假定社会现象的因果关系是非线性的,原因条件对结果的效应是相互依赖的,且同一个社会现象的发生可能是由不同的原因组合所导致的。由于QCA假定因果关系是多样的复杂的(complexity)且是可替代的(substitutability),所以更加关注社会现象发生的多重原因组合(multiple conjectural cause),即一个条件对结果的影响同时取决于其他条件。 比如原因条件A和B同时出现导致结果Y的产生,C和D同时出现也能导致结果Y(A*B+C*D=Y),即同一个结果的产生可能是由多个不同的原因组合所致。 再比如在社会情景B下,原因条件A出现可能导致Y的产生,即A*B=Y;在社会情景D下,原因条件A不出现也可能导致Y,即a*D=Y. 也就是说,同一个原因条件的发生或不发生与不同的社会情景相结合,都能产生同样的结果,即A*B+a*D=Y.
再次,QCA的分析单位是条件组合而不是案例, 研究者以所有的条件组合作为分析的基础,根据布尔代数(Boolean algebra)算法简化条件组合。布尔代数最基本的运算逻辑是寻找不同组合的共同点:如由A*B+A*b=Y可以得到A=Y,即如果两个不同的原因组合A*B和A*b同时导致结果Y的产生,并且这两个组合当中有且仅有一个原因条件的取值不同(如本例中的B和b),则原因条件B是冗余的。
最后,QCA是基于必要条件和充分条件的推断逻辑,而不是统计推断的逻辑,因此,定性比较分析持“非对称因果关系”,即研究者不能从A=Y直接推断出a=Y. 反之,研究者既可以分析社会现象发生的原因(Y),也可以分析其不发生的原因(y)。 分析Y时,y对应的数据并不纳入分析过程,反之亦然。
二、QCA的基本操作程序
在操作层面,研究者首先要确定案例,案例的选择是以研究问题为基础的,这是一个在理论与经验之间不断互动的过程。其次是确定原因变量,变量的选择可以遵照不同的原则(Rihoux&Ragin,2009),因为QCA的分析单位是条件组合而不是案例,所以研究者需要根据不同的策略确定原因变量,然后以个案为单位对数据进行汇总,得到原因变量与结果变量的所有组合(configurations),这些组合以表格的形式呈现出来,即真值表(truth table)。 在这个过程中可能会需要处理同样的原因条件组合对应不同的结果,即矛盾条件组合的问题。最后,研究者将所有的组合作为分析的基础,根据布尔代数对由所有条件组合所构成的真值表进行简化, 从而得出导致结果变量发生或不发生的原因条件组合。
假设我们想知道导致社会现象Y产生的原因条件,A、B、C是Y产生的三个候补原因条件,导致Y产生的原因组合有多个,由A、B、C这三个原因条件的不同组合形式构成。我们在具体观察到的事例中,对原因条件与结果条件存在与否分别赋值1与0,由此得到的各个事例的数据用真值表表示。 真值表的行数由原因条件的个数决定,如果有k个原因条件,那么真值表的行数就是2k,表示有2k个逻辑条件组合。 真值表的各行表示原因条件的各种不同逻辑组合,以及不同组合所产生的结果,即事件发生(1)或不发生(0),-表示事件不存在。 事例数表示每一种原因结果的逻辑组合所实际观察到的事例的数量,Y发生的事例数表示每一种导致Y发生的原因条件组合所对应的实际观察到的事例的数量。表1所用的真值表的例子,预设了同样的原因条件组合形式导致同样的结果。 但在实际分析应用中, 存在同一个原因条件组合对应不同结果的事例。 这样的原因条件组合被称为矛盾条件组合(contradictory row),相应地,QCA发展出许多处理矛盾条件组合的方法。 上表第三行的原因条件组合形式对应的事例数为0,所以无法确定结果Y的值。 这样的组合被称作“逻辑剩余项”(logical re-mainder),产生原因是事例收集不足。 小样本数据意味着有一部分原因变量组合是没法观察到的,即拉金(Ragin, 1987)指出的所谓有限的多样性(limited diversity)。 在实际分析中,QCA既可以把没有观察到的案例排除在分析过程之外,即将“逻辑剩余项”所对应的结果变量赋值为0,也可以引入一些没有观察到的但与现有理论不相冲突的“虚拟”组合,即简化假设(simplifying assumption)。 引入没有观察到的个案, 有利于理论模式的简化、 证实、 或证伪。 表1所呈现的多重因果关系组合(multiple conjunctional causation)用布尔代数表示如下:Y=ABC+ABc+Abc+abc (1)根据布尔代数的运算逻辑进一步将方程式简化为:Y=AB+bc (2)运算过程用集合的图示法表示如下:参照集合图示,我们可以知道方程式(2)表示“当A和B同时存在或者B和C同时不存在时,结果Y产生”. 如果进一步把逻辑残余项引入,则可以得到更简洁的方程式。 即把真值表第三行的原因条件组合对应的结果赋值为1进行简化假设(simplifying assumption)处理,得到的方程式为:Y'=A+bc (3)引入简化假设以后,A单独存在就能导致Y的发生,A是Y的充分条件。 引入实际没有观察到的原因条件组合,可以得到更简约的理论模式,同时也有助于指导进一步的经验研究,以检验现有的理论模型。然而,方程式(3)是在对实际没有观察的原因条件组合做简化假设后得到的,所以在进行因果解释时有必要做充分考虑。
三、QCA方法论的演化与拓展
QCA主要包括确定集(crisp set)、模糊集(fuzzy set)和多值集(multi value)三种具体操作方法 .
拉金(1987)将布尔代数和集合理论结合起来,发展出二分变量的 QCA 技术,用于处理两分变量的解释变量和结果变量,即确定集定性比较分析(crisp-sets QCA,csQCA)。 此后,拉金(Ragin,2000)将模糊集合引入定性比较分析,提出了模糊集定性比较分析( fuzzy-sets QCA,fsQCA) 技术。 克隆维斯特于2004年将QCA扩展到可以处理多值的条件变量, 并提出多值集定性比较分析 (multi valueQCA,mvQCA)。