一、贝叶斯主义与假说确证
关于经验证据给予假说多大支持程度的考量是确证理论( confirmation theory) 研究的主要内容。
18 世纪英国数学家贝叶斯( Thomas Bayes) 提出并证明了着名的贝叶斯逆概定理,用于描述以新证据为条件来修改假说概率的过程。定量确证的进路正是源自贝叶斯等人的确证方案对于确证程度的量化分析。简化版的贝叶斯定理可以写作“P( h︱e) = P( e︱h) P( h) / P( e) ”,这个公式告诉我们怎样依据特定的证据 e 来改变某一假说 h的验前概率( prior probability) P( h) ,使之具有新的经过 修 改 的 验 后 概 率 ( posterior probability )P( h︱e) 。而根据贝叶斯定理来确定假说 h 相对于证据 e 的条件概率 P( h︱e) 则被称为贝叶斯条件化。由此,我们可以这样来刻画假说的确证: 证据 e 确证了假说 h,当且仅当 P( h︱e) > P( h) 。
也就是说,h 相对于 e 的确证度就是 P( h︱e) 与P( h) 之间的差量。在这里我们可以看到,贝叶斯确证理论是基于两个基本的假定的。其一是假定确证函项 C( h,e) 是一个概率函项 P( h︱e) 。其二是假定验前概率到验后概率的转变是通过贝叶斯条件化来实现的。
若要把贝叶斯定理有意义地用于假说的检验,竞争假说至少要有两个以上。为了简便起见,下面的讨论也就只考察两个竞争假说的情形,于是贝叶斯定理可以相应地写作。
P( h1︱e) = P( e︱h1) P( h1) / P( e︱h1) P( h1) + P( e︱h2) P( h2)在此处,h1 是受检假说,h2 是唯一与之竞争的假说。“请注意,在一般情况下,h1 和 h2 之间的关系并不等于 h 和瓙 h 之间的关系; h 和瓙 h 之间具有逻辑的和无条件的互斥性和穷举性,而 h1 和h2 之间的互斥性和穷举性却是有条件的,即相对于一定的知识背景,这知识背景主要地是由两个竞争假设即 h1 和 h2 出现于其中的特定时期和特定领域来决定的。”
假设张三被告知一个袋子里的 100 个小球全都是黑色的,但张三却没亲眼见过任何一个小球。
现在张三想要检验这个全称概括的真伪。相关的背景知识是,张三知道这袋小球是从某家商店买来的,而这家商店所卖的 100 个一袋的袋装小球只有两种类型,一种就是全都是黑色的,另一种是杂色的,其中只有 20% 的小球是黑色的。如果张三从袋子中抽出一个小球,发现是黑色,这对他的看法应该会有怎样的影响呢?
在这里,h1 表示袋子里的小球都是黑色的,h2表示袋子里的小球并非都是黑色的,e 表示抽出了一个黑球。在张三还没着手检验之前,P( h1) 和P( h2) 都是一样的,均为 0. 5,而 h1 对 e 的预测度P( e︱h1) 是 1,h2 对 e 的预测度 P( e︱h2) 是 0. 2。
在抽出了第一个球是黑球的情况下。
P( h1︱e) = ( 1 × 0. 5) ÷ [( 1 × 0. 5) + ( 0. 2 × 0. 5) ]= 0. 83显然,h1 的可能性提升了不少。如果把第一次抽得的小球放回袋里并摇匀袋里的小球,然后再进行第二次抽球,并且第二次抽到的也是黑球,那么,若以 0. 83 作为新的验前概率的值,新的验后概率的值。
P( h1︱e) = ( 1 × 0. 83) ÷ [( 1 × 0. 83) + ( 0. 2 × 0. 17) ]= 0. 96上述的例子展示了贝叶斯主义如何刻画最为一般的确证模式,即正面事例对全称的科学定律的确证效应。实际上,贝叶斯主义与证伪主义的观点也是相容的,也能刻画负面证据对假说的否证效应。比如说,张三从袋子里抽出了一个白球,那么根据相关的背景知识,显然 P( e︱h1) 就变为0 了,因为根据 h1,袋子里是不可能装有非黑色的小球的。这样一来,P( h1︱e) = ( 0 × 0. 5) ÷ [( 0 × 0. 5) + ( 0. 2 ×0. 5) ] = 0 或 P ( h1︱e) = ( 0 × 0. 83 ) ÷ [( 0 ×0. 83) + ( 0. 2 × 0. 17) ]= 0也就是说,无论在检验的什么阶段,也无论受检假说的确证程度有多高,受检假说始终面临被证伪的可能性,对于这一点,贝叶斯确证理论也能有所反映。
此外,贝叶斯主义还可以较好地处理传统的“假说 - 演绎”检验方法所面对的一个着名的难题即迪昂问题( Duhem’s Problem) 。在观测证据否证受检假说及其辅助假说的合取式的情况下,贝叶斯主义能提供一套方法计算出观测证据分别对受检假说和它的辅助假说的支持程度,从而在此基础上确定那个或哪些假说应该被抛弃或修改。
至此,我们大致介绍了贝叶斯主义作为确证理论的主要功能和优点,下面我们来看看贝叶斯确证理论的某些局限。
二、作为确证函项的概率函项与概率解释理论的相关问题
根据贝叶斯确证理论的第一个假定,确证函项是一个概率函项。我们知道,由于对贝叶斯定理中的概率的不同解释导致了贝叶斯主义内部的分歧,从而形成了逻辑贝叶斯主义与主观贝叶斯主义两个不同的派别,前者主张为概率寻找先验的或逻辑的基础,后者则主张为概率寻找私人的或主观的基础。
逻辑解释的基本思路是,概率是证据与结论之间的一种逻辑关系。这种解释认为,只要是具备正常理性能力的个人,在面临同样证据的前提下,他们对于某个特定的预测或假说都会持有同样的置信度,概率即合理置信度( degree of rationalbelief) 。换句话说,给定假说 h 和证据 e,h 相对于e 只有一个概率值。根据逻辑解释,人们是先通过确定某些命题之间的等可能性进而确定其他命题的概率的,而确定等可能性的依据则是无差别原则。但现已为人所知的是,逻辑解释赖以确定基本概率的无差别原则会导致悖论。“其原因在于,无差别原则的根据是主观认识上的无差别,如果不加限制,就会有很强的主观任意性。”
主观解释派认为,概率所代表的假说 h 与证据 e 之间的关系不是纯逻辑关系,概率是对特定个人的置信度( degree of belief) 的测度,概率值仅仅代表一种主观置信度,这种置信度是私人的。
只要某人的置信度是一个合适的数值,置信度可以是多样的。然而,主观解释还是规定,合宜的置信度数值要以满足概率演算的规则为前提,也只有这样,个人的置信度才是一贯的( coherent) 。显然,这也是一种逻辑要求。
主观解释派的开创者拉姆齐( Frank Ramsey) 和德·菲耐蒂( Brunode Finetti) 把某人在就特定事件打赌时所愿意付出的赌注跟那局赌博的赌注总额的比率即赌商( betting quotient) 视作这个人对于该事件的置信度,以此为出发点推导出: 一个人的置信度是合理的,就必须满足标准的数学概率论公理。
在贝叶斯主义的框架内,由于假定了确证函项是一个概率函项,所以全称的科学定律的确证其实面临着问题。
全称的科学定律会涉及潜在无限的对象集合,波普尔( Karl Popper) 就断言这样一个定律的验前概率为零。让我们用 u 来表示一个全称的科学定律。
因为 P( u) =0,所以通过贝叶斯定理来计算的验后概率 P( u︱e) = P( e︱u) P( u) / P( e) =0。由于贝叶斯确证理论是假定确证函项是满足标准的数学概率论公理的,亦即确证函项是一个概率函项,因此在这里就是 C( u,e) = P( u︱e) ,也就是说,对贝叶斯主义者而言,对于任何证据 e,确证函项C( u,e) = 0。这意味着全称的科学定律总是确证度为零,而无论证据对其提供怎样的支持。波普尔认为这是很荒谬的,他说,贝叶斯主义者“不曾考虑到以下可能性: 我们可以从经验中越来越多地学到普遍定律,即便没有使它们的概率有所增加; 亦即我们可以越来越好地检验与确认( corrob-orate) 它们中的一部分从而增加其确认度,但并不改变其概率,而使概率值保持为零。”
因此,波普尔认为显而易见的是,在科学中随处可见的普遍定律是能够得到肯定性的确证的,因而他拒斥贝叶斯确证理论的假定“C( u,e) = P( u︱e) ”。
以上的论点主要取决于任何全称的科学定律u 的概率为零,即 P( u) = 0。这一论断是与概率解释密切相关的,波普尔当年提出这个论断的时候,他接受的是逻辑解释。根据逻辑解释,要使用贝叶斯方法,我们必须把验前的无知定量化。如此一来,“看起来似乎必然是这样,我们应把某个领域的所有可能的假说都列出来,并且在它们之间分配概率,也许应当运用无差别原则赋予每种假说同样的概率。可是,这样一张清单从什么地方开始呢? 也许可以充分地认为,在任何领域中可能的假说的数目都是无限的,而这将导致每个假说的概率为零,并且贝叶斯游戏无法开始。如果所有 理 论 都 具 有 零 概 率,那 么,波 普 尔 就 赢了。”
然而,后来已经有一些学者证明了可以给全称的科学定律赋予非零的逻辑概率。可是,我们也知道,概率的逻辑解释毕竟会导致无差别原则悖论。
“主观贝叶斯主义者论证说,无论把零概率赋予所有假说和理论的论证多么有力,实际情况都并非是: 一般人尤其是科学家会把零概率赋予得到了充分确证的理论。……按照他们的研究,科学家们把许多定律当作是理所当然的。天文学家在应用光的折射定律时以及那些从事空间项目的科学家们在运用牛顿定律时,都毫无疑虑,这证明他们赋予了那些定律即使不是等于 1、也是接近于1 的概率。”
然而,需要指出的是,即便实际的情况真的可能如此,但对于主观解释,在学理上,波普尔的论点也是有效的,因为概率是作为赌商被引入的。比如说,令 u = 所有渡鸦都是黑的,并假定张三被迫使就 u 是否为真进行打赌。张三永远也不能赢得打赌,因为“所有渡鸦都是黑的”
永远也不能得到确定无疑的认可。然而,只要有一只不是黑色的渡鸦碰巧被观察到,张三就会赌输。这样一来,对张三而言,唯一可以合理地接纳的赌商就是零,这其实也可以被看作是对这场赌局的一种拒绝。换句话说,基于大弃赌论证,如果张三采纳了任何非零的赌商,无论赌商是多么的小,那么他只会输钱,但永远也不能赢得分毫。这表明,在主观解释之下,如果我们引入赌商作为概率,那么,对于任何全称的科学定律 u,理论上我们必定会有 P( u) =0。既然对于任何全称的科学定律 u,P( u) = 0,所以波普尔的论证的余下部分显然还是可以被认可的。不过,这个论证也并不能完全反驳主观贝叶斯主义。我们可以把它看作是对主观贝叶斯主义的有效应用领域所附加的一个条件。也就是说,在所涉及的假说是单称陈述而非全称陈述的情况下,我们才能有效运用主观贝叶斯确证理论。
三、贝叶斯条件化与理论框架的确定性问题
根据贝叶斯确证理论的第二个假定,概率的更新是通过贝叶斯条件化进行的。对贝叶斯主义者而言,初始概率只能依照贝叶斯条件化作出改变,因而某个理论框架在此已是被隐含地接受了的,因为贝叶斯主义者难免要把他们最初的概率建基于某个理论框架之上。只要这个理论框架成立,贝叶斯主义者的计算会给出合理的结果,但是如果该理论框架在一个特定的事例中不再成立的话,那么同类型的计算就会给出完全不恰当的结果。因此,英国哲学家吉利斯( Donald Gillies) 指出,贝叶斯主义可以被有效地运用,仅当我们是在这样一种情况下,即存在着一个确定并已知的理论框架,我们可以合理地设想这一框架在研究的过程中是不会改变的。
为了说明这一点,吉利斯对经典统计学家奈曼 ( Jerzy Neyman ) 的 一 项 研 究 进 行 了 考察。
这是奈曼对幼虫在试验田的样方中的分布的研究,随着研究的深入,之后的统计检验的结果使他放弃了最初的假定并提出了一个更好的模型,而这个模型是基于一个不同的假定的。
吉利斯认为,在贝叶斯主义的框架内是很难产生这种推理模式的,其获得成果的关键在于运用了经典统计学所使用的检验方法论。奈曼的研究的具体情况如下。
害虫防治的问题导致了关于幼虫在小样方中的分布的研究。一片种植了某类作物的试验田被分成了若干块小样方,然后点算在每块样方中所发现的所有幼虫。各个样方中的幼虫数量自然是有相当大的变化的。奈曼想找出一个数学模型来说明这种变化。他想到的第一个模型是泊松分布,其参数 λ 具有某个数值。这大致相当于假定幼虫在整片田里是随机分布的。这看起来是一个非常似真的假说,而奈曼本人也明确地表示这是由他的直觉所强烈暗示的。其实奈曼之前也曾经在涉及细菌在培养皿中的分布这个十分类似的问题上使用过相同的假说,并且取得了相当大的成功。尽管如此,奈曼还是遵循经典统计学方法论的做法,将当前这个关于泊松分布的假说诉诸一连串检验。奈曼实施了卡方检验,一共做了五次试验,只有一次检验结果是确证该假说的。依照这些结果,这个关于泊松分布的假说无疑是不正确的。毫无疑问,幼虫的实际分布现象与数学模型所假定的机制之间似乎存在着非常大的差异。
在奈曼试图找出一个更好的新假说去描述幼虫的分布的过程中,他运用了从该领域的专家贝尔博士( Geoffrey Beall) 那里获得的关于幼虫的背景知识。这促使他设想幼虫会在衣蛾产卵的地点周围成堆地分布。衣蛾产卵的地点会服从泊松分布,而幼虫本身则不然。奈曼想出了一个针对这种情况的数学模型,从而得出的结论是,幼虫的分布情况是服从他所提出的“A 型分布”的。接下来,奈曼像之前那样使用相同的数据再次进行了五次卡方检验,所有的检验都确证了假说。显然,奈曼的成功表明了经典统计学的优点。奈曼本人指出,在这个事例中,为了使被观察到的频率与所预测的频率相一致,对数学模型作出调整是极其重要的。此外,奈曼对自己新提出的 A 型分布绝非是自以为是的,他认为 A 型分布像泊松分布一样也是有其局限性的。事实上,他表示,有些生物( 比如说介壳虫) 在其栖息地上单位区域的分布并不服从 A 型分布。一项研究揭示了支配这些生物的分布的变化过程是比所描述的要复杂得多的,因此,如果期望对此能有一种统计学上的处理方式,那么必然要付出新的努力去构造一个合适的数学模型。
吉利斯不认为贝叶斯派统计学家能像经典统计学家奈曼那样成功地实施这项研究。他的分析,贝叶斯主义者会以同样的方式开始研究,亦即提出一组可能的假说 Hλ,其中 0 < λ < ∞。在此,Hλ 正是具有参数 λ 的泊松分布。接下来的步骤就是设定一个验前概率分布 p( λ) ,用以表征贝叶斯派统计学家对于各个假说的验前概率。p( λ) 会根据证据 e 转变为验后分布 p( λ︱e) 。然而,我们难以看出所有这些借助贝叶斯条件化的概率转变是如何能催生出问题的解决方案即 A 型分布的。贝叶斯主义的运作机制所能做到的似乎仅仅是改变统计学家对于 λ 的特定取值的概率。这也恰恰说明了贝叶斯主义有赖于理论框架的确定性。在研究的开始阶段,理论框架是关于泊松分布的假定。如果这个框架是恰当的,就像关于培养皿中的细菌的例子那样,那么贝叶斯主义可以令人满意地处理这个问题。然而,这个理论框架对于田地里的幼虫的例子是不恰当的。理论框架不得不由关于泊松分布的假定转变为关于 A 型分布的假定,因而贝叶斯条件化的步骤不能应对这样的一种信念转变。对此,贝叶斯主义者可以提出反驳,说最初的一组可能假说就应该把泊松分布和 A 型分布都包括在内。如果能这样做的话,贝叶斯条件化就能很好地处理这个问题。然而,这个建议的困难在于,正如前面已经指出的,奈曼只是在关于泊松分布的假定遭受一连串卡方检验的反驳之后才思考其 A 型分布的。在研究的开始阶段,奈曼肯定是没有把 A 型分布的可能性考虑在内的。事实上,A 型分布就不曾出现在奈曼开展研究之前的概率论和统计学的文献中。若坚持要为贝叶斯主义辩解,也许还可以说,在研究开始时,对问题进行恰当的分析有机会在这个阶段就能引入 A 型分布。吉利斯相当怀疑这种可能性究竟能有多大,他让我们可以这样来设想一下。相应于这种进路的方法论,对贝叶斯派统计学家来说,就是在一开始就对问题作冗长的分析、咨询相关领域的专家以及引入所有可能有关的各种各样的分布。尽管贝尔博士的看法催生了 A 型分布,但由于专家的意见往往会不尽一致,所以其他专家的看法也许会催生其他可能的分布,比如说 B型分布、C 型分布、D 型分布等等。此外,除了 A型分布,其他分布有时候对于这类问题而言是必要的,就像奈曼关于介壳虫的分布的讨论所表明的那样。接下来,贝叶斯主义者就可以确定他对于所有这些假说的验前概率的分布,然后以此开展进一步的研究。然而这样一种进路经常被证明是完全浪费时间的。因为贝叶斯主义取决于理论框架的确定性,所以贝叶斯派统计学家面临着一个困境。要么他们必须在研究的最开始阶段就考虑一整系列可能的假说,要么他们必须承担风险,有可能永远得不出那个构成问题解决方法的假说。他们的困境正是来自于贝叶斯主义的本质,即信念的转变只限于通过贝叶斯条件化来完成。
对此,吉利斯指出,仅仅借助贝叶斯条件化来对验前概率函项作出改变的方案是太保守了,为了取得进步,在必要的时候,对验前概率函项作出比之前所设想的要剧烈得多的改变也是可取的。
诚然,吉利斯对贝叶斯进路的这一批评是合情合理的。“只承认一种改变信念的方式即贝叶斯条件化,这等于否认任何信念系统的整体改变,而这种整体性改变无论对于科学家还是普通人是时常发生的,科学进步和个人进步往往是在这种剧烈的信念改变中取得的。”
总之,要想恰当地运用贝叶斯主义,就要确保在依据证据作出概率转变的过程中所假定的理论框架是不变的。否则,不管在什么阶段,只要这个框架发生了变化,都会使得概率不是根据贝叶斯定理和贝叶斯条件化来转变的。
但这也可被视为贝叶斯主义在假说确证方面的局限。
参考文献:
[1]陈晓平. 贝叶斯方法与科学合理性[M]. 北京: 人民出版社,2010.
[2]张大松. 科学确证的逻辑与方法论[M]. 武汉: 武汉出版社,1999.
[3]Popper,K. R. ( 1959) ,The Logic of Scientific Discovery[M]. Routledge,2002.
[4][英]查尔默斯. 科学究竟是什么[M]. 鲁旭东译. 北京:商务印书馆,2011.