作者:尚权律所 时间:2022-08-02
编者按
裸统计证据发挥证明作用的方式,是将某个具体的个人或事件归入一类人或一类事件,然后指出该类人或事件在整体上具有某个盖然性特征,从而证明这个具体个人或事件具有该特征或做出了某个行为。裸统计证据可以证明一个极高的概率值。如果将司法证明的盖然性理解为帕斯卡模式意义上的概率性,那么裸统计证据能够满足法定的证明要求。然而,建立在帕斯卡概率基础上的概率命题观点和部分信念观点,无法解释和解决裸统计证据的推理悖论。绝对信念观点则认为,仅根据裸统计证据,一位理性的事实认定者无法形成对于案件事实的合理信念。绝对信念观点以培根概率模式解释司法证明的盖然性,认为信念必须建立在有“分量”的证据基础上。于是,裸统计证据尽管指示了极高的概率值,但是缺乏证据的应有分量。只有“个别化”的证据才能“涵盖”作为具体事件的案件事实,裸统计证据和待证事实之间存在巨大的“信息空隙”,远未达到法定的证明要求。裸统计证据不仅自身无法满足充分性要求,它还可能引发证据推理合法性欠缺、不公正的偏见、概率计算错误、证据信息的不平等利用等问题。因此,证据立法或司法实践需要谨慎对待裸统计证据的采纳与排除。
裸统计证据及其推理悖论
所谓“裸统计” (naked statistics)证据,是指以下述方式发挥证明作用的证据:将某个具体的个人或事件,归入一类人或一类事件,然后指出该类人或事件在整体上具有某个盖然性特征,或者说具有某种行为倾向性,从而证明这个具体个人或事件具有这个特征或做出了某个行为。简言之,用关于一个集合的统计数据和概率分布,来证明该集合中的某个个体的情况。例如,裸统计证据在以下虚构的场景中,就使用了典型的裸统计证据:
【例1】院中囚犯悖论。院中囚犯悖论是关于一个容纳了1000名犯人的矫正机构。在那里,999名犯人进行了一场暴动,其间还杀害了数个惩教人员。剩下的一名犯人靠墙站着,没有参与暴乱。但是无法辨识这名犯人是谁,所以每个被指控参与暴乱的犯人都会宣称自己就是这个人。随后,所有的1000名犯人都被指控谋杀警员。因此,针对每个人的指控成立的概率都等于0.999。这一概率是否跨越了‘排除一切合理怀疑标准’所设定的定罪门槛?表面上看,它是0.999的概率是极其高的,因此应当满足了刑事案件证明标准。
【例2】红绿出租车悖论。史密斯女士深夜开车回家。一辆出租车朝她驶来,该车失控从路的一边穿行到另一边。她不得不转向以避开它……在那场车祸中,她被撞断了两条腿。史密斯女士因此起诉红色出租车公司……镇上只有两家出租车公司,红色出租车公司(它所有的车都是红色的)和绿色出租车公司(它所有的车都是绿色的)。镇上的出租车,6/10是由红色出租车公司运营的。(史密斯女士没有看到撞她的出租车的颜色。)如果我们相信史密斯女士的叙述,而且知道该案中没有发现进一步的事实,那么我们会认为有0.6的可能性,她的事故是由红色出租车公司运营的车辆导致的……史密斯女士赢得她对红色出租车公司的诉讼是正当的吗?
在上述两个场景中,相关的统计数字(0.999或0.6)被作为证据使用。它们实际上是关于一个集合(被关押的囚犯,或镇上的出租车)中的概率分布情况的数据,但用于证明一个个体(某一个被指控的犯人,或撞了原告的车辆)的情况,即:这名被指控的犯人,有99.9%的可能性参与了暴动;撞了原告的车辆,有60%的可能性属于红色出租车公司。这是典型的裸统计证据。这两个场景中的推理之所以被视作“悖论”,是因为:一方面,按照某种解释,证明标准是一个盖然性标准,等同于一个概率阈值(例如“排除合理怀疑”标准即高于97%的可能性,“优势证据标准”即高于50%的可能性)。使用前述统计数字显然满足了法定的概率阈值,因此裁判者应当按照控方或原告的请求,认可所主张的事实。而另一方面,如果裁判者根据该统计数字支持控方或原告的请求,就会得出以下违反直觉的结果:必然有一名犯人被错误地定罪了,他被定罪不是因为他做了什么,仅仅是因为他属于某个群体!红色出租车公司可能错误地承担了责任,它承担责任不是因为自己的司机和车辆有什么问题,而仅仅是因为它比另一家公司拥有更多的车辆!这样的裁决结果是违反直觉的。
上述虚构的场景例示了何为裸统计证据,显示了其推理中的悖论性紧张关系。这两个案例是虚构的,但不代表其揭示的问题是虚构的。实际上,裸统计性质的证据在司法实践中经常出现,上述推理悖论潜在于一些我们习以为常的证据类型之中。科学证据经常要以概率的形式出现在法庭上。例如,一份DNA鉴定意见向法庭表明了以下信息:随机从某个人群中挑选出的个体,匹配被检测的DNA分型的概率为1/325000;本案被告人匹配该DNA分型。如果将该信息中的概率,经过一定的数学运作而转化为一个证明被告人有罪的概率,就是在使用裸统计证据推理。在大数据时代,关于特定人群的统计数据,或者关于某个人过往行为的统计数据,在法庭可能作为证据使用,因此很容易走向裸统计证据推理的路径。除了科学证据、统计学证据之外,品格证据在本质上也属于裸统计证据。品格证据以下述方式发挥证明作用:某个人具有某种品性或倾向;具有某种品性或倾向的人,很可能做出相应的行为;在本案中,这个人很可能做出了相应的行为。这是将一个人(例如本案的被告人、被害人或证人)归属到一个群体(例如有暴力倾向的人、有某种性癖好的人、喜欢撒谎的人)中,然后用这个群体的整体行为倾向特征,来论证这个人具体做了某个行为。这种推理方式符合裸统计证据,只不过它并不以精确的数字表达其盖然性而已。
本文探讨裸统计证据及其推理问题。一方面,既然裸统计证据的推理方式在司法实践中经常出现,尽管可能是以隐蔽的方式,那么我们对其推理中的可能悖论就不能视而不见。研究这种证据推理可能为司法实践提供一些直接的指引。另一方面,或许更为重要的是,以这种类型的证据和推理为切入视角,可以反思司法证明的性质:如何理解司法证明的盖然性?以何种概率理论表达这种盖然性?相应的,如何解释证明标准的盖然属性?本文第二部分讨论裸统计证据与证明的充分性,分析为何裸统计证据即使其概率值非常高,也无法单独构成充分的证明,因此达不到法定证明标准的要求。这当然涉及对适用于司法证明场景的概率理论的理解,也涉及对证明标准之性质的解释。第三部分讨论裸统计证据的采纳与排除(可采性问题),包括相关性检验、排除理由等。第四部分给出一个简短的分析结论。
裸统计证据与证明的充分性
(一)概率命题与事实命题
为了理解上述裸统计证据推理中的悖论,以及解决该悖论,我们需要从界定司法裁判中事实认定的盖然性质着手。在司法审判中,最终作出的事实认定,可分成两类:一类是包含着对某个命题之断言的事实认定(认定待证事实成立/得到完全证明,或认定待证事实不成立/完全未被证明),另一类并不包含对某个命题的断言(即在“真伪不明”“疑案”状态下做出认定)。后者是适用客观证明责任的裁判。这种裁判实际上属于“法律问题”,而非“事实问题”性质。以下仅讨论第一类事实认定。
一个广泛的共识是:司法证明过程所产生的事实认定结论,具有盖然性(或称概率性),即司法裁判无法保证完全符合客观真相,总是存在一定的错误风险。但是,这种概率性究竟体现在何处?对此,有两种解释:
第一,一项事实认定,断言了一个“概率命题”,即:裁判者相信“某个事实主张为真的可能性高于法定的概率阈值(即证明标准)”。用p表示待证事实,用s表示证明标准,就可以表示为:裁判者相信“p的概率是x”,且x高于s。
第二,一项事实认定,断言了一个“事实命题”,即:裁判者在足够高(即高于证明标准)的水平上相信“某个事实主张为真”。可以表示为:裁判者在x程度上相信p,且x高于s。
以上哪种解释是对事实认定之盖然性的正确理解?我们可对比以下两个案例。
【例3】在某传染病疫情大暴发期间,被告人甲不服从监管规定,在明知自己为感染者的情况下,隐瞒信息擅自与他人接触,从而造成所居住的社区内多人感染。该国公诉机关对甲提起了刑事诉讼,社区内感染的居民对甲提起了民事诉讼。甲的传播行为与居民感染的结果之间是否存在因果关系,在刑事诉讼和民事诉讼中都被作为一项待证要件事实。鉴于该传染病的“接触-感染”存在一定几率,且该居住区临近区域存在其他传播源,因此法庭结合了多位流行病学专家提供的专业意见和官方提供的流行病学调查资料,认定前述因果关系。法庭最终认为:该因果关系存在与否有一定盖然性,尚未达到刑事诉讼的“排除合理怀疑”证明标准,但已经达到了民事诉讼的“优势证据”标准。因此驳回了刑事公诉方的定罪请求,支持了民事原告方的侵权赔偿请求。对于该案中的事实认定,以下哪种表述更恰当?①法庭需要就“甲的行为很可能造成了居民感染”这一盖然性形成内心信念;此盖然性需要高于法定标准。在本案中,已高于优势证据标准,但低于排除合理怀疑标准。②法庭需要就“甲的行为确实造成了居民感染”这一事实形成内心信念;该信念需要高于法定标准。在本案中,已高于优势证据标准,但低于排除合理怀疑标准。
【例4】在某传染病疫情大暴发期间,被告人甲不服从监管规定,在明知自己为感染者的情况下,隐瞒信息擅自与社区内其他居民接触。政府监管部门及时获知了情况,迅速将甲隔离。目前社区内居民暂未出现感染症状,检测都为阴性。但是可能存在潜在的感染者,后续检测有阴转阳风险。如果对该社区进行封闭管理,会造成较大管理成本和居民生活、工作不便;如果不对该社区进行封闭管理,可能导致社区内疫情暴发,进而疫情扩散到该社区之外。根据多位流行病学专家提供的专业意见和该国政府掌握的相关流行病学调查资料,监管部门的决策者认为,甲的行为引发该社区内疫情传播的概率超过了70%。遂决定对该社区进行封闭管理。在上述情景中,关于监管部门的决策依据,以下哪种表述更恰当?①决策者认为,甲的行为很可能会造成社区疫情暴发。②决策者高度相信,甲的行为造成了社区疫情暴发。
这两个案例是两个不同的场景,一个是司法审判的场景,一个是行政管理与决策的场景。在这两个案例中,第①种描述采用了上述“概率命题”的观点,第②种描述采用了上述“事实命题”的观点。比较这两个场景,不难发现:对于例3的司法审判场景来说,应当采用第②种描述,认为其认定的内容是一项事实命题,只不过裁判者对该命题的信念有强弱之别;而对于例4的行政决策场景来说,应当采用第①种描述,即决策者的根据,本来就是一个概率性质的命题。两个场景的主要区别在于,司法审判是对一项过去已经发生过的事实进行认定,该事实要么已经真实发生过,要么并没有发生,不可能呈现为一个频率;当对该事实进行认定之后,才能基于对事实的断言,而将某种法律责任施加给当事人。行政决策的场景则是对目前及今后可能出现的情况进行预测,然后根据预测采取措施;这种预测经常是概率性质的,即某事件将会发生的概率有多大。因此,在司法审判的回溯性事实认定场景中,我们可以说:裁判者做出的一项事实认定,断言了一个“事实命题”,即:裁判者在足够高的水平上相信“某个事实主张为真”。
(二)部分信念与绝对信念
如果将事实认定的内容理解为“事实命题”而非“概率命题”,那么其盖然性就只能体现在对“相信”(believe)或“信念”(belief)的界定上:裁判者只需要在足够高的程度上(而非绝对确定地)相信待证事实(或表达为:持有对待证事实的信念)。“足够高的程度”即法定的盖然性要求。对此,又有两种不同的理解:
第一,部分信念(partial belief)理论认为,一个人对某事的相信状态(即对此事的信念),其程度从完全不相信(0%)到完全相信(100%)渐变;法定的证明标准,是对相信之程度的要求。根据部分信念理论,说“裁判者在x程度上相信p”,等同于说“裁判者在(1-x)的程度上不相信p”或“裁判者在(1-x)的程度上相信非p”。当一个人对外做出一个断言时,除非该断言所包含的信念是100%,否则这个人就是承认自己并非真正“知道”所断言之事,而只是在某种程度上“猜想”此事。
第二,绝对信念(categorical belief)理论认为,一个人对某事的信念状态有三种:相信某个事情为真,或者说持有对此事的信念(belief);相信某个事情为假,或者说持有对此事为假的信念(dis-belief);既不相信某事为真,也不相信某事为假,或者说未持有信念、“搁置”了信念(non-belief)。当一个人相信了某个事情后(即已经持有了对此事的信念),才能进一步评估该信念的强度。法定的证明标准,应视作对该强度的要求。根据绝对信念理论,“裁判者在x程度上相信p”,既不等于“裁判者在 (1-x) 的程度上不相信p”,也不等于“裁判者在(1-x)的程度上相信非p”。因为,相信p、相信非p、无信念是三种在“质”上不同的状态,不能在“量”上互相换算。对于一个人而言,同时绝对地“相信p”和绝对地“相信非p”是不理性的。根据绝对信念理论,只有当一个人认为自己“知道”某事,即断定此事成立、所有竞争性假设都不成立,他/她才能断言此事。
上述部分信念的观点,与前述概率命题的观点,尽管对于事实认定盖然性之“性质”的解释不同,但是关于如何“计量”盖然性,如出一辙。概率命题观点认为,司法审判所得出的事实认定结论为:裁判者相信“p的概率是x”;部分信念理论认为,司法审判所得出的事实认定结论为:裁判者在x程度上相信p。它们都认为x是一个在0至100%之间取值的数字。如果它们对于一场具体的审判活动所得出的事实认定结论之盖然性评估一致,那么两个x的数值就应该相等——尽管两个x的性质不同,一个表示事件的概率(概率命题观点),一个表示信念的强度(事实命题观点)。如果以这种方式计量盖然性,必然会将法定的证明标准解释为一个概率阈值。例如,认为排除合理怀疑标准意味着高于97%的可能性,高度盖然性标准意味着高于75%的可能性,优势证据标准意味着高于50%的可能性,等等。若此,裸统计证据可以独立地满足证明要求。因为,裸统计证据可以证实一个极高的概率值(即x的值),超越证明标准所表示的阈值。可见,采取部分信念观点,就像采取概率命题观点一样,最终不可能解决裸统计证据的悖论。如果我们认真对待裸统计证据推理所导致的直觉式悖论,并且为此探索一个理论上融贯的解释,就不得不转向绝对信念观点。
根据绝对信念理论,裁判者对于待证事实p的信念状态分为三种:相信p,相信非p,无信念。它们不能在数量上通约,是三种在质上有别的状态。如果裁判者已经处在“相信p”的信念状态中,我们才可以进一步去衡量这种信念的强度。那么,符合什么条件时,我们可以说裁判者已经“相信p”或“形成了对p的(绝对)信念”?沙克尔(Shackle)和普赖斯(Price)等人的理论提供了一种解释:当一个人判断p是完全可能的,并且它的矛盾命题都不是完全可能的,他才绝对地相信p。进一步解释如下。
1.待证事实与竞争性假设
用p表示案件中的待证事实。裁判者最终选择相信p,也就是舍弃了“非p”这一选项。所谓“非p”,实际上是一个集合,包括了所有与p相冲突的事实版本,即所谓竞争性假设、矛盾命题。这些竞争性假设,表示为pq,pr,ps等。简言之,裁判者判断是否相信p,就是要在p和{pq,pr,ps}之间进行选择。pq,pr,ps等竞争性假设,以或清晰或模糊或具体或笼统的方式出现在裁判者的头脑中,裁判者对比它们来评估待证事实p的盖然性。
2.可能性与完全可能性
待证事实与竞争性假设各自的盖然性高低,通常不能用精确的数字来表达,而需要使用自然语言来表达。沙克尔等学者以“可能性”(possibility)概念指称这种盖然性,又用“潜在意外感”(potential surprise)来度量可能性的高低。“潜在意外感”是指:如果假设的事情确实发生了,我们应当感受到的意外感。根据沙克尔等人的绝对信念理论,如果裁判者想对某事(待证事实或某个竞争性假设)形成信念,必须认为此事具有“完全可能性”(perfect possibility)。“完全可能性”即“潜在意外感”为零,指这样一种状态:“假设一个人的知识和理解保持不变。如果他认为,某件假定之事的发生不会使他感到哪怕最轻微的意外,那我们可以说,对他而言,那件事是完全可能的。”也可以这样来描述:“一个假说的完全可能性是指,对于‘它成为现实或者属实’这一结果,缺乏任何可识别的实际阻碍。”比“完全可能性”更低的可能性,即相应的“潜在意外感”不为零的情况,例如,若此事确实发生了,会有“轻微的”“适中的”或“相当大的”意外感。潜在意外感越大,可能性越低。
3.形成绝对信念的条件
竞争性假设与待证事实是互相排斥的。绝对信念理论的倡导者认为,竞争性假设与待证事实的互斥关系意味着,一个理性的人不可能同时对待证事实与某个竞争性假设形成绝对信念。这一关系包含在绝对信念的条件中:“要判断并最终绝对地相信p事实上为真,仅仅‘判断p具有完全可能性’是不足够的。当两个相竞争的假设都完全可能时,一个理性之人是不会相信其中的任何一个事实上为真的……要相信p,我们不仅必须要认为p是完全可能的,我们还必须要认为它的反例中没有一个是完全可能的。”简言之,对待证事实p形成绝对信念的条件是:裁判者判断p是完全可能的,并且所有竞争性假设中的任何一个,都不是完全可能的。
如果我们采取上述绝对信念理论,能否解决裸统计证据推理的悖论呢?我们回到前文的院中囚犯案例和红绿出租车案例。在院中囚犯案例中,选定任何一个囚犯,他可能参与了暴乱的概率等于0.999。这一概率计算本身并无问题。但一个理性的裁判者,可以据此形成一项绝对信念吗?此时待证事实为:他参与了暴乱(即他是参与暴乱的999名囚犯之一)。竞争性假设为:他没有参与暴乱(即他是站在墙边,没有参与暴乱的那个犯人)。根据上述绝对信念的条件,裁判者必须认为:该待证事实是完全可能的,并且竞争性假设不是完全可能的;完全可能意味着潜在意外感为零,即“假定之事的发生不会使他感到哪怕最轻微的意外”。我们很容易判断,对于“他参与了暴乱”这一待证事实,理性裁判者会认为是完全可能的;因为,假如他确实属于参与暴乱的那999名囚犯之一,这丝毫不令人意外。对于“他没有参与暴乱”这个竞争性假设,可能会存在不同的意见。或许会有裁判者认为,鉴于这一竞争性假设的概率值很低,它达不到完全可能的程度。但是,在这个假设的情景中,所有犯人都是非个别化的、无差别的,没有证据可以将他们彼此区分。唯一的指控证据(可能是一个像素极低的摄像头)仅仅证明了一个统计概率,即在这一千个人中有一人未参与暴乱。任何一名被指控的犯人,都同等地可能是那名未参与暴乱者;而且,必定有一名犯人,确实是未参与暴乱者。因此,假如任何一名犯人,最后被证实正是那位站在墙边且没有参与暴乱的人,这并不会让我们感到意外——哪怕是丝毫的意外。另言之,在这个情景中,任何一名非个别化的犯人,实际上是那位无罪之人,这是完全可能的。既然该竞争性假设也是完全可能的,那么按照前述绝对信念条件,理性的裁判者无法对待证事实形成绝对信念。仅仅依据这一裸统计证据,不应作出有罪判决。同样的道理,在红绿出租车案例中,待证事实为肇事车辆为红色出租车;竞争性假设为肇事车辆为绿色出租车。统计学知识告诉我们,前者的概率为60%,后者的概率为40%。一位理性的裁判者会认为,不管肇事车辆属于红色出租车公司还是绿色出租车公司,都是完全可能的;因为,假如肇事车辆真的是红色出租车,或者绿色出租车,并不会让人感觉意外。对于本案中的待证事实,仅依据裸统计证据,是无法形成绝对信念的。
(三)帕斯卡概率与培根概率
绝对信念理论很容易让人产生以下误解:形成绝对信念的条件非常苛刻,在实际案件中通常很难满足;绝对信念一旦形成,该信念的强度(或称盖然性)必定非常高,甚至绝对信念不存在强弱之别。实际上,绝对信念的形成并不像它的表面词义所显示的那么苛刻,而且绝对信念当然有强弱之别。只不过,衡量绝对信念之强弱的概率论工具,不是帕斯卡式概率,而是培根式概率。
帕斯卡概率和培根概率是两种迥然有别的概率推理模式。帕斯卡概率即我们通常理解的概率计算方式,它遵循特定的计算规则,例如互补规则、乘积规则、析取规则等。前述概率命题观点与部分信念观点,都采用了帕斯卡概率模式来计算和表达司法证明的盖然性。绝对信念观点无法与帕斯卡概率兼容,它需要使用培根概率来表达自身的强度变量。对此,具体解释如下:
第一,培根概率并不计量一个事件发生的概率,而是通过衡量“决策者所持有的证据的信息充分性”(informative),来说明决策者就待决事项所形成的信念之强度。在培根概率推理框架下,信念的强度取决于该信念所得到的“证据支持”(evidence support),或者说“证据分量”(evidence weight)。证据支持/分量越大,则该信念的强度越高,或者说该信念的“韧性”(resiliency)和“恒定性”(invariance)越强。
第二,如何才能提高证据的分量,从而提高信念的强度?培根概率并不为此提供一个数量化的计算法则,而是指出:这取决于证据对作为具体事件的案件事实的“涵盖”(cover)程度,或者说“证据的实然状态与它的应然状态之间的距离”。应然状态即碎片化的证据组合在一起,最终恰好覆盖了事件的所有具体情节,既不多也不少。但现实的情况是,证据与待证明的具体事件之间总是存在或大或小的信息空隙(informational voids)。信息空隙越小,即证据与其应然状态的距离越小,证据的分量越大。按照这种观点,法定的证明标准,不管是排除合理怀疑标准还是优势证据标准,都不能被视作一个概率阈值,而应当被解释为关于证据分量或证据支持度的指示。
第三,按照上述解释,能提高证据分量从而提高信念强度的证据,应当是“个别化的”(individualized)、“具体个案性质的”(case-specific),即能够证明动机、时间、地点、行为、心理状态等具体事件信息(而非该事件所属之集合的概率分布)的证据。个别化证据恰恰是裸统计证据的反义词。裸统计证据以下述方式发挥证明作用:某个个体a属于一个集合A;集合A具有某种概率分布特征,因此A中的个体具有某种倾向性;a具有这种倾向性,因此可能做出了这种倾向性所指明的行为。对于具体的个体a而言,裸统计证据无法证明其行为细节,它并不包含a受指控的事件之具体信息。个别化证据则具体说明了该事件的具体信息。例如,在前述院中囚犯案例中,关于参与暴乱的犯人比例的数据是裸统计证据;可以证明某一个受指控的犯人之参与动机、肢体动作、身体上的痕迹等信息的证据,属于个别化证据。裸统计证据并不能提高所有证据对具体案件事件的“涵盖”(cover)程度,因此它不能提高证据的分量。
综上所述,根据关于司法证明的绝对信念理论,仅仅基于裸统计证据,一位理性的事实认定者无法形成对于案件事实的信念。即使退一步承认可以形成信念,但是该信念的强度取决于证据的分量。裸统计证据尽管可以证明一个极高的概率值,却缺乏任何分量。仅仅基于这样的证据所形成的信念,是极其脆弱的,缺乏应有的强度、“韧性”或“恒定性”,不可能满足法定证明标准的要求——如果我们把证明标准理解为关于证据分量的标准,而不是关于帕斯卡概率值的标准的话。
裸统计证据的采纳与排除
上文分析了裸统计证据的充分性问题,即当一个案件中仅有裸统计证据,且该证据证明了一个很高的概率值的时候,能否满足证据的充分性要求。下文将分析裸统计证据的可采性问题。当裸统计证据并非案中的唯一证据时,裁判者不需要单独评估裸统计证据能否构成充分的证明,但是仍要解决裸统计证据自身的采纳与排除问题。
(一)对裸统计证据的相关性检验
相关性是可采性的第一道门槛,因此有必要首先分析裸统计证据与案件事实的相关性。本文采用贝叶斯定理的方式表示相关性。
对贝叶斯定理公式可以采用多种书写方式,例如:P(A&B)=P(A│B)·P(B);或者,P(A│B)=[P(B│A)/P(B)]·P(A)。在司法证明的语境中,为了分析的方便,我们用G代表被告有罪(或者说,被告实际上应负有法律责任),用E代表所分析的证据。而且将概率(probability,表示为P)换为几率(odds,表示为O)。经过一系列换算,就得出贝叶斯定理的以下书写方式:O(G│E)=[P(E│G)/P(E│非G)]·O(G)。
O(G│E)代表在给定证据E的情况下,有罪的概率(后验概率);O(G)代表在不存在证据E的情况下有罪的概率,或者说,事实认定者在评价证据E之前,对有罪的概率的评估(先验概率)。P(E│G)代表在实际上有罪的案件中,存在证据E的概率;P(E│非G)代表在实际上无罪的案件中,存在证据E的概率。两者相除即P(E│G)/P(E│非G),这个比率被称为似然比(likelihood ratio)。贝叶斯定理的拥护者认为,如果事实认定者在评价证据的时候是理性的,那么上述算式就代表了一项证据对心证带来的影响。其中似然比这个变量,表示了证据的证明力情况。“只有符合以下条件时,证据在逻辑上才是相关的:在待证假设为真的情况下发现该证据的概率,不等于在待证假设为假的情况下发现该证据的概率。在刑事案件中,如果一个特定的证据,在被告人有罪时被发现的可能性,与在被告人无罪时被发现的可能性相等,那么这个证据与被告人是否有罪的问题,在逻辑上就是不相关的。”似然比是P(E│G)与P(E│非G)之间的除法运算,如果这两项相等,就意味着这个证据不会对理性的事实认定者关于G的心证带来任何影响。如果P(E│G)>P(E│非G),即似然比大于1,那么E对于G有正向的证明价值;如果P(E│G)<p(e│非g),即似然比小于1,那么e对g有反向的证明价值,或者说倾向于否定g、证明非g。< p="">
贝叶斯公式用更为清晰、精确的数学概率语言表述相关性。但是若抛开这些数学运算和概率式表达,最核心的检验相关性的问题就是:在被告事实上有罪的情况下和事实上无罪的情况下,该证据出现的概率相同吗?或者说,有罪的故事是否比无罪的故事,更能解释(或更不能解释)该证据的出现?
我们以上述贝叶斯定理的方式检验裸统计证据的相关性,以院中囚犯案例为例。我们可以把案中证据所包含的信息表述为:在这1000名犯人中,有999名参与了暴动。也可以采用较模糊的表达:这些犯人中的绝大多数都参与了暴动,或几乎所有的犯人都参与了暴动。选定任何一名囚犯作为被告人,我们都可假设两种情境:他实际上有罪,他实际上无罪。在这两种情境中,“几乎所有的犯人都参与了暴动”这一信息成立的可能性是否相等?很显然,“他实际上有罪”的情境,会为“几乎所有的犯人都参与了暴动”这一判断提供一个支持性的个例,“他实际上无罪”则会提供一个反例。在这两种情境下,这一证据信息成立的可能性有差别。这种差别,类似于我们在使用归纳法形成一个盖然性(而非确定性)判断的时候,当新发现的一个事例与之前的事例相同,与当新发现的事例与之前的事例相悖时,对于所形成的盖然性判断带来的不同影响。
(二)对裸统计证据的采纳与排除
综上所述,在贝叶斯定理的视角下,裸统计证据可以满足相关性检验。相关性是可采性的必要条件,但并不是充分条件。在真实的审判场景中,一概地允许裸统计证据进入庭审,会引发一些问题——这些问题为排除裸统计证据提供了理由。
第一,攻击性推理与不公正偏见。在真实的审判场景中,裸统计证据往往并非单纯的统计学数字,而是与当事人的某种社会属性有关,例如与当事人的民族、所属社团、性格等特征有关。此时,基于裸统计证据而作出推理,往往会引发合法性(legitimacy)危机。以品格证据为例:如果控方提交了关于被告人某种不良品性特征的证据(例如,关于有暴力倾向、有盗窃罪记录、有婚内出轨劣迹的证据),以证明在本案中被告人作出了与其品性一致的行为。这是一种裸统计性质的证据,因为该证据先是将被告人归属在一个集合(即具有某种品格的人)之中,然后以此类人具有某种行为上的倾向性,来证明这个具体的被告人作出了某个行为。如果法官采纳了控方的证据及其推理路径,就会有推理合法性的问题。正如有学者论述的:“假设律师在法庭上论证:因为被告是个坏人,是那种会做这种坏事的人,所以这件事肯定又是他干的。这种论证在道德上是错误的。我们认为,律师提出这种论证(可称为‘攻击性推理’),侮辱了被告人的人格。法官在对陪审团所说的话中或在其判决理由中,若公开地运用或认同攻击性推理,也同样是(或许更是)错误的。律师和法官在审判中的公开言论要受道德约束,这是应该的;而在上述例子中,他们所说的话具有道德攻击性(morally offensive)。”这样的推理方式,还否定了一个人的“道德自主性”(moral autonomy),其背后潜藏着一个类似于“一朝是贼,终身是贼”的假设。除此之外,放任品格证据的使用,还可能引发不公正的偏见,使裁判者(尤其是陪审员)高估此类证据的证明力,仅仅因为被告人是他们所厌恶的那类人,而更倾向于接受有罪的故事,以便实现惩罚被告人的目的。
第二,概率计算难题。即使裸统计证据不与当事人的社会属性关联,不存在前述推理合法性问题,采纳裸统计证据也会带来其他问题,即引发法庭上的概率计算错误。一个非常典型的案例是引发“新证据研究”热潮的柯林斯夫妇抢劫案。在本案中,控方聘请的专家证人经过一系列计算,给出了一个1/ 12000000的统计学概率值。控方据此得出结论,认为在本地区任何其他具有这些特征的夫妇,实施本案犯罪的概率仅为 1/12000000,因此柯林斯夫妇无罪的概率为1/12000000。柯林斯夫妇有罪的概率远远超过了排除合理怀疑的标准。陪审团退庭评议,经过了多轮表决,8个小时后得出全体一致的有罪判决。随后的上诉审程序以一审裁决受到概率计算错误的不当影响为由,推翻了一审裁决。该案的概率计算问题引起了学界研究兴趣。有研究者给出了另一种计算方法:如果该地区(国家)人口总数为a,那么估计有(1/12000000)·a的人具有本案证据所指明的那些特征。因此,被告人是真正的攻击者的概率是:1/[(1/12000000)·a]。若a = 34336000(当时加州的估测人口数量),则结果为 34.95%。该数值达不到排除合理怀疑的标准。但是这种计算方式仍然有诸多问题,例如,它错误地假定了在案发之时所有的当地居民都有作案机会。这两种计算方式得出了迥异的概率值,它们的算法正确性都存疑。由于第一种算法支持控方,被称作“检察官谬误”;第二种算法支持辩方,被称作“辩护律师谬误”。本案控方将目击证人的证言转变成了概率数值,以裸统计证据推理的方式证明案件事实。这最终给法庭上的事实认定者带来了困扰,做出了极富争议的事实认定结论。陪审员和法官通常并不具备专业的概率学知识,裸统计证据所伴随的概率计算方法给他们带来的困惑、误导,可能会超过这种证据本身具有的证明价值。
第三,对证据信息的平等利用。有学者提出了另一种反对裸统计证据的理由:裸统计证据违反了诉讼双方对证据信息的平等利用机会,不恰当地分配错误风险。任何一种合法的、个别化的证据,其包含的信息应当向诉讼双方敞开。不仅举证的一方可以用证据支持自己的事实主张,而且对方可以“反利用”该证据的信息,例如,通过质证说明证据的真实性存疑或举证方所使用的概括不成立,或者提出新的概括从而对该证据做出其他解释。但是,裸统计证据不具有这样的“反利用”特征。举证方提出裸统计证据,将一个关于集合的概括武断地适用到一个个体身上,该个体无法对这种证明进行反驳。最终,举证方将事实认定的错误风险不当地施加给对方。以品格证据为例:“建立这种联系的论证,对于某些情况是适用的,但不是适用于所有情况。因为,人们的行为有时与其品格一致,有时又不一致。因此,任何此类论证都不可避免具有不确定性。使它具有确定性是不可能的,因为没有办法检验以下假设:在审判所涉及的事件上,被告人的行为与其品格一致。可以找到表明被告人以这种方式行为的概括,但是这一涵盖的一致性只是多个可选项之一。更关键的是,它不会受到被告的个别化检测。不存在一种将该涵盖一致性与被告的具体个案相连接的可检验的方式。”因此,出于合理分配错误风险、确保诉讼双方平等利用证据信息的考虑,应谨慎地采纳裸统计证据。
综上所述,一方面,裸统计证据可以通过相关性检验,具有对案件事实的证明价值;另一方面,放任裸统计证据进入法庭,会带来证据推理合法性欠缺、不公正的偏见、概率计算错误、证据信息的不平等利用等问题。对于裸统计性质的证据,证据法需要恰当地规定采纳与排除之间的标准。在英美法系的证据立法中,对于品格这种裸统计证据,已有非常细致的规定。对于其他的裸统计证据,则留待司法实践中,法官自由裁量决定是否排除。
结论
本文通过两个虚构的案例,说明了裸统计证据的特点及其推理路径。这两个案例会引发直觉上的悖论,因此通常被称作“院中囚犯悖论”与“红绿出租车悖论”。这种悖论源自:裸统计证据可以证明一个极高的概率值;如果我们将司法证明的盖然性理解为帕斯卡模式意义上的概率性,那么裸统计证据总是能够满足法定的证明要求。建立在帕斯卡概率基础上的概率命题观点和部分信念观点,都无法解释和解决裸统计证据的推理悖论。绝对信念观点则认为,仅根据裸统计证据,一位理性的事实认定者无法形成对于案件事实的合理信念,更谈不上满足法定证明标准的要求。绝对信念观点以培根概率模式解释司法证明的盖然性,认为信念必须建立在有“分量”的证据基础上,信念的强度取决于证据支持度。裸统计证据尽管指示了极高的概率值,但是缺乏证据的应有分量。如果一个案件中仅有裸统计证据,缺少“具体个案性质”的证据,则无法“涵盖”作为具体事件的案件事实。裸统计证据和待证事实之间存在巨大的“信息空隙”,远未达到法定的证明要求。在绝对信念和培根概率框架下,证明标准不能被视作一个概率阈值,而应当被视作对于信念强度,同时也是对于支持该信念的证据之分量的指示。裸统计证据不仅自身无法满足充分性要求,而且其可采性亦有疑问。一方面,它可以通过相关性检验,具有对案件事实的证明价值;另一方面,它可能引发证据推理合法性欠缺、不公正的偏见、概率计算错误、证据信息的不平等利用等问题。证据立法或司法实践需要谨慎权衡这两个方面,在采纳与排除之间合理折中。本文并非法律教义学研究,因此不涉及对中国证据规则或域外立法的文本分析与解释。本文通过分析裸统计证据以及司法证明之推理过程的性质,以期为确立、解释相关的证据规则提供教义学体系之外的规范法理参考。
来源:《地方立法研究》2022年第3期
作者:樊传明,华东师范大学法学院副教授