作者:马德焕 时间:2020-11-11
贝叶斯定理,又被称为贝叶斯方法,是十八世纪英国学者托马斯·贝叶斯(Thomas Bayes)提出的计算条件概率的公式,即P(A,B)= P(B,A) P(A)/ P(B)。其中,P(A)表示先验概率,P(A,B)表示后验概率。比如在一个刑事案件中,我们基于现有份证据能够推断出一个基本的事实倾向,此为先验概率;当出现新的证据时我们会刷新事实判断的概率,此为后验概率。这一理论在诸多领域和专业中发挥着越来越重要的数据分析功能,如在我国的刑事司法领域,贝叶斯定理在DNA证据、酒精检测、足迹鉴定、声纹鉴定、流行病学研究等具备基础性统计数据的案件中起着不可替代的数据分析作用。本文拟对贝叶斯定理中的似然比(似然率)问题以及这一定理在具体案例实证的计算原理与方法进行初步的研究,以期能够理解这一理论在证明力评判中的具体应用。
(一)证据相关性与似然比理论的契合
《美国联邦证据规则》第401条对相关性的法律含义做了较为清晰的表述:即案件事实在某一项证据的情况下“更有可能”还是“更无可能”的判断就是证据相关性的判断。而这恰好与概率的定义具有一致性,概率是指某一事件在一定条件下发生之可能性大小的比率。我们可以用数学语言对此进行表述:假设P(T,E)表示考虑证据E存在的情况下假定的案件事实T发生的可能性,所以当P(T,E)> P(T)或P(T,E)< P(T)时,证据E是使得案件事实T更有可能或更没可能的情形。贝叶斯定理(Bayes’ Rule or Bayes’ Theorem)将上述问题以数学公式的形式进行了表达,试图量化计算,其数学公式为:P(T,E)= P(E,T) P(T)/ P(E)。有的学者将公式进行变形为如下形式:
其中P(⇁T)表示T事实为假的情形;等式由左至右依次代表:后验概率、似然比、先验概率,即后验概率=似然比×先验概率。假设在一个普通的盗窃案件中,检方控诉嫌疑人A的有罪证据中缺少指纹与脚印类证据,在搜集到这些证据之前,法官根据暂有的证据形成的有罪确信程度P(T)与无罪确信度P(⇁T)之比,即先验概率。当搜集到指纹证据或脚印类证据之后,法官再综合查明的前述证据得出新的确信度即为后验概率。在贝叶斯方法中,先验概率应由法官或者陪审团确定,在没有任何证据之前,对于控辩双方的主张即有罪与无罪的确信比值一般为“1”,然后根据法庭上出示的证据得到后验概率。这就是贝叶斯定理在证据评判理论上的应用过程。
理查德·伦伯特教授认为,贝叶斯定理中的似然比关于证据分量的表达与《联邦证据规则》第401条所定义的证据相关性是十分契合的。从相关性与证明力的关系角度来看,一项证据没有因排除规则而被依法采信时,理论上我们可以认为证据相关性越大,其证明力就越大。似然比数值的大小也同样表示了证明力大小的变化。我们可以将上述公式进行简单的变形:后验概率/先验概率=似然比。当先验概率为固定常数时,后验概率与似然比完全是成正比的,即便我们无法获得公式中每个具体数值,我们也能通过对案件事实的认定得出后验概率,当后验概率越大时,似然比的数值也越大,就意味着该证据的证明力较大。
有学者指出似然比本身就是一个取证领域,它表示先验概率发生了多大的变化,意味着先验概率的放大或缩小,基于相同的先验概率得出不同大小的后验概率时,似然比也代表着证据本身的证明力大小。这也是特文宁所说的,似然比表明了证据的不同分量(weight),它其实也表达了证据对于案件事实到底有多大的证明强度。学者波德尔斯(Broeders)提出似然比数值与证明力的大小是呈现正比对应的关系,其对二者之间的对应关系也进行了分级列表。具体分级对应关系详见下表:
根据上述分析,我们不难发现,贝叶斯定理的似然比方法能够将证据证明力与待证事实的强度联系起来,为证据评判提供理性的分析工具。在司法实践中,如足迹鉴定的似然比数值由鉴定专家出具,事实认定者能够依据似然比理论对案件证据有着更为精确的理解与把握。
(二)运用贝叶斯定理判断证明力的例证
尽管在中国的法庭审判实践中尚未出现大量的统计类证据的使用,但在DNA证据、流行病学研究、药物实验等的案件中,概率性的统计数据正越来越多地出现在法庭之上。贝叶斯定理在具备基础性统计数据的案例中发挥着重要的数据分析作用,比如下文所提到的酒精测试、足迹鉴定、DNA检测等类型案件的侦破均运用了贝叶斯定理,从而让裁决者对案件事实有更为清晰的认知。
1.证人辨认出租车的例证
在只有证人辨认的出租车交通侵权案件中,已知事故发生地所在城市的出租车有85%是蓝色,15%是黄色。某起案件中,一名证人作证说肇事出租车是黄色的,且该证人经过严格的视力准确度测试,测试结论显示这位证人辨认出租车的准确率为80%。此案在无其他证据且证人不存在伪证的情况下,是否应当判决原告胜诉?
根据贝叶斯定理,P(Y,W)= P(Y)* P(W,Y)/ P(W),其中:P(Y,W)表示证人作证说出租车是黄色的,而出租车确是黄色的概率,即后验概率;P(Y)表示出租车是黄色的概率,即15%;P(W,Y)表示证人证言的准确度,即80%;P(W)表示此案中证人作证的先验概率,作证说是黄色汽车确是黄色的概率与作证非黄色汽车确是非黄色的概率之和,即15%*80%+85%*20%=29%;后验概率=15%*80%/29%=41%。因此,原告举证并没有达到优势证据的标准(0.41<0.5),裁决者不应当判决原告胜诉。
上述的证人辨认出租车的案件,源自一场测试实验,测试的结果是参与者普遍认为事故中出租车颜色有80%的概率是黄色的,这也恰恰与证人证言可信度是一致的。然而,贝叶斯定理的计算结果恰恰显示了参与者的判断存在着重大错误。若单纯地根据该证言可信度的概率来判定原告胜诉,便是一项违背贝叶斯定理的错误判决。
2.酒精检测的例证
假设在醉酒驾驶案件中,为检测驾驶人的醉酒概率,首先已知此城市醉酒人数比例是5%,检测血液酒精浓度(BAC)的气相色谱法可靠性是99%,当受检测者张某的检测结果显示阳性时,其醉酒的概率是多少?
根据贝叶斯定理,P(Z,Y)= P(Z)* P(Y,Z)/ P(Y),其中,P(Z)表示醉酒的比例即5%;P(Y,Z)表示检测方法的可信度即99%,P(Y)表示检测为阳性的先验概率,即5%*99%+95%*1%=5.9%,P(Z,Y)表示受检测者检测呈阳性且其确实醉酒的可能性=5%*95%/5.9%=83.90%。
测试人员若根据酒精检测方法的准确度(99%)认定受检测者醉酒,在结果上并没有违背贝叶斯定理的结论(检测呈阳性且其确实醉酒的可能性83.90%)本身。但是若将此城市醉酒比例改为1/1000,运用贝叶斯定理计算的结果为1.10%(0.1%*99%+99.9%*1%=1.098%),此时酒精检测方法的准确度(99%)与运用贝叶斯定理计算出的检测呈阳性且其确实醉酒的可能性(1.10%)相差甚远,结论由此不同。
3.足迹鉴定的例证
贝叶斯定理还蕴含着对同一性的证明,比如对足迹的鉴定就是待检足迹与现场足迹是否同一的比对,音频鉴定就是待检声源与现场声源是否是同一声源的比对,这都是对同一性原理的应用。例如,一起入室盗窃案件中,警方在现场发现并提取了可疑足迹,由此锁定了嫌疑人且查获了嫌疑人的鞋子。接下来的工作就是要将嫌疑人鞋底足迹与现场足迹进行同一鉴定,判断两者之间是否具有同一性。值得注意的是,这里所说的同一性表示嫌疑人足迹与现场足迹(证据)之间是有具有相同来源,并非唯一来源。
贝叶斯定理的变形公式=×是用以证明同一性的重要工具,应用到司法实践中,用自然语言展开公式为:
在运用公式前,我们需要对一些术语进行解读。案例中的现场足迹在鉴定中作为检材,在公式中用E表示;样本是指能够留下现场足迹(即与嫌疑人鞋子尺码、大小、花纹等相同类型的)鞋子,用集合S表达;嫌疑人鞋子是要进行同一性鉴定的对象,属于一个样本,用S1表示。在上述足迹鉴定案件中,足迹鉴定专家得出似然比数值为1000,即在嫌疑人鞋子所留脚印条件下获得证据(现场足迹)的概率是非嫌疑人鞋子所留鞋印条件下(其他相同种类的鞋子所留鞋印条件)而获得现场足迹概率的1000倍。办案人员排查得出具备相同种类鞋子而又有作案机会的人共计30人,即样本共计30人。
因此,嫌疑人足迹与现场足迹具有同一性的可能性的后验概率=1000/(1000+29)=97.18%。在没有专家的足迹鉴定结果之前,办案人员只能依据排查结果推断嫌疑人鞋子是案发现场足迹来源的可能性为1/29=3.45%的比例,但是通过专家的检测结果不难发现嫌疑人鞋子系案发现场足迹的来源有了更大确定性。
4.DNA证据的例证
DNA技术蕴含的同样是同一性认定的原理。基于基因继承,每个人的DNA来源于父母双方,因此在每一个点上呈现两个等位基因。因此,两个人在某一点上具有相同的等位基因很容易,但是在不同点上的等位基因均吻合的概率却是呈指数式降低。DNA技术正是利用科技手段测量特定长度的基因,形成个人的基因信息图谱,并呈现出每个点每个等位基因的片段,将不同来源的图谱进行对比显示是否吻合。
有学者将DNA鉴定意见的司法证明过程演示如下:
随着DNA技术由学术研究领域向技术应用领域的不断扩散以及在法庭上的广泛应用,DAN技术的确为司法人员提供了可靠而有效的帮助,节约了大量司法资源。然而,1989年的人民诉卡斯特罗案首次质疑了DNA证据的可采性,此案中辩方对控方技术专家是否有效地提取、测试并严格检测了受检血样提出了质疑,并且证明了控方专家在利用DNA技术方面的重大缺陷。比如:血样受到了严重污染且很有可能夹杂着其他DNA、专家技术人员认定同一性基于视觉观察吻合而非客观标准等方面的质疑。这些质疑使得检察官陷入被动,从而被告人摆脱了罪责。
与此同时,DNA技术不会出错的“神话”逐渐走下神坛,对其技术本身的应用标准和程序规则的质疑逐渐走进了司法工作人员的视野。在“科学无禁区”的主导思想下,科技应用标准指导着科技工作人更为严谨、更为精确,有益于司法实践的长远发展。
(三)理解和运用贝叶斯定理需要警惕的问题
首先,贝叶斯定理有其适用的前提条件,即要有基础的统计数据,例如前文案例中城市里的黄色出租车或者醉酒人数的一般比例是多少,以及科学方法的准确度如证人辨认出租车颜色的可靠性,或者检测血液酒精浓度(BAC)的气相色谱法可靠性等,均需要数据的统计分析并予以精密的计算。其次,不同案件中适用贝叶斯定理一般公式或其变形公式,需要适用者对公式的含义以及不同要素加以理解,这样才能正确地将贝叶斯定理作为辅助工具。但是贝叶斯定理需要使用者理解并不代表着其在司法实践中会引起普遍的误导或错误,相反,若事实认定者在这些方面加以学习并在运用时保持警惕,并不会发生数字审判的谬误。最后,贝叶斯定理的运用对于解决前述案例问题起着重要作用,其需要注意和提醒的问题也在这里说明。
1.科学方法的可信度与案件事实的可能性并不是等号关系
我们不难发现,案例一中,证人证言的可信度(80%)与案例中是黄色出租车(41%)并不等同,同样地,酒精检测气相色谱法的准确度(99%)也不等于受检测者真正醉酒的可能性(83.90%)。原因在于,待检测或计算的事件本身有着基础的数据比例,如事故中的黄色出租车占比15%,酒精检测呈阳性而确实醉酒也有比例基础5%,这些基础性的统计数据影响着案件事实发生的概率。另外,还涉及参照组的选择,比如选用这座城市还是这座小镇的黄色出租车更能反应或得出案件事实?选用这一小区还是一座城市的醉酒比例更为合适?参照组不同,数据比例不同,结论自然不同。简言之,作为证据方法的可靠性是80%并不能得到80%可信的证据资料。
2.先验概率与似然比的相互抵消作用
文章第一部分已提到似然比的数值大小一定程度上代表了此项证据的证明力大小,但是作为事实裁决者,其更应依赖后验概率而不能仅依据似然比做出认定,因为后验概率是似然比与先验概率的乘积。在证据的证明能力与证明力评判中,先验概率与似然比具有抵消的作用,有时专家鉴定或检测科学证据得出的似然比看似非常大时,也不应该盲目的认定结论。对此,有学者指出将先验概率与似然比同步考虑才有意义,即两者乘积得出的后验概率才是法官(陪审团)应当关注的结果。
正如足迹鉴定的案例,专家将嫌疑人鞋子足迹与现场足迹进行同一性比对,得出1000的似然比,但若考虑现场足迹指向嫌疑人的支持力度的大小,需要进一步考虑“嫌疑人鞋子在此案中的先验概率”。假设样本数据有1000个,则此项证据(现场足迹)的后验概率为1000/(1000+999)= 50.03%,即现场足迹的证据指向嫌疑人的力度仅为50%,而非刚才案例中的93%。这就体现了先验概率与似然比的相互抵消作用。在司法实践中,鉴定或检测专家向法庭呈现的仅为似然比的数值,法庭裁决者应当注意到,先验概率与似然比的结合才是其应当考量的结论。同样值得关注的是,鉴定专家的表达不能误导事实裁决者,似然比的数值1000并不意味着现场足迹是嫌疑人的鞋留下的可能性是其他人鞋留下可能性的1000倍,更不意味着现场足迹这一证据支持同一性假设的概率概率是支持非同一性假设概率的1000倍,而仅仅意味着“嫌疑人鞋子所留鞋印条件下获得证据的可能性与其他人鞋子所留鞋印获得证据的可能性的倍数关系”。所以,鉴定专家并不能发表错误性的表达,因为一旦将1000的似然比值解释成“现场足迹是嫌疑人的鞋留下的可能性是其他人鞋留下可能性的1000倍”无疑就是在说明已经排除合理怀疑地认定此嫌疑人,而根据前文所述,结合先验概率,此项足迹证据指向嫌疑人的概率可能仅为50%,也就是说嫌疑人并非本案确定无疑的凶手。
3.科学技术的司法应用要适当建立普遍的客观标准和程序规则
理查德•伦伯特(Richard Lempert)教授提出,诸多运用同一性的方法,比如笔迹鉴定和指纹鉴定方法,目前都没有有效性的实证依据,所以也就无法从根本上评估方法本身在司法实践中的错误频率。指纹专家坚称他们的技术不会出错。但有学者指出,DNA技术方面的领军人物对法庭上使用DNA会出现的特别问题却知之不多。在实际操作层面,很多技术公司也不像学术研究或实验研究那样依据程序和客观标准严谨地对待检材,在检材的质量控制问题上时常出现错误。因此,许多学者担忧贝叶斯定理的诸多要素条件和晦涩难懂的数学问题会导致司法审判成为一场数学游戏,从而影响司法公正、造成冤假错案。
然而,笔者以为,作为一门真正的科学,数学方法本身并不会给司法实践造成额外的错误。相反,它作为一种分析工具具有纠错的功能,为司法证明带来新的方法。与其凭空猜测贝叶斯定理等数学方法的科学合理性,不如着眼于科学技术运用客观标准和程序规则的不断完善。根据何家弘教授和其博士研究生对刑事错案原因的实证考察结果证实,冤错案件的原因中,“鉴定结论错误”占比8%,“鉴定缺陷”占比20%。可以看出,目前科学技术操作问题导致的错误裁决远远超过了数学方法对司法的影响。对此,有学者指出,有必要对DNA鉴定意见的司法证明进行法律规制,如为保障DNA证据的真实性,建立证据采样、保管链、双重鉴定等规则。
【参考文献】
[1] [美]特伦斯•安德森、[美]戴维•舒姆、[英]威廉•特文宁:《证据分析》,张保生、朱婷、张月波等译,中国人民大学出版社2012年版。
[2] [美]亚力克斯•斯坦:《证据法的根基》,樊传明、郑飞等译,中国人民大学出版社2018年版。
[3] [美]理察德·伦伯特:《证据故事》,魏晓娜译,中国人民大学出版社2012年版。
[4] 何家弘,何然:“刑事错案中的证据问题——实证研究与经济分析”,《政法论坛》2008年第2期。
[5] 张斌:“证据概念的学科分析——法学、哲学、科学的视角”,《四川大学学报(哲学社会科学版)》 2013 年第 1 期。
[6] 吕泽华:“DNA鉴定意见的证明分析与规则创设”,《法学家》2016年第1期。
[7] 张翠玲,谭铁君:“基于贝叶斯统计推理的法庭证据评价”,《刑事技术》2018 年第4期。
[8]Anders Nordgaard; Birgitta Rasmusson, “The Likelihood Ratio as Value of Evidence - More than a Question of Numbers”, 11, Law, Prob. & Risk, (2012).