尚权推荐SHANGQUAN RECOMMENDATION

尚权推荐丨周慕涵:论大数据证据的法律地位

作者:尚权律所 时间:2023-07-27

摘要

 

大数据证据的法律地位主要涉及以下三个问题:一是本体与结构,二是法律性质,三是种类归属。在本体与结构方面,大数据证据仅为大数据报告,其与大数据集、大数据算法共同构成了一种外部性的结构关系。在法律性质方面,大数据证据系意见证据,且该种意见不涉及专门性知识,同时又有别于普通证人的一般意见。在种类归属方面,大数据证据不同于现有的任何证据种类,理应被赋予独立证据种类的地位。这三个问题之间存在着逻辑上的先后关系、推论关系或因果关系。大数据证据的法律地位对于司法实践的启示意义在于,大数据证据在司法实践中的审查应以“裁判者独立审查”为原则,且须设置相应的有限采纳规则与证据排除规则。

 

关键词:大数据证据;派生证据;意见证据;专门性知识;证据种类

 

引言

 

当前,国内关于大数据证据的法律地位问题,学界研究较少,且理论视角较为狭窄,几乎局限在了大数据证据的证据种类归属,而未拓展至其他方面。不仅如此,学者们在探讨大数据证据的种类归属问题时,理论深度也相对欠缺。大多数学者对大数据证据种类归属作出的判断,往往只是基于大数据证据与其他种类证据之间的特征对比,分析其中的异同点,进而给出属于何种证据种类的结论,缺乏更深层次的学理依据。事实上,大数据证据的法律地位并不是只有证据种类归属这一个问题。从逻辑角度而言,要判断大数据证据究竟属于何种证据种类,应当先回答以下两个问题:第一个是大数据证据的本体与结构。具体而言,当我们谈到大数据证据时,往往会同时涉及这三种不同的证据:一是大数据集,二是大数据算法,三是大数据报告。那么,所谓大数据证据,究竟是这三种证据中的某一种证据,还是其中的两种证据,抑或三者皆是?另外,这三种证据之间是否具有某种结构性关系?第二个问题是,大数据证据的本体与结构是否决定了大数据证据具有某种独特的法律性质,此种法律性质具体表现在哪些方面?这两个问题与大数据证据种类归属的问题之间存在着逻辑上的先后关系、推论关系或因果关系,前两者是大数据证据法律地位的“前置性”和“主体性”问题,种类归属则是关于其法律地位的“延伸性”问题。因此,要对大数据证据的法律地位形成较为全面的认识,须按照从大数据证据的本体与结构,到大数据证据的法律性质,再到大数据证据类归属逐一展开论证,并分析大数据证据的法律地位对于司法实践所产生的影响。本文的论证也正是基于此逻辑顺序而展开。

 

一、大数据证据的本体与结构

 

(一)大数据证据的本体

 

大数据证据的本体是关乎“大数据证据”的概念究竟指向何种证据实体的问题,若在这一问题的判断上出现偏差,则之后关于大数据证据法律地位的进一步探讨都有可能得出错误的结论。因此,从某种意义上来说,大数据证据的本体是大数据证据法律地位的元问题。笔者赞同大数据证据的本体应当仅被界定为大数据报告的观点。作出此种判断的论据主要在于以下两个方面:一是大数据证据的生成过程,二是大数据证据的证明价值所在。一方面,大数据证据并非直接生成于案件事实发生过程之中的证据,而是借助大数据算法对原生于案件事实本身的海量电子数据,进行数据收集、挖掘、清洗、整理和计算等一系列分析之后所生成的。在最终的大数据报告生成之前,并不存在区别于传统类型的证据。这是因为,作为分析对象的大数据集在案件发生之前已然存在,其实质是电子数据,而非一种新型证据。并且,若不存在大数据报告,大数据算法对于案件事实也无法产生任何证明作用,根本不可能被当作一种证据来看待。因此,当且仅当大数据报告生成时,才存在所谓的大数据证据。另一方面,大数据证据对案件事实所产生的证明价值依托于大数据报告。首先,由于大数据集中电子数据的数量过于庞大,海量信息只有通过大数据算法转化为信息体量有限的大数据报告,方能为裁判者所感知。另外,借助大数据算法将大数据集转化为大数据报告的过程,就是一个将复杂、隐藏的信息内容予以简单化和直观化展现的过程,这一过程产生了大数据集本身所不具备的增值信息。结合这两个方面,本文认为,大数据证据的本体应当限定为大数据报告。

 

大数据证据的本体为大数据报告,而大数据集仅是大数据证据的生成基础和分析对象,大数据算法则是生成大数据证据的方法依据。基于此,根据“种差+属”的定义方式,大数据证据的概念便可被定义成,“运用大数据算法对与案件事实相关的海量电子数据进行数据收集、挖掘、清洗、整理和计算后所得出的分析报告”。在这一定义中,“分析报告”是大数据证据的属概念;“运用大数据算法对与案件事实相关的海量电子数据进行数据收集、挖掘、清洗、整理和计算后所得出的”则是大数据证据的种差,即大数据证据得以区别于其他分析报告的特性。

 

(二)大数据证据的结构

 

虽然大数据证据的本体仅为大数据报告,但这并不意味着大数据集和大数据算法对于认识大数据证据而言是无关紧要的。根据本文前述对大数据证据概念的定义,大数据证据是大数据算法对大数据集进行一系列分析后所得出的分析报告。从根本意义上来说,作为大数据证据本体的大数据报告,实际上就是大数据算法针对大数据集的内容所给出的结论。因此,这三种证据之间必然会存在某种结构性的关系。由于大数据证据的本体并不包括大数据集和大数据算法,因而大数据证据的结构便体现为大数据报告与大数据集、大数据算法之间的外部性的证据结构。首先,大数据报告与大数据集之间体现为一种派生证据与原生证据的关系:一方面,大数据集是原生于案件事实本身的海量电子数据,是大数据报告得以生成的信息来源和事实基础;另一方面,大数据报告并非自然而然产生的证据,而是在司法程序中运用大数据系统在对大数据集进行分析的基础之上才得以派生出来的证据。因此,大数据证据同鉴定意见一样,是在某种或某些原生证据基础之上“故意制造出来”的派生证据。其次,从本质上而言,大数据算法是对大数据集进行收集、挖掘、清洗、整理和计算等一系列的分析方法,大数据集是其所要分析的对象,而大数据报告则是经过这一系列分析后所得出的结论。因此,大数据报告与大数据集、大数据算法之间的关系又体现为分析结论、分析对象与分析方法的逻辑关系。最后,这三者各自所指向的证明对象,及其所发挥的证明作用均有所不同。大数据集与大数据报告的证明对象均指向案件事实,在对案件事实的证明中发挥实质证据的作用。前者是原生于案件事实本身的海量电子数据,与案件事实直接关联;后者则是对大数据集进行分析之后所派生出来的分析报告,与案件事实间接相关联。与前两者皆不同的是,大数据算法所要证明的对象并非案件事实本身,而只是用来证明大数据报告的结论是否真实、可靠。换言之,大数据算法并不具有独立的证据地位,其证明价值紧紧依附于大数据报告。因此,大数据算法仅能发挥辅助证据的作用。

 

这三者之间的关系共同构成了大数据证据的外部性证据结构,关于这一结构的全部内容可在下图中得到较为直观的呈现。

 

图片

 

二、大数据证据的法律性质

 

(一)大数据证据的法律性质:意见证据

 

前述已论证,作为大数据证据本体的大数据报告,是大数据算法对大数据集进行分析后所形成的分析报告。并且,在大数据报告与大数据集、大数据算法的外部性证据结构中,存在着原生证据与派生证据,分析对象、分析方法与分析结论,实质证据与辅助证据这三重关系。这些方面均能够说明大数据证据是一种意见证据。这是因为,任何种类的意见证据实际上都是一种以派生证据的形式出现的证据,并且意见的生成过程同样也表现为一个运用某种分析方法,将某一原生证据作为其分析的对象,并最终得出以分析结论为内容的派生证据的过程。这些本体与结构上的特性,在普通证人意见与鉴定意见这两种典型的意见证据中也可得到充分的体现。

 

当普通证人对案件事实发表意见时,证人证言的内容便由体验性陈述与意见陈述这两部分所组成。其中,体验性陈述正是源于证人对案件事实的亲身感知和经历的原生证据,意见陈述则是证人对其亲身感知和经历的猜测、评论和推断等主观分析之后,所形成的派生证据。同样的,鉴定意见在本体与结构方面也与大数据证据极为相似。作为被分析对象的实物证据,是原生于案件事实本身的证据,科学原理和检验仪器是生成关于实物证据意见的分析方法,最终生成的鉴定报告则是作为分析结论的派生证据,也即鉴定意见的证据本体。

 

图片

 

综合大数据证据本体与结构,以及大数据证据与鉴定意见、普通证人意见的对比来看,大数据证据完全符合意见证据所具有的特性。基于此可判定,大数据证据与普通证人的意见、鉴定意见一样,也具有意见证据的性质。当然,与一般的意见证据相比,大数据证据的意见无疑也存在一定的特殊性。这是因为,作为大数据证据本体的大数据报告,并非是基于外行证人或专家证人的人脑分析作出,而是在很大程度上由智能算法直接生成的。换言之,大数据证据的意见并非人给出的意见,而是智能算法背后的人工智能出具的意见。故大数据证据也可被称作是一种“机器意见证据”。另外,大数据证据在司法实践中的具体运用情形,也可以佐证其具有意见证据的法律性质。一般而言,大数据证据的意见主要体现在对大数据集所包含案件事实的分析和梳理。但在某些特殊情况下,大数据证据指向的可能并非案件事实本身,而是关于被告人、犯罪嫌疑人的一些过往行为或所享有的社会声誉,用以证明其具有某种品格、倾向、习惯或癖好,进而作为法官量刑的重要参考。因此,大数据证据的意见内容不仅可以表现为关于案件事实的意见,还可表现为一种关于诉讼当事人品格的意见。基于此,大数据证据便可以划分为两种不同类型,一是事实意见型的大数据证据,二是品格意见型的大数据证据。这两种类型大数据证据的区别在于,前者既能够连接案件事实,也能够连接涉案行为人;后者则与案件事实并无关联,只与涉案行为人的过往行为相关,目的是揭示出行为人所具有的某种道德品质、性格特征、行为习惯或行为倾向。事实意见型的大数据证据在民事和行政诉讼中的形式和适用的对象较为多样化,如“淘宝客反作弊系统数据”“百度指数”“证券交易监控系统数据”“查找我的iphone”等各种形式的大数据证据均有一定的涉及。在刑事诉讼中,事实意见型大数据证据的运用则主要集中在网络诈骗、医保诈骗与传销犯罪等类型的案件,以及需要确定行为人的行踪轨迹等特定的证明对象上。如“资金流水大数据报告” “医保大数据报告” “传销组织层级、组织架构的大数据报告”以及“车辆大数据”等。品格意见型的大数据证据在司法实践中多见于以下两种形式:一是“舆情分析报告”,用于证明行为人所实施的某种行为所造成的社会影响,及其在社会中所获得的普遍评价;二是“涉诉案件大数据报告”,用于证明对方当事人长期存在某种不良行为习惯,或从事某种不道德职业的可能性,如民间借贷案件中被告提供关于原告涉诉案件大数据报告用来证明其系职业放贷人。

 

从以上论述中可以看出,不论是从学理上而言,还是从实践中的运用情况来看,大数据证据都具有意见证据的法律性质。因此,对于大数据证据法律地位的探究,应当以意见证据的法律性质作为接下来更进一步研究的理论基点。

 

(二)大数据证据并非涉及专门性知识的意见

 

既然大数据证据的法律性质系意见证据,那么紧接着需要回答的一个问题就是,这种意见证据是否涉及专门性知识?在证据法学理上,意见证据既可以是涉及专门性知识的意见,也可以是仅涉及一般性知识的意见。前者是有专门知识的人就专门性问题出具的专业意见,而后者则主要是普通证人针对其证言中的一般性问题所发表的猜测、推断和评论。并且,这两者的证据资格与审查判断的逻辑是截然不同的。前者一般具有证据资格,遵循“专门性问题由有专门知识的人解决”的审查原则。后者一般不具有证据资格,这是因为对一般知识的审查是专属于裁判者的权限,故遵循“裁判者独立审查”的审查原则。可见,对于大数据证据是否涉及专门性知识这一问题的判断,直接关涉大数据证据的证据资格问题,以及应当如何对其进行审查判断的问题。因此,准确鉴别大数据证据究竟是属于专门性知识的意见还是一般性知识的意见,对进一步厘清大数据证据的法律地位而言至关重要。

 

对于大数据证据是否涉及专门性知识的问题,一些学者基于大数据证据与鉴定意见在生成逻辑上的相似性,以及在法律性质上的共性,认为大数据证据的内容涉及专门性的知识,应当被归入专家证据之列。这些学者之所以作出这样的判断,理由主要在于两个方面:一方面,大数据证据具有很强的专业性和科学性,普通人无法仅凭常识来理解其结论部分的意见表达;另一方面,“大数据技术是通过从数据海洋中提炼数据经验并形成自主判断,发现难以通过人工方式总结的客观规律以及隐藏的、人类难以发现的客观联系”。以上论述在某种程度上代表了当前学界大多数人的观点,但这种观点及其论证的过程都是值得怀疑的。根据学界通说观点,某一事实的认定是否涉及专门性知识,可以依据两种不同的标准进行判断:一是基于知识类型的标准,即该项事实问题的判断是依据一般人的理性、经验和常识,还是特定领域中的专业知识和技能;二是基于审查判断能力上的标准,即裁判者是否具备足够的知识储备和认识能力,也即裁判者在事实认定上的“能”或“不能”。在这两种判断标准中,前者是判断是否涉及专门性知识的决定因素和前提条件,后者则是前者在结果层面上所表现出来的差异。换言之,前者是专门性知识的实质判断标准,后者则是形式判断标准。

 

在形式判断标准上,大数据系统可以轻易地在短时间内收集、挖掘、统计和计算大数据集所包含的信息,并形成大数据报告,解决单凭裁判者自身的认知能力所不能解决的事实认定问题。基于这一点,大数据证据显然满足了裁判者“不能”的标准,故从结果意义上来说,大数据证据似乎可以被认为是一种解决专门性知识的意见证据。然而,当我们将目光转向实质判断标准时,就会发现大数据证据实际上只涉及一般性知识。这是因为,大数据证据之所以能够解决裁判者所不能解决的事实认定问题,原因并不在于大数据证据所产生的增值信息中具有某种专门性知识,而仅仅是因为大数据系统扩充了普通人的算力,加速了对海量电子数据的逻辑归纳,使得大数据系统可以在极短的时间内处理海量的数据信息,迅速完成裁判者在较短的诉讼期限内所不能完成的数据统计、整理和分析的证据审查任务。正因此,才使得大数据证据在是否涉及专门性知识的问题上表现出了较大的欺骗性和迷惑性。学者也曾指出,“大数据集之所以无法由人力直接读取,并非因其在内容上艰深晦涩、只能通过填补专业知识才能理解,而只是因其体量庞大,如以司法实践中可支配之人力进行读取,将无法在可容忍时间范围内完成,故必须通过计算机算力予以加速”。也就是说,大数据证据产生的增值信息,仅体现在对海量电子数据内容的快速读取和分析上,而非对专门性知识的填补上。由此可知,裁判者在对涉及海量电子数据的事实认定问题上之所以会无能为力,并非因裁判者缺乏相应的专门性知识,而是由于裁判者无法做到在较短的诉讼期限内完成对所有海量电子数据的收集、整理、读取和分析工作。换言之,大数据证据的内容与一般性知识之间不存在质的区别,而只存在量的区别。因此,从实质的区分标准来看,大数据证据实际上并不涉及专门性知识,也就不能被视作一种专门性意见。

 

对于以上的理由和结论,认为大数据证据涉及专门性知识的学者可能会反驳道:尽管大数据证据的内容本身不涉及专门性知识,但大数据集与大数据算法显然是涉及的,其真实性往往需要由专门知识的人辅助裁判者审查判断。因此,从间接意义上来看,大数据证据仍然可被看作是一种涉及专门性知识的意见证据。然而,前述已论证,大数据证据的本体并不包括大数据集与大数据算法,而仅为大数据报告。这二者所具有的专门性知识显然不能被看作是大数据报告本身所具有的专门性知识。此外,即便退一步认为,大数据证据可以将这三者都包括在内,这种观点也是不能成立的。这是因为,针对大数据集和大数据算法的意见,并不是大数据证据自身所产生的意见,而是由鉴定人或其他有专门知识的人所出具的。故关于大数据集以及大数据算法的专门性意见,实际上属于鉴定意见或有专门知识的人的意见,而与大数据证据本身所含的意见并无关系。因此,这种反驳理由也不能说明大数据证据就是一种涉及专门性知识的意见证据。

 

(三)大数据证据不同于普通证人的一般意见

 

根据以上论述可知,大数据证据“出具”的意见并非涉及专门性知识的意见,而只能将其归入一般性知识的意见之列。然而,尽管大数据证据与普通证人的意见同属于一般性知识的意见,却并不意味着这两者在实质上是相同的。事实上,大数据证据在许多方面都有别于普通证人的意见。普通证人的意见,是以其个人的理性分析、经验感觉和生活常识为依据,对其证言中的一个或多个事实进行分析后所得出的“信念(belief)、想法(thought)、推断(inference)或结论(conclusion)”。由于普通证人的理性分析和经验归纳能力较为有限,而生活常识又具有很强的例外性,故普通证人的意见可靠程度较低,且很可能脱离事实的基础,因此普通证人的意见在许多情况下都属于“证言中缺乏根据的内容”。更何况,裁判者对于一般性问题完全有能力作出判断,并不需要普通证人的意见作为裁判的参考。只有当出现事实与意见难以区分等特殊情形时,普通证人的一般意见才被容许纳入诉讼。因此,在学理上,普通证人所作的意见一般不具有可采性。有鉴于此,我国法律也对普通证人意见的证据资格采取了严格限制,如《最高人民法院关于民事诉讼证据的若干规定》《最高人民法院关于行政诉讼证据的若干问题的规定》以及《最高人民法院关于适用<中华人民共和国刑事诉讼法>的解释》等司法解释及司法解释性文件中普遍规定,证人的猜测性、评论性、推断性的证言,不得作为证据使用,但根据一般生活经验符合事实的除外。

 

虽然大数据证据并非涉及专门性知识的意见,应当归入仅涉及一般性知识的意见,但与普通证人的意见相比,大数据证据至少在以下四个方面都要表现得更为真实、可靠:第一,事实基础方面。普通证人的意见未必存在相应的事实基础,而大数据证据的意见建立在海量电子数据的事实基础之上,后者的事实基础在数量和质量上都要优于前者。第二,算法和算力方面。大数据系统的算力显然强过人脑的算力,且在大数据深度学习的加持下,大数据算法在复杂度和容错性上也非人脑算法所能及。这两方面的优势便使得大数据证据的计算分析能力和经验归纳能力都要远超普通证人,所得出的意见更具有可靠性。第三,影响意见准确的因素方面。普通证人的意见是否准确、可靠,不仅取决于个体的认知和分析能力,而且受其主观意志和情感因素的左右,存在较多影响意见准确性的不可控因素。相比之下,大数据证据意见的准确性则仅取决于两个方面:一是海量电子数据的收集是否准确、全面;二是大数据的算法设计和建模是否合理,这使得大数据证据的意见相较于普通证人的意见而言,更具有可控性和可检验性。第四,证明价值方面。普通证人的证言仅在意见可采的特殊情况下,才具有一定的证明价值。大数据系统却可以发掘出海量电子数据中所隐藏的规律性现象,并将其予以直观地展现出来,故大数据证据还具有显著的信息增值意义。

 

综合以上这四个方面来看,虽然大数据证据与普通证人的意见同为一般性意见,但前者往往要比后者真实、可靠得多。毫无疑问,不能将这二者等同视之。若用与规制普通证人意见相同的标准来规制大数据证据,则会过分限制大数据证据的证据资格,致使其难以在司法证明中发挥应有的作用。因此,规制普通证人意见的逻辑,并不能简单套用在大数据证据的审查判断上。对于大数据证据这种“特殊类型”的一般性意见,需创设新的证据规则以适应其独特的法律性质。

 

三、大数据证据的种类归属

 

(一)大数据证据所属证据种类的观点梳理

 

当前关于大数据证据所属证据种类的观点,主要有“电子数据说”“物证说”“鉴定意见说”“有专门知识的人的意见说”“书证说”“侦查实验笔录说”以及“独立证据种类说”这七种不同的观点。在以上学者的观点及其论证过程中,虽然并没有明确以大数据证据的本体、结构及其法律性质作为判断证据种类归属的依据,但这些观点实际上仍然可以反映出其背后的论证前提,这也是上述观点之间出现较大分歧的根本原因所在。具体而言,“电子数据说”与“物证说”这两种观点的共同之处在于,都未揭示出大数据证据的意见证据性质,而是直接将大数据证据看作是广义上的“物”。不同之处则在于,前者认为大数据证据的本体仅为大数据集,表现为单一的证据结构;后者则认为大数据集和大数据报告都属于大数据证据的本体,表现为二元的证据结构。另外五种观点均将大数据证据的本体限定为大数据报告,且肯定了大数据证据是基于大数据算法对大数据集进行分析所生成的一种派生证据,证据结构表现为大数据报告、大数据集、大数据逄法三者之间的三方结构。但对于大数据证据的性质,各自的看法又有所差别。“鉴定意见说”“有专门知识的人的意见说”“书证说”以及“侦查实验笔录说”将大数据证据定性为一种专家意见。“独立证据种类说”虽然暗含了大数据证据的性质系意见的观点,但并未明确表示这种意见究竟是一种专家意见还是一般意见。以上内容可通过下表2以直观地呈现。

 

图片

 

(二)大数据证据应被视作独立的证据种类

 

对于大数据证据的种类归属,一些学者可能会认为,这一问题并不值得探讨。理由在于,我国证据种类的划分逻辑并不周延,且忽视了证据的规范性,不利于证据规则的建构。还有学者指出,相关性是证据的根本属性,任何事物只要具备相关性,就可以被作为证据来对待。因此,关于证据种类的探讨可以休矣。这些学者主张摒弃证据种类探讨的观点均有一定道理,但本文认为,对大数据证据所属的证据种类进行判断仍然是有必要的。这是因为,在司法实践中,不同种类的证据往往对应着不同的证据审查逻辑,故大数据证据究竟应当被当作何种证据来对待,将会直接影响司法实践中对其采取何种审查判断方式。大数据证据应当归属于一种独立的证据种类,但论证的理由与当前学界的“独立证据种类说”较为不同。本文将从证据学理和实践后果这两个方面对其分别论证。根据前文论述,大数据证据是在案件发生以后或诉讼进程之中,由当事人或司法人员运用大数据算法对大数据集进行收集、挖掘、清洗、整理和计算后,所形成的大数据报告。大数据报告、大数据集与大数据算法所共同构成的外部性证据结构表明,大数据证据与鉴定意见、普通证人意见的证据结构基本相同,具有明显的意见证据的性质。因此,不论是从证据本体、证据结构还是法律性质的角度来看,大数据证据都无法被纳入物证和电子数据。此外,前文已阐明,大数据证据之所以能够解决单凭裁判者自身的能力所不能解决的事实认定问题,原因在于大数据系统扩充了普通人的算力,加速了对海量电子数据的逻辑归纳,完成了较短的诉讼期限内人力所不能完成的数据整理、读取和分析工作。简言之,裁判者在此类事实问题上的“不能”,并非因其缺乏某种专门性知识,而只是因其无法在短期内完成如此庞大的工作量。由此可见,大数据证据虽然也是一种意见,但由于其并不涉及专门性知识,故其与鉴定意见、有专门知识的人的意见以及检验报告类的书证等专家证据不能相提并论,不能被看作是一种专家证人的意见证据。

 

综合以上两个方面来看,大数据证据从学理上显然与现有的任何一种证据种类都存在着本质区别,因而只能赋予其独立的证据种类地位。若在司法实践中将大数据证据看作是现有的某一证据种类,并按照此类证据的审查逻辑对其进行审查判断,则可能导致以下问题。其一,若将大数据证据归入物证或电子数据的种类,那么就意味着,大数据证据的收集和审查也要遵循“物质交换原理”(the principle of material exchange)和“双联性原理”。前者是指导物证的收集以及物证技术分析的原理,其内容可凝练为“接触即留痕”。后者则是审查判断实物证据的原理,即实物证据一方面要与案件中任一人、事、物、时、空存在联系,另一方面又必须要和受审查的人、事、物、时、空存在联系。对于电子数据而言,“双联性”又可体现为“内容与载体的双重关联性”。基于双联性的认识论原理,实物证据审查判断的认知方法论即“同一认定”。但实际上,大数据证据的收集和审查判断并不遵循这两大原理,也并不适用同一认定的审查判断方式。(1)证据只有生成于案件发生之前或案件发生过程之中,才能够按照“接触即留痕”的规律对其进行收集。然而,大数据证据是案发之后或诉讼进行中,在大数据集的基础之上所派生出的分析报告,因此,“物质交换原理”显然并不适用于大数据证据。(2)大数据证据仅具有单联性,只能与受审查的人、事、物、时、空相关联,其能否与案件中任一人、事、物、时、空相联系,并不取决于大数据报告,而取决于大数据集能否与案件中的各项事实要素相互关联起来。因此,同一认定的审查办法也只能针对大数据集,而无法针对案发以后派生于前者的大数据报告。其二,鉴定意见、有专门知识的人的意见(专家证人证言)以及检验报告类的书证等证据种类,涉及裁判者所无法单独解决的专门性知识问题,这使得裁判者不得不阶段性地“让渡”一定的事实裁判权给有专门知识的人。因此,该类证据遵循“专门性问题由有专门知识的人解决”的审查判断原则。同理,若把大数据证据也看作是一种涉及专门性知识的意见证据,那么对其审查判断同样应当遵照“专门性问题由有专门知识的人解决”的原则,裁判者也要将一定的事实裁判权“让渡”于生成大数据报告的大数据平台或系统。然而,将事实裁判权“让渡”于大数据平台或系统却较为不妥。在对鉴定意见的审查中,裁判者之所以能够将一定的事实裁判权“让渡”于鉴定人,是因为鉴定意见建立在学界或行业所公认的科学原理和精密仪器分析的基础之上,具备相对的可信赖性。并且,鉴定的过程及其理由必须公开,这又为后续的质证提供了重复检验的可能性。相比之下,虽然大数据证据远比普通证人的一般性意见要可靠得多,但问题在于,大数据系统的分析是由纯粹的算法黑箱完成的。大数据报告究竟是如何做出的,大数据平台或系统并不会对此给出任何演示过程和论证理由。人们只能看到最终会得出一份怎样的分析报告,而无法了解产生这一分析报告的原因和过程。因此,若在实践中将大数据证据视为专家证据,实际上是对算法黑箱的过分信任,其中暗含的巨大风险几乎是不可控的。其三,将大数据证据视作一种特殊的侦查实验笔录的观点,在诉讼程序上存在较大的局限性。由于刑事诉讼中的大数据证据几乎都是由控方所提供的,“侦查实验笔录说”的观点在刑事诉讼中可能具有一定的合理性。但是,在民事诉讼和行政诉讼中,大数据证据是由当事人(民事主体或行政机关)所提供的,而且也并不需要公安机关为了调查案件事实动用刑事侦查手段进行大数据侦查实验。因此,将大数据证据视作侦查实验笔录的观点,显然无法囊括在民事诉讼或行政诉讼由当事人一方提供的大数据证据的情形中。

 

综上,不论是基于学理上的理由还是实践中的后果,大数据证据都不能被归入任何一项现有的证据种类,而理应赋予其独立证据种类的法律地位。

 

四、大数据证据的法律地位对于司法实践的启示

 

(一)大数据证据的审查以“裁判者独立审查”为原则

 

在证据法的学理上,涉及专门性知识的证据与涉及一般性知识的证据,遵循着不同的审查原则。对于涉及专门性知识的证据,由于裁判者不具备相应的专业知识,故审查时应遵循“专门性问题由有专门知识的人解决”的审查原则。但对于仅涉及一般性知识的证据,裁判者完全有能力在诉讼双方举证、质证的基础上,作出独立且理性的判断,无须其他人的干预或协助。因此,在仅涉及一般性知识的证据审查上,应遵循“裁判者独立审查”的原则。前述已论证,大数据证据本身并不涉及诉讼中的专门性知识,那么就意味着,在大数据证据的审查判断上,作为普通人的裁判者无疑具备一定的自主审查能力,其并不需要将事实裁决的一部分权力“让渡”于大数据平台或系统,而是应当以“裁判者自主审查”为原则。另外,从司法实践的角度来看,裁判者的“不能”主要体现在对海量电子数据的收集、挖掘、清洗、整理和计算上,而非对大数据证据所含信息内容的审查“不能”。实际上,在许多情况下,大数据证据究竟与案件事实之间存在着多强的关联性,具备多少证明力,能在多大程度上实现证据提出方所主张的证明目的,裁判者往往都具备一定的独立审查能力,并不需要“让渡”其审查判断的权力,也不必然需要有专门知识的人参与大数据证据的质证和认证,以辅助裁判者认定案件事实。这一点在笔者检索到的如下司法案例中可以得到体现。例如,在一起民间借贷纠纷案件中,被告提交了一份“四川省民间借贷大数据报告”,用以证明原告系职业放贷人。对此,该案审理法院认为,该份大数据报告“系被告从互联网上打印资料,未有证据原始来源显示。大数据系对全省总体大数据进行提取,涉及的案件当事人并非特指,且未有对本案原告就是职业放贷人的明确鉴别结果。”上述认证理由显示,法院从证据的真实性和关联性两个角度,对该份大数据证据予以了否定。在另外一起著作权侵权纠纷案件中,被告提交了一份原告涉诉案件大数据报告,用以证明原告是以牟利为目的进行的诉讼,系滥用诉讼权利的行为;该案审理法院认为,“因其结论的客观性及准确性均难以确认,且就证据本身反映的情况而言,并不能证实原告的职业化维权诉讼行为违法,故本院对此亦不予采信”。在该案中,法院基于该份大数据证据的真实性和证明力两个方面,作出不予采信大数据证据的结论。从以上两个案例可以看出,要判断大数据证据与案件是否具有关联性和真实性,其能否实现证据提出方所主张的证明事项,在许多情况下并非一件难事,作为普通人的裁判者显然具备一定的审查判断能力。因此,裁判者并不需要将部分事实裁判权“让渡”于生成大数据证据的大数据平台或系统,而应当由裁判者独立进行审查,并作出独立的判断。此外,当诉讼当事人未就大数据证据的原生证据(大数据集)或分析方法(大数据算法)提出质疑,没有主动提出对大数据集中某些电子数据的哈希值,或者对大数据算法的正确性和公正性进行司法鉴定的要求时,通常便不需要聘请有专门知识的人参与诉讼,协助裁判者认定海量电子数据或大数据算法中涉及专门性知识的部分案件事实,进而判定大数据证据本身是否可采。综上,不论是从证据法学理上而言,还是从现实层面的角度来看,裁判者对于大数据证据的审查判断都应当遵循“裁判者独立审查”的原则。

 

(二)大数据证据的审查须设置有限采纳规则

 

虽然大数据证据与鉴定意见有着相同的证据结构,且性质上也都属于意见证据,但由于大数据并不涉及法律专门性知识,其与鉴定意见等专家证据之间存在本质上的差别。因此,大数据证据的审查规则不能照搬“专门性问题由有专门知识的人解决”的逻辑来创设,采取原则上予以采纳,例外情形应当排除的做法。否则,大数据证据的证据资格便会过于泛滥,在实践中成为定案根据的概率也将不当地增加,甚至可能成为一种“事实上的专家证据”。另一方面,基于计算机的强大算力和逻辑归纳能力,大数据系统能够在海量电子数据中挖掘并总结出关于某一事实的隐藏规律。相较于普通证人就其证言所作出的猜测性、评论性和推断性的意见,大数据证据显然要可靠得多。所以,大数据证据的规则设置也不能完全参照普通证人意见的审查规则,采取原则上予以排除,例外情形可采纳的做法。如此一来,便过分限制了大数据证据的证据资格,使其难以被纳入诉讼,无法在司法证明中发挥其应有的作用。综合以上两个方面,在大数据证据审查规则的设置上,既不能照搬专家证据的审查逻辑,也不能完全参照普通证人意见的审查逻辑,而最好是设置成“有限采纳规则”,以适应其特殊性。所谓“有限采纳规则”,即某种事物可以为某个限定的目的而被采纳为证据。例如,证人先前的矛盾陈述可以用来反驳其之后所作的证言,但不得用于直接认定案件事实。在对大数据证据的审查上设置有限采纳规则,既可以防止出现证据资格泛滥的问题,也可以保证其在司法实践中发挥应有的证明作用。具体而言,大数据证据的有限采纳规则可以考虑设置成两种不同的规制方式:一是将大数据证据限定在某些特定的证明用途,二是将大数据证据限定在某些特定的证明事项。这两种方式所针对的大数据证据的类型也有所不同。事实意见型的大数据证据,适用限定于特定证明用途的规制方式。此类大数据证据对案件事实的证明是基于数据层面的相关性分析,而非对案件事实因果关系的分析。从根本上而言,事实意见型的大数据证据是一种关于案件事实的概率性证明,不可避免地会存在一定的误差,且这种误差的风险是难以准确评估的。故有学者指出,若仅凭大数据证据来证明要件事实,可能产生“以概率推断替代事实推断的隐忧”。对此,学者指出,相关关系实际上是因果关系的派生,大数据证据的相关关系基于数理上的因果关系。但即便如此,这种数理之间的因果关系也是无法直观地呈现给裁判者的。因此,仅使用大数据证据认定某一要件事实仍然存在较高的错误风险。

 

基于以上理由,事实意见型的大数据证据不宜被单独用来证明要件事实,而应当被限定在两种特定的证明用途:其一是用于补强和印证其他真实性存疑或证明力不足的证据。如补强当事人陈述、被告人供述、被害人陈述以及有利害关系的证人证言等真实性存疑的言词证据,或者用大数据证据来印证物证、书证等证据中存疑的内容。其二是用于质疑和反驳其他证据或推定事实,如可用大数据证据来弹劾当事人陈述、被告人供述、证人证言等言词证据中的矛盾内容或不实内容,或者是在对物证、书证等证据的质证中对其真实性或证明力进行质疑,再或者是将其作为推定规则中的“有相反的证据”,反驳推定事实的成立。品格意见型的大数据证据,适用限定于特定证明事项的规制方式。这样做的理由在于,此类大数据证据是通过证明诉讼当事人或证人有某种行为或习惯,进而说明其现在或今后有继续实施某种行为的倾向,这与一般意义上的品格证据并无实质性的差别。在大多数情况下,品格证据与案件事实之间并不存在关联性,而只在少数的证明事项上才具有一定的证明价值,故品格意见型的大数据证据只能被限制在某些特定的证明事项上。在民事案件的审理中,只有当诉讼当事人的品格是案件所涉及的法律要件之一,或者与案件处理的实质性问题直接相关时,品格意见型的大数据证据方可被纳入诉讼。例如,婚姻家事类案件中当事人的品格本身便是法官判决双方离婚、婚姻损害赔偿金以及子女抚养权的一项重要事实根据。若有一方当事人提出了有关对方的网络访问记录分析报告及资金流分析报告等大数据证据,以此证明对方长期有网络赌博的恶习,并主张其在婚姻中有重大过错,且不适宜抚养未成年子女时,那么这种品格意见型大数据证据就应当被认为具有证据资格。在刑事案件的审理中,基于无罪推定原则和证据裁判主义,品格意见型的大数据证据无疑不应被用于定罪事实的证明,但在量刑事实的证明中却可以发挥一定的作用。例如,被告人的网络访问记录大数据报告显示,其曾经在手机、电脑等设备上频繁搜索和浏览某些与犯罪行为相关的内容。这一证据虽然并不能用来认定被告人就是个案中的犯罪行为实施者,但在量刑事实的证明中可以用来评估被告人的社会危险性,作为确定最终量刑幅度的一项重要事实根据。

 

(三)大数据证据的审查须设置证据排除规则

 

在大数据证据的审查中设置有限采纳规则,可以在充分利用和有效制约之间起到一定的平衡作用,但不得不承认的是,这种制约所能解决的证据资格问题仍然是有限的。因为有限采纳只是从正面的角度划定一个可以采纳的范围,而并没有在划定的可采范围之内,进一步从反面的角度排除那些不应当采纳的情形。因此,在大数据证据的审查中还应当设置相应的证据排除规则,以对其证据资格进行全面的规制。从逻辑上而言,派生证据是否可以被纳入诉讼中,取决于生成派生证据的原生证据及其分析方法的关联性、真实性与合法性。当原生证据或分析方法出现与案件事实不存在关联性、真实性存疑或者是不合法的情形时,派生证据便不具有证据资格,应当将其排除在诉讼之外。例如,作为一种最典型的派生证据,鉴定意见能否被纳入诉讼中,主要在于两个方面的因素:一是原生证据方面的因素,如检材是否来源不明,有无被污染的痕迹等;二是分析方法方面的因素,如检验的程序是否合法,检验的方法、原理是否科学,检验仪器有无损坏,鉴定机构及鉴定人是否具备鉴定资质或鉴定资格等。若原生证据或分析方法在以上方面存在问题时,鉴定意见便毫无意义。在《最高人民法院最高人民检察院公安部国家安全部司法部关于办理死刑案件审查判断证据若干问题的规定》第24条关于鉴定意见证据排除的规定中,许多方面也正是围绕着原生证据和分析方法所展开的。同理,在具体案件的审理中,大数据证据能否被赋予相应的证据资格,在很大程度上也取决于作为原生证据的大数据集,以及作为分析方法的大数据算法。一方面,大数据集是大数据证据的事实基础。当大数据集中存在着较多不实、误导、重复或过时的数据时,大数据证据就很可能建立在虚假的、错误的事实基础之上,其意见的可靠性无法得以保证。另一方面,大数据算法是大数据证据的方法基础。若大数据算法模型不准确或算法模型不公正,所得出的结论便是对大数据集信息内容的误读或曲解,大数据证据也不可能是对案件事实的准确反映。因此,当大数据集与大数据算法存在以上问题时,大数据证据就不能被给予证据资格,而应被排除在诉讼之外。

 

结语

 

大数据证据的法律地位是大数据证据相关理论研究的一项重要议题,也是助益于实务界解决大数据证据的证据资格问题的理论前提与法理依据。本文认为,关于大数据证据法律地位的研究应当围绕大数据证据的本体与结构,大数据证据的法律性质,以及大数据证据的种类归属这三个问题逐一展开。在本体与结构方面,大数据证据的本体仅为大数据报告,结构表现为大数据报告与大数据集、大数据算法之间的外部性结构关系。在法律性质方面,大数据证据的法律性质系意见证据,这种意见本身并不涉及专门性知识,但又与普通证人的一般意见有着较大的区别。在证据的种类归属方面,大数据证据的本体、结构与法律性质共同决定了,大数据证据不同于以往任何种类的证据,应当被赋予独立的证据种类地位。最后,本文指出,大数据证据的法律地位对于司法实践的启示意义在于,大数据证据的审查判断应当遵循“裁判者独立审查”原则,并须设立相应的有限采纳规则与证据排除规则。

 

 

来源:《法律科学》2023年第4期

作者:周慕涵,中国人民大学法学院博士研究生