随着语音识别、文本抓取等人工智能技术在实践中的运用得到普及,对更多诉讼活动进行电子记录、数据提取,将一些僵尸数据转化为可计量、可使用的统计数据已成为可能。
[55]需要指出的是,关于疑难案件,有案件事实上的疑难案件和法律适用上的疑难案件之分,其中案件事实上的疑难案件问题主要是侦查机关的难题,而法律适用上的疑难案件才是司法裁判领域的问题所在。[48]参见注[24],第173页。
[41]侯猛:社科法学的传统与挑战,《法商研究》2014年第5期,第76页。第三,法教义学反对轻视规范文义的倾向,主张认真对待文本本身。[10]这一论断显然是不充分的。社科法学则主张(部分或者完全)放弃法教义学立场,对规则采取实用主义态度,通过实用后果来论证、合理化司法裁判。但在这种触发舆论、民意的案件中,司法如果还是弃民意、舆论于不顾,那么便难以想象这种所谓远离社会情绪的公正判决让谁感受到了公正。
陈金钊对此的批评一针见血:问题在于,除了少数社会反响很大、引起媒体关注的案件,很少有较为普遍的民意关注,法官不可能在每一个案件里都探寻民意,只能揣测民意。[16]吴闯、冀成海等:法院谈射击摊大妈获刑:判决时从情理上考虑不多,http://news.163.com/17/0118/17/CB32O0V60001875P.html,2017年11月22日访问。文章又进一步指出这个问题既需要法教义学研究的努力,也需要实证研究的努力——并且,即便是实证研究,也包含了对民间借贷相关的大量事实话题,而本文只能研究法官是如何认定利息的,如何计算四倍基准利率这个非常具体的司法实践的经验事实。
[50]参见范愉:《多元化的法律实施与定量化研究方法》,《江苏大学学报(社会科学版)》2013年第2期,第68~80页。事实上,如何合理操作化研究中的主要变量——包括被解释变量和主要的解释变量——本身是衡量一个量化研究作品优劣的最重要标准之一。在一个学术研究中,即便话题被成功解答了,背后的问题未必能够解决,因为可能需要大量的系列话题研究才能解决一个理论或者现实问题。同时,图1中浅灰色的内圈描述了实证研究在经验世界的四个要素(经验问题、假设命题、抽样证据和经验发现)以及这四个要素之间彼此一一衔接的六个通道(从i到vi)。
[44]所以,到目前为止,我们口中的法律大数据,还只是一个虚构的大饼。或者,你来自火星,我来自水星。
事实上,法律实证研究的发展已有时日,[45]并不是法律大数据时代的产物——尽管后者是个巨大的催化剂。从抽象的司法不公到可计算的冤假错案率就是一个操作化的过程,这也是一个从理论世界转换到经验世界的过程。在另一方面,在大数据时代,研究基本功的改善,又更能释放大数据所蕴含的知识能量,提升法律实证研究对于改善中国法治的真实影响力。但是,认真利用裁判文书网做过研究的人都知道,其实上网的判决书离实际做出的判决书的差距不小。
同时,正如前述,理论要素和经验要素之间转换非常重要,没有从理论世界向经验世界的转换,就不构成实证研究。[8]《芝加哥大学法律评论》在刊发爱泼斯坦和金长篇雄文的同时,发表了两位法学者针锋相对的批评和对法学研究的辩护文章。[30]相对于法教义学的规范研究,实证研究这种倾向更为明显。上述对法学研究要素和路径的归纳暗含了法律实证研究可能存在的第一类问题,不妨称其为研究要素残缺问题。
而现状是,除了相当数量的裁判文书上网以外,绝大多数类型的中国法律数据基本上处于采集者的垄断占有之下,并形成了一座座大小不一的数据孤岛。[47] 相比之下,目前发表的相当一部分判决书的实证研究,对重要变量的编码与界定,显得有些漫不经心,至少给读者的印象是如此。
其中一种情况是,劳动者主张经济赔偿金,法院判决用人单位支付经济补偿金(经济赔偿金的数额通常是经济补偿金数额的两倍)——这种情况就很难判定劳动者是否胜利了。衔接不当,就出现论证不当的问题。
前文图1是对法律实证研究正当程序的一个概括,而之后分析到的研究选题的乏味、理论应用的乏力、量化数据的不足、统计操作的随意,以及这些具体问题所展现的研究要素的残缺、转换不当、衔接不科学,都是对实证研究正当程序的违背。这也意味着,一方面,无论是I到VI这个论证循环,还是i到vi这个循环,都可以是自洽的。左卫民:《一场新的范式革命?——解读中国法律实证研究》,《清华法学》2017年第3期,第45~61页。事实上,法学界里的很多实证研究者,也是打一枪换一炮,对自己的前期研究也很少做跟踪研究。由于实证研究存在两个论证循环,所以前文提到的四大要素,实际上变成了四对要素,即抽象论题/经验问题、理论文献/假设命题、全样证据/抽样证据、理论结论/经验发现。没有好的食材,巧妇难为无米之炊。
如果理论文献的回顾未能形成可供检验的经验命题,后面的经验证据就不会和前文的理论产生关联,由此得出的经验结论和提炼而来的理论总结,也当然不会和文献中的理论产生真实的对话。其五,发展法律数据档案引用、检索的标准,以便夯实法律实证研究共同体。
[55]对于Lee Epstein和Gary King文章的直接批评,参见前注[8], Jack Goldsmith Adrian Vermeule文,第153~167页。[63]参见田禾、吕艳滨主编:《实证法学研究》2017年第1期,社会科学文献出版社2017年版。
[13]或者,有些学者会对实证研究的技术问题持有一种更加温和的、实用的相对合理主义立场。当然,任何一对要素的整体残缺,几乎会产生问题。
[32] 当然,说当前中国法律实证研究选题乏味,并不能一棒子打死。从I到VI这六个论证衔接的组合,也显示了不同的研究路径。基础数据不扎实,即便用大数据的分析工具也是事倍功半,甚至得出错误导向的结论。即便在引领世界潮流的美国学界,法律实证研究的操作问题也广受诘难。
[26]尽管我本人至今认为这个问题还是有意思,值得大家去关注,但是根据中国知网的检索结果显示,至今该文只被引用1次,而且还是我本人的自引。本文提供一个反思实证研究的内部人视角,正是出于如此初衷。
[61]比如,在2017年下半年于贵州召开的一个全国性会议中,主办方打出了法学强则中国强,实证强则法学强的口号。事实上,法学界大部分的读者或者听众不太关心统计模型中某个自变量和因变量之间存在的统计上的关联,而更关心的是关联说明了什么问题,或者有什么样的理论与规范(政策)涵义。
当前发表的纯粹经验性的法律实证研究例子不少,尤其是司法实务届人士关于司法制度运行方面的实证研究尤为如此。当然,客观上的法律基础数据建设得不理想,并不等于实证研究中的量化数据一定有问题。
【摘要】 当前中国法律实证研究虽然取得了重大成就,但是依然存在较多问题,需要对现存问题进行技术性讨论、批评和反思。[16] 本文的组织结构如下。当然,统计分析过程中存在的问题,不仅仅存在于当下中国的法律实证研究作品中。这种情况说来有点奇怪。
其二,通过共同举办研讨会、出版刊物等方式,切磋实证研究的技艺,共同提升实证研究的能力与影响,发展可以科学研究的理论范式。当前法律实证研究中量化数据的问题还在于,研究者在主观上违反了社会科学研究的一些基本要求,使得样本数据的应用在很大程度上失去信度和效度。
[49]再如,就利用官方统计数据进行多元纠纷解决机制的实证研究中,范愉认为存在统计数据不准确、统计范围有限、统计分类不够科学等问题。中国学者的阐述,最近的研究可参见白建军:《法律实证研究方法》,北京大学出版社2014年第2版,第1~15页。
一种路径是全程的路径,也就是把四个核心要素用论证过程串联起来的研究路径。由于这三类问题的存在,使得相当一部分法律实证研究论著出现研究选题乏味、理论应用不力、量化数据不足和统计操作随意的技术缺陷。