德恒律师事务所 | 未来已来：人工智能在我国法律服务行业中的应用与展望

未来已来：人工智能在我国法律服务行业中的应用与展望

2023-11-07

微信图片_20231108094602.png

引言：

2023年，一款名叫HarveyAI的人工智能宣布与全球多家律所达成全面合作，此举标志着生成式人工智能在法律领域的运用成为行业热议话题。我们认为：人工智能并不能替代律师进行法律服务，但其对文件起草、合同审阅、备忘录撰写等律师业务基础性工作将产生极大加成。本文首先介绍以ChatGPT为首的人工智能通用模型对律师工作效率的提升，并通过分析生成式人工智能的训练模式和应用场景，说明未来的人工智能格局将向更专业化、精细化的方向发展。为此，国内法律行业应该跟上美国步伐，重视生成式人工智能在法律服务领域的研发和应用，以便在未来快速增长的人工智能领域保持竞争力。

一、法律领域生成式AI的兴起

生成式人工智能（Generative AI）是一种基于海量训练数据和生成算法模型，创造性地产出内容的人工智能。区别于机械式执行既定指令，生成式人工智能实现了从“复制”向“创造”的飞跃，使其能够“像人类一样思考”。2022年11月底，美国人工智能公司OpenAI推出一款生成式AI——ChatGPT，一经问世便在短时间内突破亿级用户增长，迅速在全球掀起一股热潮。人们惊叹于ChatGPT在处理信息、生成文本时的高效智能，以及其与人类极度相似的语言风格，认为这将对现有的文本创作模式产生颠覆性的影响。

事实上，AI发展至今，文本处理是人工智能研发最为成熟的几项功能之一。而法律行业作为文本绝对主导的一大领域，毫无疑问将成为生成式AI接下来主要的应用场景。具体而言，法律行业天然和这种大型语言模型Large Language Model（LLM）相匹配。作为一个典型的文本输入/输出的场景，法律行业的数据以文本为主，并且多为绝对事实和真实案件，很适合大型语言模型学习。此外，法律工作的强知识性和逻辑性也使得大语言模型能够在更多法律工作环节中提供价值。在LLM出现之前，法律科技企业的主要业务方向多在于电子签名、合同管理等边缘环节，现在则转向研发能够提高工作效率的工具，例如法律领域的生成式AI。

HarveyAI就是一款新近推出的，专为律师事务所打造的定制LLM。它由ChatGPT的母公司OpenAI支持研发，并获得了由Sequoia红杉资本领投的2100万美金A轮融资，发展前景良好。今年年初，HarveyAI先后与安理国际律师事务所（Allen & Overy）、普华永道（PwC）等行业龙头建立全球合作伙伴关系，为其旗下律师及法律专业人员提供包括合同分析、数据处理在内的多项服务。红杉资本在其官方网站表示，目前有1.5万家律师事务所“正在排队使用”HarveyAI这一产品。根据研发团队的介绍，HarveyAI在研发过程中接受了三种数据类型的训练。首先以ChatGPT模型为基础，输入一般互联网数据；其次接受一般法律数据库的训练，包括判例法及其他法律相关文献、资料；最后，各个律所可以根据需求，针对特定业务、特定客户对其进行微调。研发团队同时强调，考虑到数据隐私问题，一旦HarveyAI开始在某家特定律所开始接受训练，其生成的语言模型就将成为这家律所独有的产品，不会再被应用到其他律所当中。

HarveyAI不是唯一面向法律领域的生成式AI。律商联讯（LexisNexis）、汤森路透（Thomson Reuters）、Litera等知名法律技术服务商都通过数据预训练、微调等方式推出了自己旗下的AI产品，并与Dentons、里德·史密斯（Reed Smith）、欧华（DLA Piper）等知名律师事务所展开合作。可以说，生成式AI在法律领域的大规模应用已然是大势所趋。

二、生成式AI在公司法下的应用场景

然而，伴随生成式AI的应用实践，有关它的争议也从未停止。由于生成式AI提供的回答是以大规模训练数据为基础，AI从投喂给它的大量数据中学习并生成内容，而训练数据本身的错误、偏见、立场等最终都可能反映在其生成的内容中。除了不当的训练数据，算法设计者主观认知偏见、算法设计过程中的技术漏洞、信息甄别和过滤机制的缺乏，都可能影响AI生成内容的可靠性，甚至其有时提供的答案并非基于任何现实世界的数据，而是模型自己想象的产物，也就是所谓的“AI幻觉”（AI hallucination）。从此点来看，将其全面引入法律领域似乎值得三思。但是，如果将目光聚焦于投融资、并购重组与资本市场等非诉领域的法律服务场景时，生成式AI对大量文本的处理和反馈能力将在此领域发挥极大的作用。

首先，律师完全可以通过HarveyAI这类法律生成式AI进行指令明确的文本整理工作。举例来说，当一位中国大陆律师需要为其美国客户准备一份英文法律备忘录时，可以通过先行起草初始版本，再要求生成式AI进行修改校对。为此，我们只需要明确下达指令，要求其以“美国律所的语言风格”进行修改，以精进文稿本身中可能存在用词、语法等问题。也就是说，在生成式AI的协助下，原本横亘在不同法域间的语言壁垒将更容易被打破，这将进一步提升律师的工作效率。

同时，生成式AI的功能并不局限于文本润色，在经过训练与微调后，其甚至可以完成一些初级的法律技术性工作。以下是一个使用生成式AI修改和完善交易协议的示例，当我们向ChatGPT输入以下指令：

“You are a corporate lawyer advising a joint venture to be formed between a Chinese company and a European company. For further context, the parties will sign an agreement of understanding for the establishment of the Joint Venture and a shareholder agreement for the establishment of the JV. Furthermore, the Chinese company will sign a leasing agreement and a maintenance and support agreement with the JV. Please prepare a section of the joint venture agreement regarding the aggregate liability cap. Make it in the style of a large international law firm. Use the following points for the section:

Under the aggregate liability cap, all the liabilities arising from any agreement under the transaction, from any event under the transaction, will be limited to one cap.

Under each agreement, there may be a separate liability agreement.”

（“作为一名公司法律师，请为一家中国公司和欧洲公司成立的合资企业提供法律服务。双方将签署成立合资企业的谅解备忘录与股东协议，中国公司还将与该合资企业签订租赁协议及维护和支持协议。请以大型国际律师事务所的风格，起草该合资协议中关于责任上限的章节，要求：（1）该交易下任何协议、事件所产生的全部责任都将限于一个累计赔偿限额；（2）每项协议可以有单独的责任条款。”）

面对这一系列复杂要求，ChatGPT给出了极富专业性的回答。它生成了一段名为“Section 18: Aggregate Liability Cap”（“累计责任上限”）的章节，并于其下规定了五项子条款：

微信图片_20231108094611.png

上述例子十分具有代表性，它展示了生成式AI可以胜任部分初级的律师工作。首先，它出色地完成了最基础的任务，即根据指令生成一段特定文本。其次，在合同条款的设计上，它几乎与一个接受过基础法律思维训练的人无异，生成了包括责任排除条款、权利声明在内的一段完整的合同章节。最后，在语言风格上，它同样保持了法律文本应有的严谨和专业。由此可见，虽然合同细节仍然需要资深律师把关、调整，但利用生成式AI起草合同并非无稽之谈。除此之外，法律行业还在不断开发生成式AI的其他应用场景。PwC就于近期实践表明，由于生成式AI能够系统性地解析大量文本，在向其输入批量合同中的重要条款后，AI就能在律师的指示下，生成一份初步的尽调报告。^[1]

综上所述，在向生成式AI输入足够体量的协议文本、公司信息等数据资料的情况下，现有的AI技术完全可以使其完成文本校对及基础法律文件起草等工作。同时，在此过程中律师并未向生成式AI寻求任何开放性答案，而是在严格限定上下文条件和适用范围的情况下向其下达指令，因此产生“AI幻觉”或误读的概率也将大幅度降低。此点也在HarveyAI的实际使用中获得了印证。

安理国际律师事务所出具的相关报道表明，在高度特定的上下文场景中，律所引入AI大幅度提高公司法律师的工作效率，且并未产生“AI幻觉”。^[2]

三、构建公共法律数据库对生成式AI的重要性

正如前文所言，生成式AI在起草法律文本、提高律师工作效率等方面有着巨大潜力。但发挥此功能的前提是AI模型本身需要被输入大量的数据资料并加以训练、调试，以便该模型能从海量的交易文件中学习法律思维、文本风格和交易习惯。美国证券交易委员会（SEC）在其数据库中公布了大量公司协议文本，这些公开数据成为ChatGPT和其他类似AI模型的丰富养料，使其能从中学习、模仿，最终自主生成类似协议草案。

为了使这一观点能更加直观地呈现，本文以飞机租赁为例，分别在中国证监会和美国证券交易委员会（SEC）检索了相关的公司交易文件，结果如下：

微信图片_20231108094627.png

由上文可知，仅在飞机租赁领域，SEC的公共数据库中就囊括了从独家租赁到非独家租赁、单架飞机到多架飞机租赁、租赁飞机是否配备引擎等广泛场景。协议文本涵盖有关飞机质量、规格、交付方式、税负问题等细节条款。^[3]事实上，飞机租赁协议不过是SEC海量数据库中的冰山一角，各个类型的交易文件都能在这里找到具有代表性的文本，供AI进行模仿、学习。

但是，由于我国当前并不要求上市公司披露其交易文件，交易协议多作为商业秘密而存在，这就使得我国的生成式AI难以获得所需的数据资料。同样以飞机租赁为例，公司会在中国证监会官方网站上披露交易公告，公告内容涉及交易双方信息、交易概况、合同标的、交易影响、相关董事会决议等，但不会公布协议文本，无法成为AI的数据来源。^[4]国内也有许多非官方数据库，如百度文库等，其中有海量的交易协议模板，但由于缺乏对上传者的限制门槛，其中的文件质量、数量都远不能与SEC数据库中近20年的数据信息相比。

因此，要想使得生成式AI在我国法律行业发挥更大作用，需要建立一个向公众开放的可信赖的法律文件数据库。我国可以效仿SEC的做法，考虑由上市公司向证监会提交相关交易协议，并在隐去商业秘密等敏感信息后向公众披露，最终建立起一个可靠且真实的数据库，成为生成式AI训练与调试的数据来源。

四、小结

随着生成式AI地兴起，其在法律行业中的巨大潜力也逐渐浮现。为了能在未来的人工智能竞争中保有一席之地，国际顶尖律所、法律服务机构等各大巨头纷纷入彀，将这一工具引入日常工作。21世纪是技术革新的时代，对我国而言，要想在快速增长的人工智能领域保持竞争力，就需要不断开发其在各个领域的应用场景。考虑其行业特性，法律服务领域便是生成式AI的一处绝佳落脚之地，重视生成式AI在法律领域，尤其是公司法领域的研发和应用，使其与国际接轨，推动我国实现人工智能驱动未来的重大飞跃。

需要再次声明，生成式AI并不能代替律师直接向客户提供法律服务。事实上，这也并非我们对生成式AI未来发展的期望。法律是一门深奥且精细的学科，其中涉及人与人之间的沟通，以及人性中更加微妙、复杂的部分，而这些都是人工智能无法感知和处理的。但是，公司法领域同样存在着庞杂的基础性文件整理、起草等工作，将生成式AI引入这些领域，可以极大地提高效率，让律师得以将更多的时间和精力用于研究更重要的法律问题、维护客户关系等工作之上。

参考文献：

[1]参见：https://www.ft.com/content/463f8cc1-9feb-46ac-a14e-7826c87e2bf4

[2]参见：https://www.lawnext.com/2023/02/as-allen-overy-deploys-gpt-based-legal-app-harvey-firmwide-founders-say-other-firms-will-soon-follow.html

[3]参见：https://www.sec.gov/Archives/edgar/data/1400891/000119312512069208/d272839dex1023.htm

[4]参见：http://static.cninfo.com.cn/finalpage/2021-12-22/1211981139.PDF，http://static.cninfo.com.cn/finalpage/2023-09-21/1217907508.PDF

本文作者：

声明：

本文由德恒律师事务所律师原创，仅代表作者本人观点，不得视为德恒律师事务所或其律师出具的正式法律意见或建议。如需转载或引用本文的任何内容，请注明出处。

相关律师

吴建安

薛凯

相关搜索

手机扫一扫