2025-03-10 数码 0
北大团队首创中文法律大模型ChatLaw,开源给科技界,深化法治智慧
随着人工智能语言模型技术的飞速发展,ChatGPT等工具在各领域展现出其强大的应用潜力。医疗、教育和金融等多个行业已经开始尝试利用这些模型,但法律领域相对较少见到相关产品的出现。这背后隐藏着一个问题:如何将大型语言模型与法律知识库有效结合,以适应复杂的法律场景?
为了解决这一难题,北大的一支研究团队推出了名为ChatLaw的大型中文法律模型,并且对如何在法律背景下合理地整合和优化语言模型与知识库进行了深入探讨。目前,该项目提供了三个版本,即ChatLaw-13B、ChatLaw-33B和ChatLaw-Text2Vec,它们分别基于姜子牙-13B、Anima-33B这两款底座。
为了构建高质量的对话数据,这些版本使用了大量来自新闻报道、论坛讨论、法规条文、司法解释以及咨询案例等丰富资源。此外,由于选择题往往需要复杂的逻辑推理能力,因此该团队还特别注重通过加入选择题训练数据来提升模型性能。
关于此项工作,有关论文已发表于arXiv平台,其主要结论包括:
(1)通过引入更多关于问答和法规条文的问题,可以显著提高选择题回答准确性。
(2)针对特定任务类型进行专门训练能够极大提升该类任务表现。
例如,与GPT4相比,ChatLaw取得更佳成绩,是因为它接触到了大量用于训练选择答案的问题。
(3)参数量越大的中文基础底座通常能更好地完成复杂逻辑推理任务。
未来规划
优化逻辑推理能力:计划开发30亿以上参数量的中文基础底座。由于涉及到的真实问题经常要求高级别逻辑处理能力,我们预计只有达到这个参数量才能满足需求。
提升安全可靠性:减少幻觉现象发生频率。在当前模式中,我们已经做了一系列努力以保证回应内容准确无误;我们将进一步改进向量库整合方式,并致力于LLM幻觉问题研究,与学术伙伴合作寻求突破点,以期内两个月内有重大进展。
私有化定制服务:除了扩充基本法律功能,还会探索企业对于私有数据需求,为不同用户群体提供定制服务。