2025-03-10 数码 0
北大团队开源中文法律大模型ChatLaw,为推动技术创新提供了新的路径。该模型旨在解决大语言模型与知识库结合的挑战,尤其是在法律领域。目前,ChatLaw提供了三个版本:ChatLaw-13B、ChatLaw-33B和ChatLaw-Text2Vec,它们都基于姜子牙-13B、Anima-33B等底座,并利用大量法律资料构建对话数据。
通过分析实验结果,我们得知:
(1)融入法律相关问题和法规文本可以显著提升模型在选择题类任务上的表现。
(2)针对特定任务的训练能增强模型在该类任务上的性能,比如使用大量选择题训练的ChatLaw超越GPT-4。
(3)复杂逻辑推理能力是选择题难度所必需,因此通常更大的参数量会带来更好的表现。
未来的发展计划包括:
提升逻辑推理能力:目标是训练30亿参数以上的中文基础模型,这对于处理复杂的法律逻辑至关重要。
增强安全性:优化回复内容中的法条准确性,以及减少幻觉现象,是我们未来工作的重点之一。我们正在与学术团队合作,以解决LLM中可能出现的问题。
私有化定制服务:除了扩展基本法律功能,我们还将探索个性化私有需求,如为不同行业或企业定制化的大型语言模型。