赞
踩
相关链接:arxiv
关键字:Large Language Model、Legal Domain、SaulLM-7B、Instructional Fine-tuning、Legal Corpora
本文中,我们介绍了SaulLM-7B,这是为法律领域量身打造的大型语言模型(LLM)。SaulLM-7B拥有70亿参数,是第一个专门为了理解和生成法律文本而设计的LLM。它是基于Mistral 7B架构,并在超过300亿的英语法律语料上训练优化。SaulLM-7B在理解和处理法律文件方面表现出了前沿的专业能力。此外,我们提出了一种新颖的指导性微调方法,利用法律数据集进一步提高了SaulLM-7B在法律任务中的表现。SaulLM-7B在MIT许可下被释放。
实验结果主要包括以下几个部分:
Model | LegalBench-Instruct | MMLU-Jurisprudence | MMLU-Professional Law | MMLU-International Law |
---|---|---|---|---|
SaulLM-7B-Instruct | 0.61 | 0.63 | 0.69 | 0.41 |
Mistral-7B-Instruct-v0.1 | 0.55 | 0.60 | 0.65 | 0.38 |
Mistral-7B-Instruct-v0.2 | 0.52 | - | - | - |
Llama2-13B-chat | 0.45 | - | - | - |
Zephyr | 0.44 | - | - | - |
Llama2-7B-chat | 0.39 | - | - | - |
重点说明:
我们介绍的SaulLM-7B是针对法律领域设计的开源解码器模型,其性能在7B类模型中达到了领先水平。我们的方法包括将法律数据与指令微调相结合进行训练。此外,我们还提供了LegalBench的清洗版本,并引入了一个新的文件集来衡量复杂度。我们希望我们在MIT许可下发布的模型能够为开源生态系统和社区做出贡献。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。