赞
踩
山东大学软件学院项目实训项目 持续更新中
基础模型:ChatGLM-6B https://github.com/THUDM/ChatGLM-6B
在通用领域,以OpenAI的GPT系列,国内的通义千问、智谱AI等为代表的一系列大模型已经具有较高的预测性能和符合自然语言规范的对话习惯,也已经做了较为成熟的模型推理服务化工作,形成了Web应用等供用户访问;故在这方面再进行创新具有较高难度和较低的可行性。
与此同时,我们注意到,在面向专业人士的中文法律文书生成领域,仍有较大的创新空间:通用大模型为保证其在不同领域的高性能,其生成内容(或预测结果、对话内容)往往不会严格符合中文法律文书的语言习惯;通用大模型数据更新具有一定滞后性(如GPT3.5数据截止至2021年,ChatGLM数据截止至2022年),面对涉及我国新修改法律条文(如2024《刑法修正案(十二)》)时会出现预测错误;通用大模型在其预训练(pre-training)和微调(fine-tuning)阶段会受到非法律数据集或其他语言法律数据集的训练,从而影响参数,干扰其在中文法律文书生成这一特化领域的性能等等。
我们项目的目标就是针对以上问题,开发出严格符合中文法律文书用语习惯、具有较好时效性的能为法律从业者带来良好交互体验的大模型Web应用。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。