赞
踩
领域大模型已成为大模型必然的发展趋势,基于领域数据的标注和模型微调将成为企业的重中之重。目前公认的模式是由大公司提供基础大模型,细分领域的公司选择一个符合自己业务需求的基础大模型,在此基础上进行微调,精确解决领域任务。
领域大模型的落地步骤可拆分为基础大模型选型->数据清洗和标注->训练和微调->评估与迭代->部署和监控。具体如下:
第一步:基础大模型选型
企业需要建立指标体系进行基座选型,例如准确率、召回率、安全性、可解释性、稳定性、成本等,通过量化的指标评估对比多个大模型。
以中兴通讯为研发场景选择基础大模型时的思路如下:
第一,考虑模型参数量。 参数量过大会导致精调和部署成本提升,而参数量过小的模型能力较差,100-500亿参数量的大模型较为适中。
第二,考虑模型能力。 选择基础能力强的,而不是精调后能力强的。目前比较好的模型是Code LLaMA(34B)和Starcoder(15B)。
第三,考虑编程领域能力。 应用于研发场景需要大模型在编程类模型评估中各类语言得分越高越好(HmuanEval、Babecode指标)。
第二步:数据清洗和标注
收集领域内的专家知识和整理标注公司业务系统的数据,对收集的数据进行预处理,包括清洗、分词、标记化等,确保数据准备就绪,以便用于训练和微调。借助第三方大模型数据构造,常用的方法由Self-Instruct、Self-QA、Self-KG等。
从人工智能训练三要素上看,中国企业目前在三要素上存在客观约束。其中,算法的难度相对较低,有众多开源项目可做参考;算力层面,受到美国出口限制的影响,对中国企业会产生一定影响,但企业仍然可以利用过去已采购的高性能GPU芯片或性能有所妥协的GPU芯片作为替代;但数据的难度最大,构建训练数据是最核心的环节,但高质量领域数据获取难度较大,通过构建方法不一定能得到高质量的数据。
第三步:训练和微调
确定微调方案,使用领域相关数据数据对模型进行微调。微调方式如下:
• 预训练:引入大规模领域数据和通用数据对模型的全部参数进行重新训练;
• 监督微调:引入领域数据进行微调训练,是行业内目前最主流的方式;
• 奖励模型训练+强化学习训练:引入人为对每个微调数据的评分,使模型更接近于人类喜欢的答案;然后,利用先前训练得到的监督微调模型和奖励模型进行强化学习训练,使得模型的效果在垂直领域进一步提升。
第四步:评估与迭代
使用领域内的标准评估指标评估模型的性能,根据领域内专家的反馈来不断改进模型的质量。
第五步:部署和监控
当模型在特定领域内达到目标要求的性能时,可以将其部署到生产环境中,并线上对模型性能实施监控。
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。