书生浦语大模型全链路开源体系-课程笔记

作者：知新_RL | 2024-04-06 06:04:08

踩

书生浦语大模型全链路开源体系-课程笔记

以高质量开源赋能创新

大模型成为发展通用人工智能的重要途径。

尺寸	模型基座（可塑性强）	多能力强化（推荐用于微调）	对话交互优化
7B 轻量化	InternLM2-Base	InternLM2	InternLM2-Chat
20B 综合能力强	InternLM2-Base	InternLM2	InternLM2-Chat

新一点数据清洗过滤技术

超强的上下文
综合性能全面提升。代码、数学、推理、知识、语言、考试，20B的模型比肩GPT3.5。
优秀的对话和创作体验。想象力ok。
工具调用能力整体升级。日程安排。
突出的数理能力和实用的数据分析功能。高准确率，复杂运算和求解，加入代码解释器后，在GSM8K和MATH上超过GPT4。上传表格，分析表格文件，概述，绘制趋势图（调用maiplot），要求模型使用机器学习算法做预测（sklearn）。

开发了全链条的工具

2024年1月30日，OpenCompass2.0 司南大模型评测体系
- CompassRank：中立全面的性能榜单
- CompassKit：大模型评测全站工具链。
  - 数据污染检查
  - 更丰富的模型推理接入
  - 长文本能力评测
  - 中英文双语主观评测
- CompassHub：高质量评测基准社区
  - 希望构建大模型评测基准社区
OpenCompass助力大模型产业发展和学术研究，广泛应用于头部大模型企业和科研机构，获得Meta官方推荐
根据评测结果洞见未来，形成年度榜单综合性客观评价，语言、知识、推理、数学、代码、智能体。国内部分大模型已经接近GPT4水平，国内模型在中文场景有优势，开源社区未来可期。
- 整体能力仍有较大提升空间
- 复杂推理仍是短板
- “理科”能力和模型尺寸关联性高
- 模型主客观性能需综合参考

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/知新_RL/article/detail/370202