搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
知新_RL
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
oracle rebalance参数,Oracle10g ASM Auto IO Rebalance新特性
2
vue中将后台返回的数字转换成对应的文字
3
mac终端使用代理网络_mac终端代理命令
4
python综合实战案例-数据分析
5
调试linux内核模块_linux操作系统调整模块顺序怎么调
6
VMware虚拟机克隆ubuntu20.04系统IP相同_vmware克隆虚拟机后ip地址一样吗
7
前端面试总结(js基础篇)_前端面试 js 基础
8
ZYNQ初体验千兆以太网的那些事儿(ps端)_zynq千兆网口实验
9
人工智能多模态方向学习笔记-SHOW AND TELL算法_show and tell 模型实现
10
ModelSim小技巧,10.5_modelsim怎么变宽
当前位置:
article
> 正文
书生浦语大模型全链路开源体系-课程笔记
作者:知新_RL | 2024-04-06 06:04:08
赞
踩
书生浦语大模型全链路开源体系-课程笔记
书生浦语大模型全链路开源体系
以高质量开源赋能创新
大模型成为发展通用人工智能的重要途径
。
2021年之前是针对特定任务,一个模型解决一个问题(ImageNet竞赛2012、人脸识别2014、围棋比赛2016、AlphaFold2021)
最近两年在向通用大模型发展,一个模型应对多种任务、多种模态。
InternLM2 概述
书生浦语的开源历程
2023年6月7日InternLM开源
2024年1月17日InternLM2开源
书生浦语2.0(InternLM2)的体系
尺寸
模型基座(可塑性强)
多能力强化(推荐用于微调)
对话交互优化
7B 轻量化
InternLM2-Base
InternLM2
InternLM2-Chat
20B 综合能力强
InternLM2-Base
InternLM2
InternLM2-Chat
InternLM2:回归语言建模的本质
新一点
数据清洗
过滤技术
多维度数据价值评估
高质量预料驱动的数据富集
有针对性的数据补齐
InternLM2的主要亮点
超强的上下文
综合性能全面提升。代码、数学、推理、知识、语言、考试,20B的模型比肩GPT3.5。
优秀的对话和创作体验。想象力ok。
工具调用能力整体升级。日程安排。
突出的数理能力和实用的数据分析功能。高准确率,复杂运算和求解,加入代码解释器后,在GSM8K和MATH上超过GPT4。上传表格,分析表格文件,概述,绘制趋势图(调用maiplot),要求模型使用机器学习算法做预测(sklearn)。
从模型到应用
应用:智能客服、个人助手、行业应用
从模型到应用是有GAP的,需要一个复杂的流程
书生浦语全链条开源开放体系
开发了全链条的工具
数据
OpenDataLab:书生万卷1.0(2TB),书生万卷CC(400GB)
预训练
微调
XTuner开源框架
增量续训:新知识、垂直领域知识
有监督微调:可以降低微调成本
评测
2024年1月30日,
OpenCompass2.0
司南大模型评测体系
CompassRank:中立全面的性能榜单
CompassKit:大模型评测全站工具链。
数据污染检查
更丰富的模型推理接入
长文本能力评测
中英文双语主观评测
CompassHub:高质量评测基准社区
希望构建大模型评测基准社区
OpenCompass助力大模型产业发展和学术研究,广泛应用于头部大模型企业和科研机构,获得Meta官方推荐
根据评测结果洞见未来,形成年度榜单综合性客观评价,语言、知识、推理、数学、代码、智能体。国内部分大模型已经接近GPT4水平,国内模型在中文场景有优势,开源社区未来可期。
整体能力仍有较大提升空间
复杂推理仍是短板
“理科”能力和模型尺寸关联性高
模型主客观性能需综合参考
部署
LMDeploy
部署通常是模型上线环节的最后一个环节
LMDeploy在A100上的部署效率高于vLLM
智能体
轻量级智能体框架Lagent
有很多内置工具,可以直接使用,比如代码解数学题、零样本泛化
多模态智能体工具箱AgentLego,是一个工具集合。可以将语言模型拓展为多模态智能体。
封装了OpenMMLab,SD,SAM等等模型。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/知新_RL/article/detail/370202
推荐阅读
article
【虹科干货】长文预警!
使用
ntopng
和
NetFlow
/
IPFIX
检测
Dos
攻击
(上)...
本文深入研究了网络DoS
攻击
的现象,并介绍了如何利用
NetFlow
协议进行威胁
检测
和分析。通过
使用
工具如Ntopng和W...
赞
踩
article
Coursera自然语言处理专项课程02:
Natural
Language
Processing
w...
Autocorrect and Minimum Edit DistanceCoursera自然语言处理专项课程02:Na...
赞
踩
article
oracle
中
app
文件夹
下
,Oracle Form开发之
folder
(
文件夹
)功能开发(一)...
一、模板制作:YSFOLDER.FMB打开TEMPLATE.FMB,如果打开的是APPSTAND.FMB,以
下
步骤省略:...
赞
踩
article
计算机
mfc140
.
dll
文件
缺失
的
修复
方法分析,一键
修复
mfc140
.
dll
...
电脑显示
mfc140
.
dll
文件
缺失
信息时,不必担心,这通常是个容易解决的小问题。接下来让我们详细探究并解决
mfc140
...
赞
踩
article
AI
论文
速读 |
STG
-
LLM
大
语言
模型如何理解时空
数据
?_llm spatial
data
...
这篇
论文
介绍了
STG
-
LLM
(Spatial-Temporal Graph-Large Language Model),...
赞
踩
article
ClickHouse
CTO
空降中国开发者和用户沙龙,B站、
小红书
、
携程
、
阿里
云
携手分享ClickH...
3月25日,CSDN Cmeet系列技术沙龙第5期“
ClickHouse
中国开发者和用户沙龙”在上海举行。_
携程
林东煜
...
赞
踩
article
掌握
数字化
运维
方法
,构建
数字化
运维
体系
...
数字化
转型已经成为大势所趋,各行各业正朝着
数字化
方向转型,利用
数字化
转型
方法
论和前沿科学技术实现降本、提质、增效,从而提...
赞
踩
article
用真实数据告诉你前
10
大
AI
对话
工具
排行!(
国内
+国外篇)_
coze
和
讯飞
星火
...
用真实数据告诉你前
10
大
AI
对话
工具
排行!(
国内
+国外篇)_
coze
和
讯飞
星火
coze
和
讯飞
星火
...
赞
踩
article
如何申请
Telegram
机器人
|
推送
通知
...
利用
Telegram
机器人
推送
通知
,需要在环境变量填入正确的以及TG_USER_ID,以下教程简明阐述如何获取Token...
赞
踩
article
#AIGC##
LLM
##
RAG
#
RAG
:专补
LLM
s
短板_减少
LLM
幻觉并多
模态
/
RAG
技术
最新...
通过检索与生成目标相关
的
信息,来增强生成模型性能
的
技术
。弥补
LLM
s
“黑盒”导致
的
幻觉、信息来源单一、信息缺乏是时效性、...
赞
踩
article
YOLOv7
环境
配置
的一些细节_
cpu
训练
配置
yolo7
...
本文将介绍
YOLOv7
环境
配置
的方法与细节,以及gpu版本cuda的安装方法。_
cpu
训练
配置
yolo7
cpu
训练
配置
y...
赞
踩
article
Claude
注册
安装
教程【
403
Forbidden
】_
claude
无法
注册
...
claude
近期应该是没办法
安装
了,可能是因为近期挤进了太多了人,就像chatGPT一样,所以打算
注册
的可以等两天。_c...
赞
踩
article
[论文阅读笔记58]
Learning
from
Noisy
Labels
with
Deep
Neu...
1.题目
Learning
from
Noisy
Labels
with
Deep
Neural Networks: A ...
赞
踩
article
OpenCV
实战项目——多种
颜色
识别
_
opencv
颜色
识别
...
本专栏旨在学习记录
OpenCV
的各种基础知识和常用函数的用法,共八节基础内容已全部记录完毕。最后一篇文章将进入OpenC...
赞
踩
article
Python
爬虫
——基于
JWT
的
模拟
登录
爬取实战...
JWT
(Json Web Token)主要由三部分组成:Header, Payload, Signature
Python
...
赞
踩
article
(三)
PointPillars
论文
的
MMDetection3D
代码
解读
——
数据处理
篇_pointpi...
PointPillars
是一个来自工业界
的
模型,整体
的
思想是基于图片
的
处理框架,直接将点云从俯视图
的
视角划分为一个个
的
...
赞
踩
article
2024年最热门
的
十个
AI
对话
聊天
模型
网站_
ai
聊天
网站...
腾讯混元大
模型
是由腾讯全链路自研
的
通用大语言
模型
,拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大
的
中文理解...
赞
踩
article
毕业设计
选题-基于深度
学习
的
飞机
识别系统
python
机器
学习
CNN 机器视觉_pytorch ...
毕业设计
选题-基于深度
学习
的遥感图像
飞机
目标检测系统的
毕业设计
。该系统利用深度
学习
技术和计算机视觉方法,针对遥感图像中的...
赞
踩
article
【虹科干货】长文预警!
使用
ntopng
和
NetFlow
/
IPFIX
检测
Dos
攻击
(下)...
本文深入研究了网络DoS
攻击
的现象,并介绍了如何利用
NetFlow
协议进行威胁检测和分析。通过
使用
工具如Ntopng和W...
赞
踩
article
【
Spring
】
之
AOP
详解...
对
AOP
进行一个详细的介绍,并对起代理模式进行阐述,最后对
Spring
AOP
的源码进行分析。【
Spring
】
之
AOP
详解...
赞
踩
相关标签
网络
自然语言处理
人工智能
oracle中app文件夹下
dll文件
dll丢失
dll
电脑程序故障
语言模型
深度学习
大数据
论文阅读
数据挖掘
神经网络
阿里云
clickhouse
云计算
运维
数字化转型
PaaS
AIOps
CMDB
自动化
chatgpt
ai