搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
繁依Fanyi0
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
有趣的github项目_腾讯云cos基于minos
2
牛客ACM模式-自己写输入输出
3
代码随想录算法训练营day44
4
程序员35岁会失业吗?_程序员35岁失业是真的吗
5
基于GSP工具箱的NILM算法matlab仿真
6
PEE是什么_pee是指
7
深度强化学习在天基信息网络中的应用——现状与前景_卫星缓存 ddpg
8
docker 中配置网易镜像_docker 163镜像
9
使用ChromeDriver和Selenium禁用下载_python selenium 谷歌浏览器禁止下载文件
10
前端如何单独做虚拟奖金池?
当前位置:
article
> 正文
总结:大模型技术栈_大模型前后端部署使用的技术栈
作者:繁依Fanyi0 | 2024-04-19 23:10:06
赞
踩
大模型前后端部署使用的技术栈
原文地址:
大模型技术栈
第一部分:算法与原理
第一章 概览与前置任务
tokenizer训练
tokenizer原理与算法:BPE,ByteBPE,wordpiece,unilm,sentence-piece
tokenizer训练:sentence-piece
position encoding方案
Alibi
RoPE
注意力机制与transformer架构
典型的自注意力机制
其他注意力机制
Mamba,H3,Hyena,RetNet,RWKV,Linear attention,Sparse attention
典型的transformer架构
decoder-only
encoder-only
encoder-decoder
第二章 训练
预训练
lm训练配置
正则化方法
激活函数
优化器
SFT训练
强化学习
Police-Based
Value-Based
Actor-Critic
RLHF训练
其他指令对齐训练
分布式并行训练技术
模型并行
tensor parellelism
序列并行
pipeline parellelism
GPipe,1F1B,interleaved 1F1B
数据并行
DP,DDP,FSDP,ZeRO
MoE
PEFT训练
Adapter类
Prompt类
LoRA类
上下文扩展技术
window attention
注意力缩放
streaming-llm(Streaming LLM那个保留开头几个token的思想,印象中hansong在他MIT公开课讲大模型剪枝时提到了他们研究的一篇论文,大意就是开头几个token注意力权重始终很高,保留了一些全局重要信息;随着序列推理长度增加,保留开头和当前时间步近处的token,剪枝掉中间也能保住模型性能)
RoPE改进
Alibi
第三章 推理
压缩
剪枝
量化
校准量化
GPTQ
AWQ
SmoothQuant
SpQR
非校准量化
LLM.int8
ZeroQuant
显存优化技术
pagedattention
quantized kv cache
mqa/gqa
flash-attention
flash-attention-v2
flash-attention-decoding
调度优化技术
dynamic batching
async serving
continuous/interative-level batching
sarathi/fastgen
请求优化技术
网络通信优化
响应模式优化
采样及解码加速
speculative decoding
specinfer
medusa
blockwise parallel decoding
SOT-parallel decoding
推理中的模型并行策略
TP,PP
算子融合及其他优化:no padding,高性能算子...
第四章 应用
RAG
RAG的基本组件
DocLoader
TextSplitter
向量数据库
索引:NSW,NSG,HNSW,DiskAnn,LSH,IVF
embedding模型
RAG增强训练
self-rag
Chain-of-Note
RAG优化
NL2Cypher
NL2SQL
文本检索
embedding训练
reranker
Agent
Agent基本组件
Planning
Reflection
Memory
Tool Use
Agent对齐微调
Toolformer
TALM
Chain of Hindsight
Algorthm Distillation
Agent框架
ReAct
Relfexion
Prompt Engineering
CoT,ToT,GoT
第二部分:框架
训练框架
deepspeed
megatron-lm
colossal-ai
trlx,deepspeed-chat,colossal-chat
推理服务框架
FastChat
llama-cpp
LMDeploy
推理加速框架
vllm
text-generation-inference
lit-llama
lightllm
TensorRT-LLM(原FasterTransformer)
fastllm
inferllm
openPPL-LLM
deepspeed-fastgen
exllama
压缩框架
bitsandbytes
auto-gptq
auto-awq
embedding训练框架
sentence-transformer
FlagEmbedding
向量数据库对比
向量数据库
faiss
pgvector
milvus
pinecone
weaviate
LanceDB
Chroma
应用框架
Auto-GPT
langchain
llama-index
quivr
XAgent
MetaGPT
Autogen
AutoGen 是一个支持使用多个代理来开发 LLM 应用程序的框架,这些代理可以相互对话来解决任务。 AutoGen 代理是可定制的、可对话的,并且无缝地允许人类参与。 他们可以采用LLM、人力投入和工具组合的各种模式运作。
chameleon
Chameleon的核心在于通过LLM规划器生成自然语言程序,找到最佳工具组合,以达到精确推理的目的。该框架在科学问答任务和表格数学推理任务上表现卓越,特别是在表格数学推理任务上,准确率达到了惊人的98.78%。其工具箱支持LLM模型、视觉模型、网络搜索引擎、Python函数以及基于规则的模块,实现了多种工具之间的自然语言通信。相较于现有工作,Chameleon模型允许以类似自然语言的方式生成不同工具的调用组合,无需复杂的程序设计,增加了用户友好性。
python前端
streamlit
gradio
第三部分:开源模型
Embedding模型
m3e
GTE
Sentence-T5
Instructor
bge
gte
大语言模型
chatglm
Baichuan
Qwen
Mistra
Llama
InternLM
Yi
deepseek
skywork
多模态模型
BLIP
BLIP2
CLIP
LLaVA
CogGLM
InstructBLIP
代码大模型
code-llama
deepseek coder
wizardcoder
codefuse
综述
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/454089
推荐阅读
article
Flink
原理——
任务调度
原理_
flink
任务调度
原理...
原文链接:https://mp.toutiao.com/profile_v4/graphic/preview?pgc_i...
赞
踩
article
智谱
推出
新一代
基座
大
模型
GLM
-4_
智谱
glm
...
今天
智谱
推出
新一代
基座
大
模型
GLM
-4。
新一代
基座
大
模型
GLM
-4,整体性能相比
GLM
3全面提升60%,逼近GPT-4;...
赞
踩
article
微信
提供了多个
人工
智能
功能
,其中包括
微信
AI
语音
转
文字
同步翻译
功能
和
微信
AI
助手_
微信
aⅰ
智能
...
根据提供的引用内容,
微信
并没有提供公开的
语音
识别API,因此无法直接使用
微信
AI
语音
转
文字
同步翻译
功能
。请注意,上述代码...
赞
踩
article
55道
软件
测试
精品
面试题
分享!内附答案!_
项目
进度紧张
,
需求
不规范
,
如何
测试
...
看完有收获,记得点个赞喔!_
项目
进度紧张
,
需求
不规范
,
如何
测试
项目
进度紧张
,
需求
不规范
,
如何
测试
...
赞
踩
article
如何彻底
卸载
MySQL
并重
装
_
mysql
卸载
重
装
...
(1)鼠标右击此电脑--> 点击管理(2)打开“计算机管理”界面,点击“服务和应用程序” --> 服务 --> MySQ...
赞
踩
article
Java
-常见
面试题
-集合-总结_
java
map
面试题
...
为了能让 HashMap 存取高效,尽量较少碰撞,也就是要尽量把数据分配均匀。我们上面也讲到了过了,Hash 值的范围值...
赞
踩
article
python
+
TensorFlow
实现
人脸识别
智能小程序的项目(包含
TensorFlow
版本
与Pyt...
python
+
TensorFlow
实现
人脸识别
智能小程序的项目(包含
TensorFlow
版本
与
Pytorch
版本
)(二)...
赞
踩
article
PySpark
简介
、
搭建以及
使用
...
一
、
PySparj简介
使用
场景大数据处理或机器学习时的原型( prototype)开发验证算法执行效率可能不高要求能够快...
赞
踩
article
程序员
刚进
公司
很
不适应5
个
建议让
你
度过焦虑期_新手
程序员
入职
很
难熬...
这
个
时候
你
就别傻不愣登的就跑过去。找人的话
你
要看一下别人的一
个
状态。然后它的核心表的就是生产表的数据。就是
你
可以加速跟同...
赞
踩
article
【大数据
Hive
】
hive
多字段
分隔符
使用
详解
_
hive
常用
分隔符
...
hive
多字段
分隔符
使用
详解
_
hive
常用
分隔符
hive
常用
分隔符
目录 一、前言 二、h...
赞
踩
article
专业
AI
绘画
生成器
国内就
能
用
_
startai
邀请码...
AI
绘画
生成器
已经成为了许多设计师手头必备的工具之一,消耗时间短,出图效果好,
能
够为设计师节省许多精力。但是打开搜索之后...
赞
踩
article
Amuse
:.NET application
for
stable
diffusion
...
.NET application
for
stable
diffusion
, Leveraging OnnxStack,...
赞
踩
article
App
自动化
测试之
App
ium
环境
搭建保姆级教程(全网最全)_
windows
安装
appium
的详...
APP
自动化
测试运行
环境
比较复杂,稍微不注意
安装
就会失败。我见过不少朋友,装了1个星期,
App
ium
的运行
环境
还没有搭...
赞
踩
article
员工
跳槽
,
你
怎么
办?_
员工
跳槽
有
信心危机
怎么
解决...
员工
跳槽
,
你
怎么
办? 江洪明 2007-03-21 您是第1491位阅读者页面文字: [小] [中] [大]由于劳动力市...
赞
踩
article
深度
学习
概念...
AIGC在生成小图片时效果更佳(因为小图信息量更少,相同算力下效果更好);所以适合构造一些交通场景。比如护栏损坏:只ma...
赞
踩
article
写
代码
的
修养...
代码
的
修养写
代码
的
修养 看山是山,看水是水 此境界 对业务
的
思考是浅层
的
,
代码
写
的
不通用,扩展性...
赞
踩
article
YOLOv8
基础环境搭建
cuda
+
anaconda
+
pytorch
+
pycharm
_opencv y...
首先安装NVIDIA gpu的电脑安装显卡驱动,如果安装过了,或者想使用cpu的,可以跳过这一步。打开cmd,输入nvi...
赞
踩
article
13.
Appium
+
python
自动化
-
Appium
Desktop
介绍...
Appium
Desktop
是一款用于Mac、Windows和Linux的开源应用,它提供了
Appium
自动化
服务器在一...
赞
踩
article
Leetcode
hot100
刷题
记录
(
python
)...
【代码】
Leetcode
hot100
刷题
记录
(
python
)
Leetcode
hot100
刷题
记录
(pytho...
赞
踩
article
Lattice
Diamond
3.12下载与
安装
(免费获取
license
.dat)_
lattice
...
本文旨在提供一片完整细致的
Lattice
下载、
安装
与激活教程,希望对大家有用!!!_
lattice
diamond
安装
教...
赞
踩
相关标签
flink
spark
多模态大模型
人工智能
LLM
大模型
计算机视觉
软件测试
面试
面试题
程序人生
测试工程师
mysql
数据库
windows
java
开发语言
Map
集合
python
tensorflow
pytorch
大数据
职场和发展
经验分享