搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
繁依Fanyi0
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
GIt系列(二)忽略文件(.gitignore)
2
IntelliJ IDEA使用Alibaba Java Coding Guidelines编码规约扫描插件_阿里巴巴规约插件
3
【Python从零到壹】用Python实现植物大战僵尸里的面向对象
4
Python实现VRP常见求解算法——遗传算法(GA)_遗传算法求解vrptw python
5
Win11家庭版怎么开启远程桌面_win11家庭版远程桌面怎么打开
6
django框架对于templates的模板文件,如何调用其他静态文件,如css,js或加载图片。以及静态文件找不到的问题日志报[log.py:224] [log:log_response]的解决
7
远程连接postgresql “postgres“, no encryption pg hba.conf_no encryption pg_hba.conf
8
天梯赛-L2-042 老板的作息表_天梯赛老板休息表
9
Java研学-RBAC权限控制(三)
10
薪资幅度上涨70%,外包翻身,拿下美团点评L8级技术专家岗(面经+心得)_美团产品l8薪资
当前位置:
article
> 正文
总结:大模型技术栈_大模型前后端部署使用的技术栈
作者:繁依Fanyi0 | 2024-04-19 23:10:06
赞
踩
大模型前后端部署使用的技术栈
原文地址:
大模型技术栈
第一部分:算法与原理
第一章 概览与前置任务
tokenizer训练
tokenizer原理与算法:BPE,ByteBPE,wordpiece,unilm,sentence-piece
tokenizer训练:sentence-piece
position encoding方案
Alibi
RoPE
注意力机制与transformer架构
典型的自注意力机制
其他注意力机制
Mamba,H3,Hyena,RetNet,RWKV,Linear attention,Sparse attention
典型的transformer架构
decoder-only
encoder-only
encoder-decoder
第二章 训练
预训练
lm训练配置
正则化方法
激活函数
优化器
SFT训练
强化学习
Police-Based
Value-Based
Actor-Critic
RLHF训练
其他指令对齐训练
分布式并行训练技术
模型并行
tensor parellelism
序列并行
pipeline parellelism
GPipe,1F1B,interleaved 1F1B
数据并行
DP,DDP,FSDP,ZeRO
MoE
PEFT训练
Adapter类
Prompt类
LoRA类
上下文扩展技术
window attention
注意力缩放
streaming-llm(Streaming LLM那个保留开头几个token的思想,印象中hansong在他MIT公开课讲大模型剪枝时提到了他们研究的一篇论文,大意就是开头几个token注意力权重始终很高,保留了一些全局重要信息;随着序列推理长度增加,保留开头和当前时间步近处的token,剪枝掉中间也能保住模型性能)
RoPE改进
Alibi
第三章 推理
压缩
剪枝
量化
校准量化
GPTQ
AWQ
SmoothQuant
SpQR
非校准量化
LLM.int8
ZeroQuant
显存优化技术
pagedattention
quantized kv cache
mqa/gqa
flash-attention
flash-attention-v2
flash-attention-decoding
调度优化技术
dynamic batching
async serving
continuous/interative-level batching
sarathi/fastgen
请求优化技术
网络通信优化
响应模式优化
采样及解码加速
speculative decoding
specinfer
medusa
blockwise parallel decoding
SOT-parallel decoding
推理中的模型并行策略
TP,PP
算子融合及其他优化:no padding,高性能算子...
第四章 应用
RAG
RAG的基本组件
DocLoader
TextSplitter
向量数据库
索引:NSW,NSG,HNSW,DiskAnn,LSH,IVF
embedding模型
RAG增强训练
self-rag
Chain-of-Note
RAG优化
NL2Cypher
NL2SQL
文本检索
embedding训练
reranker
Agent
Agent基本组件
Planning
Reflection
Memory
Tool Use
Agent对齐微调
Toolformer
TALM
Chain of Hindsight
Algorthm Distillation
Agent框架
ReAct
Relfexion
Prompt Engineering
CoT,ToT,GoT
第二部分:框架
训练框架
deepspeed
megatron-lm
colossal-ai
trlx,deepspeed-chat,colossal-chat
推理服务框架
FastChat
llama-cpp
LMDeploy
推理加速框架
vllm
text-generation-inference
lit-llama
lightllm
TensorRT-LLM(原FasterTransformer)
fastllm
inferllm
openPPL-LLM
deepspeed-fastgen
exllama
压缩框架
bitsandbytes
auto-gptq
auto-awq
embedding训练框架
sentence-transformer
FlagEmbedding
向量数据库对比
向量数据库
faiss
pgvector
milvus
pinecone
weaviate
LanceDB
Chroma
应用框架
Auto-GPT
langchain
llama-index
quivr
XAgent
MetaGPT
Autogen
AutoGen 是一个支持使用多个代理来开发 LLM 应用程序的框架,这些代理可以相互对话来解决任务。 AutoGen 代理是可定制的、可对话的,并且无缝地允许人类参与。 他们可以采用LLM、人力投入和工具组合的各种模式运作。
chameleon
Chameleon的核心在于通过LLM规划器生成自然语言程序,找到最佳工具组合,以达到精确推理的目的。该框架在科学问答任务和表格数学推理任务上表现卓越,特别是在表格数学推理任务上,准确率达到了惊人的98.78%。其工具箱支持LLM模型、视觉模型、网络搜索引擎、Python函数以及基于规则的模块,实现了多种工具之间的自然语言通信。相较于现有工作,Chameleon模型允许以类似自然语言的方式生成不同工具的调用组合,无需复杂的程序设计,增加了用户友好性。
python前端
streamlit
gradio
第三部分:开源模型
Embedding模型
m3e
GTE
Sentence-T5
Instructor
bge
gte
大语言模型
chatglm
Baichuan
Qwen
Mistra
Llama
InternLM
Yi
deepseek
skywork
多模态模型
BLIP
BLIP2
CLIP
LLaVA
CogGLM
InstructBLIP
代码大模型
code-llama
deepseek coder
wizardcoder
codefuse
综述
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/454089
推荐阅读
article
Stable
-
diffusion
-
webui
本地部署和简要介绍_
debian
安装
stable
dif...
讲解如何在本地部署
Stable
-Diffusion-WebUI,以及简要介绍WebUI上提供的主要功能_
debian
安装
...
赞
踩
article
Java
装箱拆箱和重载重写(五)_
integer
i1
=
40
;
integer
i2
=
40
;
相...
1.什么是装箱?什么是拆箱?学习地址装箱就是 自动将基本数据类型转换为包装器类型;拆箱就是 自动将包装器类型转换为基本数...
赞
踩
article
redis
的客户端连接的
可视化
管理
工具
_
redis
连接
工具
...
Redis的客户端连接的
可视化
管理
工具
_
redis
连接
工具
redis
连接
工具
...
赞
踩
article
自动化
测试
分类及优劣势总结_
自动化
测试
优点
和
缺点
...
总结一下
自动化
测试
的分类。
自动化
测试
一般分为以下三类:基于代码的
自动化
测试
,基于界面的
自动化
测试
,协议级
自动化
测试
。_自...
赞
踩
article
iperf3
网络带宽
性能测试工具...
iperf3
网络测试工具Iperf 是一款基于TCP/IP和UDP/IP的网络性能测试工具。可以用来测试
网络带宽
和网络质...
赞
踩
article
Docke
容器间通信:
SpringBoot
项目构建
Docke
r镜像Run时一直提示我数据库拒绝连接?...
SpringBoot
项目构建的
Docke
r镜像。
Docke
r中跑了Redis和Mysql。在Run项目镜像时一直报错,提...
赞
踩
article
Pycharm
设置
文件
头
模板
_
文件
头部
模板
设置
...
1.
设置
路径
文件
—>
设置
—> 编辑器 —>
文件
和代码
模板
—> 在
文件
中选择 python Script2.常用...
赞
踩
article
py
thon
安装
setup
安装
目录
_
py
thon
setup
.
py
配置来在自定义
目录
中
安装
文件...
我想创建一个
setup
.
py
,它将我的文件
安装
到自定义
目录
中.我有一个前缀,我想得到以下结果:/my/prefix/bi...
赞
踩
article
Error: Could not
open
client
transport
with JDBC U...
在hive目录下使用beeline命令:bin/beeline -u
jdbc
:
hive2
://
hadoop102
:10...
赞
踩
article
如何将
ChatGPT
接入
微信
、
QQ
、
钉钉等聊天
应用
| 教程和源码分享_
csdn
私信
接入
chatgp...
将
ChatGPT
、
必应
、
文心一言
、
谷歌Bard 等对话模型连接各类
应用
,如
微信
、
公众号
、
QQ
、
Telegram
、
Gma...
赞
踩
article
AI
智能如何
搭建
服务器
_
搭建
ai
服务器
...
3. 安装
AI
框架和库:根据具体的需求,选择合适的
AI
框架和库,如TensorFlow、PyTorch等,并进行安装和配...
赞
踩
article
Java
Lock
和Synchronized区别...
一:java.util.concurrent.locks包下常用的类与接口(lock是jdk 1.5后新增的) (1)...
赞
踩
article
STM32F1XX
实现
sin
函数
PWM输出代码_
stm32
sin
函数
...
【代码】
STM32F1XX
实现
sin
函数
PWM输出代码。_
stm32
sin
函数
stm32
sin
函数
...
赞
踩
article
python
tips003
——
DataLoader
的
collate
_
fn
参数使用详解...
背景最近在看sentences-transformers
的
源码,在有一个模块发现了dataloader.
collate
_...
赞
踩
article
2023 超详细
Git
和
IDEA
如何
建立联系
教程说明 【含
视频
教学说明】_2023 ide...
大学时代刚开始接触编程、环境安装是第一步也是比较繁琐的一步,大部分同学可能因为找不到合适的安装包和安装教程、导致安装失败...
赞
踩
article
【
人工智能
】
GPU
、
CPU
和
TPU
之间
的
区别_
cpu
、
tpu
...
GPU
(Graphics Processing Unit)是一种专门为图形处理设计
的
处理器。它具有大量并行计算单元,非常...
赞
踩
article
pytorch
优化器
调度
器_
神经网络
训练
中的
scheduler
...
通常,优化器
调度
器作为一个单独的对象与优化器一起使用,每个优化器
调度
器都有自己的超参数和更新规则。动量调整优化器:这种优...
赞
踩
article
智能
体
/
Agent
概念详解_
智能
体
agent
...
MetaGPT是一个多
智能
体
协作框架,将标准化操作(SOP) 程序编码为提示确保解决问题时采用结构化方法。要求
智能
体
以专...
赞
踩
article
使用
idea
连接
gitee
(
码云
)_
idea
登录
gitee
...
在公司和家里提交代码很费劲,所以就学习了一下将项目从git传入
码云
.1.首先下载git安装完成后,在开始菜单里找到“Gi...
赞
踩
article
如何实现搭建
JMeter
+
Jenkins
+
Ant
持续
化
?_
jemeter
+
ant
+jen...
2023最新自动
化
测试自学教程新手小白26天入门最详细教程,目前已有300多人通过学习这套教程入职大厂!!_哔哩哔哩_b...
赞
踩
相关标签
大模型
redis
自动化测试
白盒测试
界面
测试
linux
网络
数据库
spring boot
docker
pycharm
python安装setup安装目录
hive
php
git
github
系统架构
服务器
锁
stm32
javascript
前端
python