搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
盐析白兔
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
数字支付中的5G技术:未来会有哪些新的变化_5g支付
2
2024年最新接口自动化测试:Postman实战教程_postman接口自动化,墙都不扶就服你
3
AI视频风格转换动漫风:Stable Diffusion+TemporalKit_stable diffusion中temporalkit
4
微信小程序读取NFC-MifareClassic1K卡-M1卡详解_微信小程序支持的nfc卡片有哪些
5
2024年最新远程控制软件
6
联邦学习之路_跨设备联邦学习
7
如何降低海康、大华等网络摄像头调用的高延迟问题(一):海康威视网络摄像头的python sdk使用(opencv读取sdk流)_python低延迟播放网络视频流
8
Communication-Efficient On-Device Machine Learning: Federated Distillation and Augmentation 论文笔记_fedfa: federated learning with feature anchors to
9
个人怎么做独立站Shopify商店!Shopify建站教程详解!(实操干货)_shopify独立站
10
Java重点原理精炼(免费版)
当前位置:
article
> 正文
总结:大模型技术栈_技术博客 大模型
作者:盐析白兔 | 2024-05-15 15:35:31
赞
踩
技术博客 大模型
原文地址:
大模型技术栈
第一部分:算法与原理
第一章 概览与前置任务
tokenizer训练
tokenizer原理与算法:BPE,ByteBPE,wordpiece,unilm,sentence-piece
tokenizer训练:sentence-piece
position encoding方案
Alibi
RoPE
注意力机制与transformer架构
典型的自注意力机制
其他注意力机制
Mamba,H3,Hyena,RetNet,RWKV,Linear attention,Sparse attention
典型的transformer架构
decoder-only
encoder-only
encoder-decoder
第二章 训练
预训练
lm训练配置
正则化方法
激活函数
优化器
SFT训练
强化学习
Police-Based
Value-Based
Actor-Critic
RLHF训练
其他指令对齐训练
分布式并行训练技术
模型并行
tensor parellelism
序列并行
pipeline parellelism
GPipe,1F1B,interleaved 1F1B
数据并行
DP,DDP,FSDP,ZeRO
MoE
PEFT训练
Adapter类
Prompt类
LoRA类
上下文扩展技术
window attention
注意力缩放
streaming-llm(Streaming LLM那个保留开头几个token的思想,印象中hansong在他MIT公开课讲大模型剪枝时提到了他们研究的一篇论文,大意就是开头几个token注意力权重始终很高,保留了一些全局重要信息;随着序列推理长度增加,保留开头和当前时间步近处的token,剪枝掉中间也能保住模型性能)
RoPE改进
Alibi
第三章 推理
压缩
剪枝
量化
校准量化
GPTQ
AWQ
SmoothQuant
SpQR
非校准量化
LLM.int8
ZeroQuant
显存优化技术
pagedattention
quantized kv cache
mqa/gqa
flash-attention
flash-attention-v2
flash-attention-decoding
调度优化技术
dynamic batching
async serving
continuous/interative-level batching
sarathi/fastgen
请求优化技术
网络通信优化
响应模式优化
采样及解码加速
speculative decoding
specinfer
medusa
blockwise parallel decoding
SOT-parallel decoding
推理中的模型并行策略
TP,PP
算子融合及其他优化:no padding,高性能算子...
第四章 应用
RAG
RAG的基本组件
DocLoader
TextSplitter
向量数据库
索引:NSW,NSG,HNSW,DiskAnn,LSH,IVF
embedding模型
RAG增强训练
self-rag
Chain-of-Note
RAG优化
NL2Cypher
NL2SQL
文本检索
embedding训练
reranker
Agent
Agent基本组件
Planning
Reflection
Memory
Tool Use
Agent对齐微调
Toolformer
TALM
Chain of Hindsight
Algorthm Distillation
Agent框架
ReAct
Relfexion
Prompt Engineering
CoT,ToT,GoT
第二部分:框架
训练框架
deepspeed
megatron-lm
colossal-ai
trlx,deepspeed-chat,colossal-chat
推理服务框架
FastChat
llama-cpp
LMDeploy
推理加速框架
vllm
text-generation-inference
lit-llama
lightllm
TensorRT-LLM(原FasterTransformer)
fastllm
inferllm
openPPL-LLM
deepspeed-fastgen
exllama
压缩框架
bitsandbytes
auto-gptq
auto-awq
embedding训练框架
sentence-transformer
FlagEmbedding
向量数据库对比
向量数据库
faiss
pgvector
milvus
pinecone
weaviate
LanceDB
Chroma
应用框架
Auto-GPT
langchain
llama-index
quivr
XAgent
MetaGPT
Autogen
AutoGen 是一个支持使用多个代理来开发 LLM 应用程序的框架,这些代理可以相互对话来解决任务。 AutoGen 代理是可定制的、可对话的,并且无缝地允许人类参与。 他们可以采用LLM、人力投入和工具组合的各种模式运作。
chameleon
Chameleon的核心在于通过LLM规划器生成自然语言程序,找到最佳工具组合,以达到精确推理的目的。该框架在科学问答任务和表格数学推理任务上表现卓越,特别是在表格数学推理任务上,准确率达到了惊人的98.78%。其工具箱支持LLM模型、视觉模型、网络搜索引擎、Python函数以及基于规则的模块,实现了多种工具之间的自然语言通信。相较于现有工作,Chameleon模型允许以类似自然语言的方式生成不同工具的调用组合,无需复杂的程序设计,增加了用户友好性。
python前端
streamlit
gradio
第三部分:开源模型
Embedding模型
m3e
GTE
Sentence-T5
Instructor
bge
gte
大语言模型
chatglm
Baichuan
Qwen
Mistra
Llama
InternLM
Yi
deepseek
skywork
多模态模型
BLIP
BLIP2
CLIP
LLaVA
CogGLM
InstructBLIP
代码大模型
code-llama
deepseek coder
wizardcoder
codefuse
综述
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/盐析白兔/article/detail/573594
推荐阅读
article
安卓
讲课笔记
1.4
安卓
平台
架构
_手机
平台
架构
...
1. 了解
安卓
平台
架构
2. 熟悉
安卓
设备文件浏览器3. 会使用
安卓
调试桥_手机
平台
架构
手机
平台
架构
...
赞
踩
article
一份来自心灵的拷问和记叙——
字节
跳动
测试
工程师
一面_
字节
跳动
面试
文化
不
契合...
2019年3月30日,我参加了
字节
跳动
校招有关
测试
工程师
的
面试
。结果
不
出所料,第一面被挂。现在我内心的想法更多的是,大学...
赞
踩
article
麒麟
系统
硬盘
挂载
教程_银河
麒麟
系统
挂载
硬盘
...
将/dev/sdb1
挂载
到/app:sudo mount /dev/sdb1 /app。
系统
版本:Kylin-Deskt...
赞
踩
article
JAVA
中的
final
修饰
符_
final
修饰
数组变量...
文章目录前言1.
final
修饰
变量1.1
final
修饰
成员变量1.2
final
修饰
局部变量1.1
final
修饰
基本...
赞
踩
article
学习 | 文献通读《
基于
LDA
的
游客
网络
评论
主题
分类
:以故宫为例》_
lda
景区
评论
...
基于
LDA
的
游客
网络
评论
主题
分类
:以故宫为例
基于
LDA
的
主题
发现模型;【关注问题】
主题
及情感倾向;关键词
LDA
游客
...
赞
踩
article
求一个
数
组
中
第
k
大
的
数
,
要求
不能
另外申请空间
,
数
组
顺序
不能
被改变_寻找
数
组
中
第
k
大
的
数
不允许排序...
这是一道今日头条
的
面试题
,
当面试官提出这样一道题目时。我想相信
,
大
多
数
人都会这样反应1.是不是可以先排一下序
,
然后再求
第
...
赞
踩
article
keras
添加
L1
正则
化
,L2
正则
化
和
Dropout
正则
化
及其原理_
keras
正则
化
...
一、什么是
正则
化
,用来干嘛的?
正则
化
(regularization),是指在线性代数理论中,不适定问题通常是由一组线性代...
赞
踩
article
转转小
程序
数据处理
...
转转、数据采集、数据分析、数据库、小
程序
转转小
程序
数据处理
声明 本文章中所有内容仅供学习交流使...
赞
踩
article
科研
常用
的
几个
搜索引擎
_常用
文献
搜索引擎
...
1,http://scholar.google.com/这个不多讲了.2,http://qns.cc/后起之秀,
科研
人员...
赞
踩
article
Ardupilot
学习
笔记...
小白入门
Ardupilot
_ardupilotardupilot ...
赞
踩
article
鸿蒙
内核
源码分析(
Shell
编辑篇) |
两个
任务
,三个阶段...
从用户视角看,shell是用户窥视和操作
内核
的一个窗口,
内核
并非铁板一块,对应用层开了
两个
窗口,一个是系统调用,一个就是...
赞
踩
article
TinyBox
.js插件在页面上实现超简单的图片、
iframe
、
ajax
弹出层_
tiny
.
box
.s...
TinyBox
已经存在很久了,一直用保存下来的版本,突然发现它升级到2.0了,新增了许多新功能,但是大小依然在5KB左右...
赞
踩
article
L1
正则
化
与
L2
正则
化
_
l1
和
l2
正则
化
分别应用
于
什么场合...
【注】部分图片来源
于
吴恩达老师课程。一、
正则
化
使用场景 如果你的网络过度拟合了数据,即存在高方差问题,那么首先应该想到...
赞
踩
article
盘点3种
Python
爬虫
中文
乱码
的处理
方法
_
网页
源代码
里面是
乱码
爬取怎么...
本文针对
Python
网络爬虫过程中的
中文
乱码
问题,给出了3种
乱码
解决
方法
,顺利解决了问题。你还知道有哪些
乱码
的情况和处理...
赞
踩
article
Web
攻防系列教程之 PHP + My
sql
注入
攻防实战_设计
php
+my
sql
带有
sql
注入
漏洞
w...
随着
Web
应用的高速发展和技术的不断成熟,对
Web
开发相关职位的需求量也越来越大,越来越多的人加入了
Web
开发的行列。但...
赞
踩
article
Docker
中无法使用
systemctl
_
centos7docker
为什么
没有
systemctl
服...
docker容器无法使用
systemctl
命令
_
centos7docker
为什么
没有
systemctl
服务centos...
赞
踩
article
openGL
之
API
学习(一五五)
glsl
中
mod
的
奇怪
结果
...
mod
(2048,10)
的
结果
为8
mod
(2049,10)
的
结果
为0
openGL
之
API
学习(一五五)
glsl
中
mod
的
...
赞
踩
article
都
在
用
高级
孟德尔
随机化
方法
了
!|
孟德尔
随机化
周报...
欢迎报名!
孟德尔
随机化
课程,入门到高级,郑老师团队主讲,一个月搞定,快速发表论文!
孟德尔
随机化
,Mendilian Ra...
赞
踩
article
尚
硅谷
_
vue
核心基础部分_
尚
硅谷
vue
csdn...
vue
基础_
尚
硅谷
vue
csdn
尚
硅谷
vue
csdn 01 初始...
赞
踩
article
ov5640
图像
采集
及hdmi显示,
verilog
代码实现
OV5640
摄像头
采集
图像
,通过
AXI4
总...
在我们的实现中,我们将使用1280x1024的分辨率来适配
OV5640
采集
到的
图像
数据。该系统将
采集
并存储
OV5640
摄...
赞
踩
相关标签
设备文件浏览器
安卓调试桥
字节跳动
测试工程师
软件需求
自然语言处理
情感分析
神经网络
机器学习
人工智能
深度学习
计算机视觉
小程序
爬虫
逆向
python
数据分析
数据库
java
搜索引擎
google
search
游戏
生物