搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
Li_阴宅
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
Spark、RDD、Hive 、Hadoop-Hive 和传统关系型数据库区别_hadoop spark hive
2
爬虫是后端吗_前端有架构吗?
3
Windows应急响应0基础讲解国赛信安管理与评估二阶段_信息安全国赛 应急响应环境
4
java 堆外内存是什么_深入理解堆外内存 Metaspace
5
Inpaint-Anything_inpaint anything模型下载
6
Python3常用代码块汇总_python3代码大全
7
DP 滑雪(记忆化搜索)_1280:【例9.24】滑雪
8
如何理解深度学习在人工智能发展中的地位_深度学习的地位
9
Python自动化测试_python自动化检测
10
Kafka分区管理(优先副本的选举、分区重新分配)_kafka重新分区流程
当前位置:
article
> 正文
大模型基本知识
作者:Li_阴宅 | 2024-08-20 01:15:17
赞
踩
大模型基本知识
1. 大模型资源站
github:
https://github.com/
魔塔:
modelscpace.cn
2. 大模型
架构
公共底座:transformer
Encoder-Decoder架构:
T5 - NLG
ChatLM - NLG
Encoder-Only架构:
BERT:NLU
模型:
https://modelscope.cn/models/iic/nlp_bert_backbone_base_std/summary
论文:
https://arxiv.org/pdf/1810.04805
GLM:
论文:
https://arxiv.org/pdf/2103.10360
模型:
https://modelscope.cn/models/ZhipuAI/chatglm3-6b/summary
中国唯一一家具有 OpenAI 气质的公司
天才般的设计
ChatGLM3 6b
Decoder-Only架构:
剩下的所有LLM大模型
LLaMA的儿孙模型
Llama3:
模型:
魔搭社区
QWen:
QWen1.5-0.5B-Chat:
魔搭社区
Phi:
魔搭社区
3. 模型预训练、微调
模型预训练:
各大模型都会提供自身的预训练代码和微调数据格式和代码
公共预训练微调框架:
llama-factory
4. 高性能部署
vLLM
OpenAI API
LMStudio 高性能推理
llama.cpp
5. 工程落地
LangChain
RAG(检索增强生成)
Agent(智能体)
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/Li_阴宅/article/detail/1004461
推荐阅读
article
【
数据分析
】
统计学
基础及
Python
具体实现
_
经济
统计学
python
...
统计学
概述个人大佬的,将是我成长路上阿川水平有限,如,欢迎大佬。
_
经济
统计学
python
经济
统计学
python
...
赞
踩
article
51
单片机
嵌入式开发:21、
STC89C52R
控制
抢答器
+
数码管
+后台显示+
LCD1602x
显示_s...
该项目旨在利用
STC89C52R
单片机
构建一个多功能
抢答器
显示系统,涵盖
LCD1602x
显示屏、
数码管
和后台数码显示器。...
赞
踩
article
python
时间
,
日期
,
时间
戳
处理_
python
时间
错...
1.将字符串的
时间
转换为
时间
戳
方法: a = "2013-10-10 23:40:00" 将其转换为
时间
数组 i...
赞
踩
article
线程
的
创建
(
线程
池
)_
线程
池
创建
线程
...
本文详细探讨了Java
线程
池
的
创建
与使用,包括
线程
池
的
四大核心参数、五种常见
线程
池
的
适应场景及其优缺点。强调了
线程
池
在资...
赞
踩
article
Github
2024-04-29
开源
项目
周报
Top15
...
本周GitHub Trendings亮点包括Ollama、Dify.AI、MyShell等
开源
项目
。Ollama是用于本...
赞
踩
article
从“
NLP
技术
”到“
AI
大
模型
”_
nlp
和
大
模型
的
区别...
传统
的
NLP
技术
是人类探索机器理解自然语言
的
一个过程,如果没有这个过程,那么后面
的
词嵌入、预训练
模型
、以及
AI
大
模型
可能...
赞
踩
article
Android
自定义
水平
进度条
_
android
椭圆
进度条
...
先上效果图为什么要有
自定义
控件? 1、特定的显示风格 2、处理特有的用户交互 3、优化布局(如列表中通过
自定义
控件,实现...
赞
踩
article
Linux
学习(5):存储
结构
和
磁盘
划分_
linux
盘序
逻辑
...
本文介绍了
Linux
系统中根目录的
结构
,包括常见目录的用途和文件系统的类型,如Ext3、Ext4和XFS。讲解了如何添加...
赞
踩
article
在
Go
中
理解栈和
先进先出
原则
...
在
本博文
中
,我们将探讨如何
在
Go
中
实现和使用堆栈,以及堆栈如何遵循
先进先出
(FIFO)
原则
。Push方法将一个新...
赞
踩
article
自研
地面站
!自主开源
无人
飞行系统
Prometheus
V2
版重大升级详解_
无人
机
开源
地面站
...
Prometheus
V2
地面站
基于 Qt 开发,提供了一个直观的人机交互界面,大大简化了
无人
机
的操作和使用。在 V1...
赞
踩
article
国家
信息
安全
水平考试NISP一级官方视频知识点整理_
信息
需要
经过数字化转变成
数据
才能
存储
和
传输
...
文章目录一)
信息
安全
概述(了解即可,考察较少)1.1
信息
与
信息
安全
1.1.1
信息
1.1.2
信息
技术1.1.3
信息
安...
赞
踩
article
linux
的
初步认识
_
linux
看法...
一.什么是liunx? Linux是一套免费使用和自由传播
的
类Unix操作系统,是一个基于POSIX和UNIX
的
多用户...
赞
踩
article
Android
蓝牙
协议
栈漏洞剖析...
本文深入探讨了
Android
蓝牙
协议
栈中的安全问题,重点关注SMP、GATT和L2CAP
协议
的实现漏洞。通过分析 CVE...
赞
踩
article
2022.5
.
23
-5.29
AI
行业
周刊(第99期):
AI
创业道路_
计算机
视觉
江
大白
...
周末和一个
AI
公司的算法负责人,晚上聊了很久,讨论了他们当前的困惑、以及很多可以尝试的方式。因为之前
大白
也是负责过算法方...
赞
踩
article
pywebview
入门...
pywebview
是一个轻量级的 python 库,旨在简化桌面应用程序的开发。它利用系统的 WebView 组件,使...
赞
踩
article
使用
go
语言编译部署最新版
Yearning
【v3.0.1】_
yearning
juno
...
使用
go
语言编译部署最新版
Yearning
【v3.0.1】_
yearning
juno
yearning
juno
...
赞
踩
article
Elastic
:
监控
不同于
可
观察
性
的
3 个原因...
监控
是收集、提取和分析应用程序、基础设施和/或云遥测数据以评估系统运行状况
的
过程。
监控
依赖于指标,例如 CPU 或内存使...
赞
踩
article
LeetCode
-
Python
-206. 反转
链表
_为什么
head
=
head
.
next
是迭代吗...
反转一个单
链表
。示例:输入: 1->2->3->4->5->NULL输出: 5->4->3->2->1->NULL进阶:...
赞
踩
article
机器
学习
之
时间
序列
分析_
时间
序列
分析是
机器
学习
...
机器
学习
之
时间
序列
分析_
时间
序列
分析是
机器
学习
时间
序列
分析是
机器
学习
机器
学习
之
时间
序列
...
赞
踩
article
Linux
中文
显示
乱码
问题解决方法(
编码
查看及转换)_
linux
服务器
中文
乱码
...
1,示例图中名为一个.sql文件的一段内容,是一个数据库文件。其在windows中打开显示正常,在
Linux
中,
中文
部分...
赞
踩
相关标签
学习
python
数据分析
jupyter
51单片机
mongodb
嵌入式硬件
单片机
arm开发
c语言
时间戳
日期字符串
datetime
time
java
jvm
开发语言
github
开源
Github趋势分析
开源项目
Python
Golang
人工智能
自然语言处理