搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
笔触狂放9
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
软考中级网络工程师笔记(二)_设信道带宽为4000hz,采用pcm编码,采样周期为125μs,每个样本量化为128个等级,
2
迄今为止程序员写过的最大Bug:亏损30亿、致6人死亡,甚至差点毁灭世界
3
人工智能&统计&大数据带动数据时代_大数据与人工智能时代的统计研究
4
清华大学团队:人脸识别爆出巨大丑闻,15分钟解锁19款手机_清华大学 人脸识别 外国手机是哪款
5
HIFUSE:用于医学图像分类的分层多尺度特征融合网络
6
免费ChatGDT插件《 WeTab 新标签页》_wetab-免费chatgpt新标签页
7
在矩池云使用ChatGLM-6B & ChatGLM2-6B_glm2-6b web_demo 没反应
8
Kafka入门到实战-第五弹
9
FATE —— 二.4.3 使用冻结参数Bert进行情绪分类_fate_llm.model_zoo.bert_
10
KY145 EXCEL排序(用Java实现)
当前位置:
article
> 正文
009. 量化概念记录_4bit量化
作者:笔触狂放9 | 2024-04-07 08:36:25
赞
踩
4bit量化
1. 基础科普:
FP32可表示的数值范围为 -3.4 * 10^38 ~ 3.4 * 10^38。
INT8可表示的数值范围为 -128 ~ 127。(即8bit)
INT4可表示的数值范围为 -8 ~ 7。(即4bit)
2. 量化方法分类:
精度分:8bit量化,4bit量化, 16bit量化。
根据缩放系数能否覆盖网络数据和参数范围分:饱和量化(需要),非饱和量化。
根据零点是否为0分:对称量化,非对称量化。
按是否需要数据集和训练分:动态离线量化,静态离线量化,量化感知训练。(1)动态离线量化:无需样本数据,对模型的参数在推理前进行量化。该方法依赖最少,量化的效果一般,量化的加速效果弱一些。(2)静态离线量化:在预测前使用量化校准集进行模型激活值分布的统计,确定激活层的量化参数。(3)量化感知训练:在训练的过程中网络模拟量化的效果进行参数更新和优化,量化的效果最好,部署预测无速度损失,训练过程需要进行改变。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/笔触狂放9/article/detail/377536
推荐阅读
article
Generative
AI 新世界 |
扩散
模型
原理
的
代码
实践之
采样
篇_
扩散
模型
的
原理
采样
篇...
基于
扩散
模型
(Diffusion Models)
的
大
模型
,例如:Stable Diffusion、Midjourney、...
赞
踩
article
AI
大
模型
基石:
文字
与
数字
的
起源
与演变...
文字
起源
于人类需要记录更多信息
的
需求,而
数字
起源
于人类需要计数财产
的
需求。
文字
经历了从图画到象形
文字
再到楔形
文字
的
发展,...
赞
踩
article
GGML
或
GGUF
的
14种
不同
量化
模式说明...
对应于
不同
类型
的
量化
。它们遵循特定
的
命名约定:“q”+ 用于存储权重
的
位数(精度)+ 特定变体。,因为它保留了模型
的
大部...
赞
踩
article
瑞吉&
苍穹
外卖
如何
拓展
?
已经经过不同公司多轮
面试
。项目中会问到哪些
问题
?
以及
问题
如何
解决
?
...
吉瑞&
苍穹
外卖
如何
拓展
?
已经经过不同公司多轮
面试
。项目中会问到哪些
问题
?
以及
问题
如何
解决
?
瑞吉&
苍穹
外卖
如何
拓展
?
已经经...
赞
踩
article
3D直播的技术基石--实时网格生成技术(下篇)_
using
kinfu
l
a
rge
sc
a
le
to...
引言上篇文章中,笔者给大家详细介绍了3D模型表面重建的经典算法:泊松重建。今天笔者就给大家聊一聊这个系列的真正主角:基于...
赞
踩
article
【
计算机
论文指导】
ssm236
基于ssm
的
宠物医院
管理系统
的
设计与实现+vue...
在整个系统测试中,根据需求文档和设计文档,逐一对功能进行检测并写好测试用例,有效避免残片缺陷,因为产品出现缺陷不仅影响功...
赞
踩
article
C++
:
模板
总结_类
模板
默认
参数
...
写在前面
模板
(Templ...
赞
踩
article
chatgpt
赋能
python
:
Python
大型
游戏
的
SEO
优化指南...
本文由
chatgpt
生成,文章没有在
chatgpt
生成的基础上进行任何的修改。以上只是
chatgpt
能力的冰山一角。作为...
赞
踩
article
分布式
,高
并发
_
分布式
高
并发
...
文章目录
分布式
什么是
分布式
系统
分布式
系统挑战一个简化的架构图高
并发
什么是高
并发
如何提升系统的
并发
能力常见的互联网分层架构...
赞
踩
article
基于
文本
内容
的
垃圾
短信
识别实战...
基于
文本
内容
的
垃圾
短信
识别实战_
垃圾
短信
识别
垃圾
短信
识别 1、实战的背景与目标 背景:
垃圾
短...
赞
踩
article
关系
抽取
(三)实体
关系
联合
抽取
:
TPlinker
...
实体
关系
联合
抽取
TPLinker_实体
关系
联合
抽取
实体
关系
联合
抽取
参考: NLP系列之封闭域联...
赞
踩
article
NLP
于
搜索引擎
的
关系_
nlp
+
搜索引擎
...
本文详细描述了周明如何在
NLP
进步中探索。课程导师:雷鸣, 天使投资人,百度创始七剑客之一,酷我音乐创始人,北大信科人工...
赞
踩
article
Android
操作系统
服务
(
Context
.
getSystemService
() )...
getSystemService
是
Android
很重要的一个API,它是Activity的一个方法,根据传入的NAME来...
赞
踩
article
chatgpt
赋能
python
:
Python
怎么变
大字体
提高
SEO
排名
...
本文由
chatgpt
生成,文章没有在
chatgpt
生成的基础上进行任何的修改。以上只是
chatgpt
能力的冰山一角。作为...
赞
踩
article
腾讯
云
轻量
应用服务器
配置价格表及使用场景之做微信
小
程序
后台_
腾讯
云
小
程序
带宽
...
轻量
应用服务器
和普通
云
服务器CVM均可以用来搭建微信
小
程序
,而且
腾讯
云
轻量服务器配置高
带宽
高价格更划算,个人或企业用户均...
赞
踩
article
java计算机毕业
设计
springboot
+vue
宠物
服务
管理
系统
(源码+
系统
+mysql
数据库
+L...
计算机网络的发展,促进了社会各行业的进步,带来了经济快速增长。用户通过本平台发布
宠物
趣事,进行展示,在平台上和用户进行实...
赞
踩
article
【
PTA
-天梯赛】【 L1-064】【
估值
一亿
的
AI
核心
代码
(20分)】_
pta
估值
一亿
的
ai核心代...
这篇文章是关于字符串处理
的
编程题,要求根据用户输入
的
话在一行中原样输出,并且消除多余空格。文章强调了编程时需要拟定完整
的
...
赞
踩
article
信息
抽取
(二)花
了
一个
星期走
了
无数条
弯路终于用TF
复现
了
苏神
的
《
Bert
三元
关系
抽取
模型
》
,
我到底悟...
信息
抽取
(二)花
了
一个
星期走
了
无数条
弯路终于用TF
复现
了
苏神
的
《
Bert
三元
关系
抽取
》
模型
,
我到底悟到
了
什么?前言数据格...
赞
踩
article
「部署全
流程
」
中科院
学术
专业版
chatGPT
来啦
_
chatgpt
学术
版...
项目针对了
中科院
日常科研工作,基于 ChatGPT 专属定制了一整套实用性功能,用于优化
学术
研究以及开发日常工作
流程
_
c...
赞
踩
article
不同
尺度
空间
的
室内
三维重建
问题
技术路线_
小
尺度
三维重建
...
博客下载地址1、
小
型场景框架1 = 几帧单幅深度图像 + 简单图像拼接(ICP算法族);框架2 = 多帧单幅深度图像 +...
赞
踩
相关标签
人工智能
机器学习
自然语言处理
语言模型
chatgpt
java
苍穹外卖
吉瑞外卖
面经
面试
vue.js
前端
javascript
模板
python
游戏
网络
分布式
知识图谱
搜索引擎
NLP
移动开发
操作系统