搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
Cpp五条
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
RT-1052-Cortex-M内核启动文件_main分析_rt1052启动过程
2
力扣1793.好子数组的最大分数
3
国家信息安全等级保护制度第三级要求
4
AI_Chat_GPT,真的好用吗?_aichatos
5
【windows】--- SQL Server 2008 超详细安装教程_sql server2008
6
SAP 输出合并单元格样式的ALV 报表_sap合并单元格
7
【软件开发规范篇】Git代码提交规范
8
单链表(线性链表)数据元素插入和删除_链式线性表的插入与删除 描述:删除链式线性表指定位置的元素。 输入:第一行为自然
9
Python李峋同款可写字版跳动的爱心(完整代码)_python绘制立体玫瑰花
10
uniapp - 新建页面与tabBar配置_uniapp tabbar
当前位置:
article
> 正文
VLM 系列——中文CLIP——论文解读_chinese-clip 一个汉字是一个token吗
作者:Cpp五条 | 2024-06-15 21:33:43
赞
踩
chinese-clip 一个汉字是一个token吗
一、概述
1、是什么
CLIP 的中文版《Chinese CLIP: Contrastive Vision-Language Pretraining in Chinese》,训练使用2亿 图-文 对的对比学习(不是LLM的预测下一个token),是一个双塔模型(图像和文本各子拥有一个编码器)。由于对齐了图像和文本特征,可以用来做:图-图(文章中没有相关测试任务)、图-文、文-图、文-文(文章中没有相关测试任务)的检索,当然 图-文 和 文-图 检索 也可以转化为zero-shot 的分类。
2、亮点
*开源代码、模型(多个版本模型:图像编码器提供5种,参数量77-958M)、demo,并且提供用于部署的NVIDIA TensorRT和ONNX模型,比用于推理的Pytorch模型快2到10倍。
*消融实验后验证,两阶段训练更优:使用CLIP初始化,先训练文本编码器;再联合训练。
*在MUGE、Flickr30K-CN和COCO-CN数据集的zero-shot 和 finetune 任务上达到最先进的水平;在ELEVATER上的zero-shot分类具有竞争力的性能。
PS
在一些场景下使用,居然ba
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/Cpp五条/article/detail/723917
推荐阅读
article
Token
计费
与
计算
、
tiktoken
介绍...
每个模型都具有不同的功能和价格。价格是按照每1000个
Token
计算
的。您可以将
Token
视为单词的组成部分,其中1...
赞
踩
article
近期arxiv上的使用
prompt
的行为识别、动作生成等论文_vita-
clip
:
video
an...
Seeing in Flowing: Adapting CLIP for Action Recognition with...
赞
踩
article
AI推介-多模态
视觉
语言
模型
VLMs论文速览(arXiv方向):2024.05.10-2024.05...
编辑视频时,一段动听的背景音乐必不可少。然而,视频背景音乐生成任务面临着一些挑战,例如缺乏合适的训练数据集,难以灵活控制...
赞
踩
article
Andro
id
-接入谷歌登录_
id
token
has inval
id
'
aud
' (
aud
ienc...
Andro
id
接入google登录踩坑_
id
token
has inval
id
'
aud
' (
aud
ience) c...
赞
踩
article
Chinese
-
LLaMA
-
Alpaca
-
2
模型量化部署&测试_
chinese
-
llama
-alpa...
基于Meta发布的可商用大模型开发, 是大模型的第二期项目._
chinese
-
llama
-
alpaca
-
2
部署chine...
赞
踩
article
多
模态
——
CLIP
:
Contrastive
Language
-
Image
Pre-
training
解...
CLIP
作者提出了一种基于对比学习的多
模态
预训练模型
CLIP
,该模型打破了传统视觉模型只能在预定义的标签列表中识别这一范...
赞
踩
article
中文
Llama
-
3
开源
大
模型
项目正式发布_
llama
3
chinese
8b
...
2024年4月19日,Meta发布了最新一代开源
大
模型
Llama
-
3
,其中包括两个
模型
大
小:8B、70B,并在未来会进一...
赞
踩
article
NLP
-信息抽取-
NER
-2019:LR-
CNN
【
CNN
-
Based
Chinese
NER
wit...
NLP
-信息抽取-
NER
-2019:LR-
CNN
【
CNN
-
Based
Chinese
NER
with Lexicon ...
赞
踩
article
Mac 部署
GPT
-
2
预训练模型
gpt
2
-
chinese
-
cluecorpussmall
...
Mac 部署
GPT
-
2
预训练模型
gpt
2
-
chinese
-
cluecorpussmall
_
gpt
2
-
chinese
...
赞
踩
article
Uncaught
SyntaxError
:
Unexpected
token
‘<‘_通过f5访问报...
UE中页面F5刷新空白并报错报错:
Uncaught
SyntaxError
:
Unexpected
token
[详细]
-->
赞
踩
article
axios
封装
(例如:
请求
头、
token
、超时、BaseUrl、
请求
错误
、
请求
重复)_
axios
封装
...
axios
封装
前言1.为什么
封装
Axios2.包括的功能一、Axios是什么?二、安装 Axios1. 安装
axios
...
赞
踩
article
vue使用
axios
添加
拦截器
,
get
请求、
post
请求头部
添加
token
_
axios
toke...
vue使用
axios
添加
拦截器
,
get
请求、
post
请求头部
添加
token
_
axios
token
axios
tok...
赞
踩
article
使用
axios
处理
Cookie
、
Session
和
Token
(
jwt
)_
axios
携带
jwt
tok...
使用
axios
处理
cookie、session和
token
(
jwt
) 的笔记_
axios
携带
jwt
token
axio...
赞
踩
article
token
、
axios
拦截器
等_
axios
token
...
概念:访问权限的令牌,本质上是一串字符串创建:正确登录后,由后端签发并返回作用:判断是否有登录状态等,控制访问权限发起请...
赞
踩
article
axios
拦截器和
token
_
axios
拦截器
token
...
axios
拦截器和
token
_
axios
拦截器
token
axios
拦截器
token
...
赞
踩
article
把
token
存在
请求
头里,使用
Axios
来设置
请求
头(
header
s)的方法_
axios
.
post
...
把
token
存在
请求
头里的方法_
axios
.
post
加入
header
token
axios
.
post
加入
header
...
赞
踩
article
API
接口
TOKEN
设计_
api
token
...
/服务端重新生成一个
api
_
token
$
api
_
token
_server = md5($module . $contr...
赞
踩
article
vue
+
axios
+
token
封装
axios
封装
接口
url
,带
token
请求
,
token
失效...
一、
封装
axios
import
axios
from '
axios
'import qs from "qs" const ...
赞
踩
article
什么是
API
Token
?...
API
令牌是一种用于访问和验证
API
(应用程序编程接口)的安全凭证。它是一个字符串,用于识别和授权应用程序或用户访问特定...
赞
踩
article
API
接口
设计之
token
、
timestamp
、
sign
具体实现_
api
token
...
API
接口
设计之
token
、
timestamp
、
sign
具体实现内容来源于:https://www.cnblogs.co...
赞
踩
相关标签
人工智能
langchain
深度学习
机器学习
prompt
语言模型
自然语言处理
VLM
计算机视觉
视觉语言模型
多模态
android
llama
pytorch
chatgpt
CLIP
零样本学习
大模型
算法
多模态大模型