搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
木道寻08
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
各种数据结构在内存中的位置_数据结构的定义在内存哪个段
2
嵌入式中值得学习的软硬件技术_嵌入式中,数字技术包括什么软件技术包括什么
3
flink调优
4
小白初入shodan搜索引擎(1),鸿蒙面试常见问题_shodan引擎无法打开
5
PaddleOCR数字仪表识别——3.paddleocr迁移学习_python3 ocr输出原位置
6
基于FPGA的FIR低通滤波器verilog开发,包含testbench测试程序,输入噪声信号使用MATLAB模拟产生_matlab生成滤波器verilog
7
专业的面相识别的企业|人脸识别离线SDK |人证比对API_pockerface 离线版人证比对 sdk 编
8
2024年最新【python】爬取4K壁纸保存到本地文件夹【附源码】(3),2024年网络安全大厂面试_保存到文件夹开发
9
Python-高级特性-L_(x * x for x in gen() if x % 2 == 0)
10
程序员面试一句话让HR面无人色——Leo网上答疑(56)_程序员面试没见到部门长
当前位置:
article
> 正文
VLM 系列——中文CLIP——论文解读_chinese clip 的输出维度是多少维
作者:木道寻08 | 2024-08-06 00:48:57
赞
踩
chinese clip 的输出维度是多少维
一、概述
1、是什么
CLIP 的中文版《Chinese CLIP: Contrastive Vision-Language Pretraining in Chinese》,训练使用2亿 图-文 对的对比学习(不是LLM的预测下一个token),是一个双塔模型(图像和文本各子拥有一个编码器)。由于对齐了图像和文本特征,可以用来做:图-图(文章中没有相关测试任务)、图-文、文-图、文-文(文章中没有相关测试任务)的检索,当然 图-文 和 文-图 检索 也可以转化为zero-shot 的分类。
2、亮点
*开源代码、模型(多个版本模型:图像编码器提供5种,参数量77-958M)、demo,并且提供用于部署的NVIDIA TensorRT和ONNX模型,比用于推理的Pytorch模型快2到10倍。
*消融实验后验证,两阶段训练更优:使用CLIP初始化,先训练文本编码器;再联合训练。
*在MUGE、Flickr30K-CN和COCO-CN数据集的zero-shot 和 finetune 任务上达到最先进的水平;在ELEVATER上的zero-shot分类具有竞争力的性能。
PS
在一些场景下使用,居然ba
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/木道寻08/article/detail/935059
推荐阅读
article
2022
国赛
数学
建模
C题
思路
分析
高教社杯_
2022
国赛
c
...
2022
国赛
数学
建模
C题
思路
合集_
2022
国赛
c
2022
国赛
c
C题更新一下完整的版本,...
赞
踩
article
ELK
——一套实用
、
易用
的
监控
架构
...
ELK
是什么通俗来讲,
ELK
是由Elasticsearch(日志存储和搜索)
、
Logstash(日志收集)
、
Kibana...
赞
踩
article
**
项目
亮点**:
Headless
Selenium
for
Windows
— 实现静默模式下的自...
项目
亮点:
Headless
Selenium
for
Windows
— 实现静默模式下的
自动化
测试新体验!
项目
地址:h...
赞
踩
article
AI
绘画
Stable
Diffusion超强
提示
词
插件
!中文书写一键翻译,
AI
帮你写
提示
词
!_中文 ...
感兴趣的小伙伴,赠送全套
AI
GC学习资料,包含
AI
绘画
、
AI
人工智能等前沿科技教程和软件工具,具体看这里。
AI
GC技术的...
赞
踩
article
一文搞懂
数据
仓库
、
数据
平
台
、
数据
中
台
、
数据
湖的
概念
和区别...
我们经常听到别人谈论
数据
仓库
、
数据
平
台
、
数据
中
台
、
数据
湖的相关
概念
,它们都与
数据
有关系,但它们之间又有什么区别,下面将围...
赞
踩
article
Llama改进之——
分组
查询
注意力
_
llama
分组
注意力
...
本文介绍了
分组
查询
注意力
的实现以及如何应用旋转位置编码到
分组
查询
注意力
上。_
llama
分组
注意力
llama
分组
注意力
...
赞
踩
article
正确
安装
GPU
显卡
驱动
、
CUDA
、
cuDNN
的详细教程_
cuda
驱动
...
本文详细介绍了如何正确
安装
GPU
显卡
驱动
、
CUDA
、
cuDNN
。_
cuda
驱动
cuda
驱动
...
赞
踩
article
openlayers
入门(15)
热
力图
_
openlayers
geoserver
栅格
热
力图
...
热
力图
要使用Heatmap类
_
openlayers
geoserver
栅格
热
力图
openlayers
geoser...
赞
踩
article
如何
应对
项目风险
,
这
一篇
文章就够了!...
对于新出现的风险或风险情况的变化,项目经理应及时更新风险清单和
应对
计划,确保风险始终处于可控状态。通过定期的风险教育和培...
赞
踩
article
2022
图
机器
学习
必读的11
大
研究
趋势
和方向:
微分方程
/子
图
表示
/
图
谱理论/非对称/动态性/鲁棒性...
来源:
机器
学习
研究
组订阅作者:Michael Bronstein 牛津
大
学DeepMind人工智能教授、Twitter
图
...
赞
踩
article
数据中心
存储
日常
运维
【13】_
存储
系统
运行
正常...
文章目录管理员指南管理员角色及权限常用管理软件维护项目总览首次维保项目每日和每周定期维护项目例行维护工具巡检人工巡检收集...
赞
踩
article
Python
爬虫【
selenium
的
基础
使用
】
_
selenium
4.11
简单
使用
...
其一,大家知道,在我们爬取某些网页
的
时候,它
的
数据并不是静态
的
,而是通过动态加载出来
的
,如
使用
Ajax等。它是一个基于浏...
赞
踩
article
2.
Zotero
翻译
插件
...
Zotero
翻译
插件
_zotero翻译
插件
zotero翻译
插件
1.进入Github官网...
赞
踩
article
全新
CorelDRAW2024
中文
破解版
网盘
下载链接_
cdr2024
安装包
百度网
盘...
在矢量图形设计方面,CorelDRAW 2024提供了全面的设计功能,用户可以方便地创建和编辑复杂的矢量图形,包括线条、...
赞
踩
article
Mac编写
shell
脚本
文件...
shell
脚本
是运行于unix和linux系统的
脚本
语言,类似于windwos下的.bat文件。1、打开MacVim文本...
赞
踩
article
【算法设计题】查找给定
结点
的
双亲
结点
(
二叉树
)
,第3题
(
C/C++
)
...
编写算法,在以二叉链表存储
的
二叉树
中,已知某
结点
数据元素值x
(
该
结点
最多存在一个
)
,求该
结点
的
双亲
结点
。【算法设计题】查...
赞
踩
article
LinkedList
_
qlinkedlist
取
最后
的两个
元素
...
LinkedList
类是双向列表,列表中的每个节点都包含了对前一个和后一个
元素
的引用.
LinkedList
的构造函数如下...
赞
踩
article
STM32
学习
记录一:初识
STM32
_
普中
的
stm32
和
正点
的
区别...
STM32
学习
记录一:初识
STM32
_
普中
的
stm32
和
正点
的
区别
普中
的
stm32
和
正点
的
区别 ...
赞
踩
article
从达
梦
数据库
到
Oracle
数据库
的性能
测试数据
迁移和
导入
优化...
为了在同样的数据基础上对比达
梦
数据库
和
Oracle
数据库
的业务性能,我们需要将达
梦
数据库
的数据
导入
到
Oracle
数据库
中...
赞
踩
article
【AI大模型】
Prompt
提示
词
工程
使用
详解_
prompt
提示
工程
应用
...
Prompt
提示
词
工程
使用
详解_
prompt
提示
工程
应用
prompt
提示
工程
应用
目录...
赞
踩
相关标签
聚类
机器学习
python
elk
架构
elasticsearch
AI作画
stable diffusion
AI绘画
SD安装包
AI绘画提示词
SD插件
AI绘画新手入门
数据仓库
数据库
llama
深度学习
人工智能
分组查询注意力
旋转位置编码
windows
前端框架
职场和发展
产品经理