搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
你好赵伟
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
Moviepy怎样使用?_moviepy教程
2
终于有人把云计算、大数据和 AI 讲明白了【深度好文】_ai替代云计算(2)_云计算ai集群
3
EMQX Newsletter 2022-02|开源版 v4.4.0 发布、云服务上线增值功能_emqx开源版
4
YOLO--置信度(超详细解读)_yolo 置信度只有两位吗
5
小白学大模型——Qwen2_残差连接
6
如何实现数据大屏在各种场景下的时间展示?_dataease数据大屏显示时间和天气
7
ZTMap赋能数字工厂智慧化|提高生产管控效率,助力透明化工厂建设_生产效率管控
8
Android studio 运行别人的代码出现 please select android sdk问题解决方案_运行别人代码please select android sdk
9
阿里云安全恶意程序检测-排名295_阿里云安全恶意程序检测毕设
10
U盘烧录工具 ventoy Windows版本 系统启动盘制作神器 多合一
当前位置:
article
> 正文
高阶注意力机制_CV中的Attention机制 | NonLocal Network的理解与实现
作者:你好赵伟 | 2024-07-20 05:21:39
赞
踩
nonlocal network
一
Non-local
Non-Local是王小龙在CVPR2018年提出的一个自注意力模型。Non-Local Neural Network和Non-Local Means非局部均值去燥滤波有点相似的感觉。普通的滤波都是3×3的卷积核,然后在整个图片上进行移动,处理的是3×3局部的信息。Non-Local Means操作则是结合了一个比较大的搜索范围,并进行加权。
在Non-Local NN这篇文章中的Local也与以上有一定关系,主要是针对感受野来说的,一般的卷积的感受野都是3×3或5×5的大小,而使用Non-Local可以让感受野很大,而不是局限于一个局部领域。 与之前介绍的CBAM模块,SE模块,BAM模块,SK模块类似,Non-Local也是一个易于集成的模块,针对一个feature map进行信息的refine, 也是一种比较好的attention机制的实现。不过相比前几种attention模块,Non-Local中的attention拥有更多地理论支撑,稍微有点晦涩难懂。 Non-local的通用公式表示:
x是输入信号,cv中使用的一般是feature map
i 代表的是输出位置,如空间、时间或者时空的索引,他的响应应该对j进行枚举然后计算得到的
f 函数式计算i和j的相似度
g 函数计算feature map在j位置的表示
最终的y是通过响应因子C(x) 进行标准化处理以后得到的
理解:
与Non local mean相比,就很容易理解,i 代表的是当前位置的响应,j 代表全局响应,通过加权得到一个非局部的响应值。
Non-Local的优点是什么?
提出的non-local operations通过计算任意两个位置之间的交互直接捕捉远程依赖,而不用局限于相邻点,其相当于构造了一个和特征图谱尺寸一样大的卷积核, 从而可以维持更多信息。
non-local可以作为一个组件,和其它网络结构结合,经过作者实验,证明了其可以应用于图像分类、目标检测、目标分割、姿态识别等视觉任务中,并且效果有不同程度的提升。
Non-local在视频分类上效果很好,在视频分类的任务中效果可观。
二
细节
论文中给了通用公式,然后分别介绍
f函数
和
g函数
的实例化表示:
g函数:
可以看做一个线性转化(Linear Embedding)公式如下:
是需要学习的权重矩阵,可以通过空间上的1×1卷积实现(实现起来比较简单)。 **f函数:**这是一个用于计算i和j相似度的函数,作者提出了四个具体的函数可以用作f函数。
Gaussian function:
具体公式如下:
这里使用的是
一个点乘来计算相似度,之所以点积可以衡量相似度,这是通过余弦相似度简化而来的。
Embedded Gaussian:
具体公式如下:
Dot product:
具体公式如下:
Concatenation:
具体公式如下:
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/你好赵伟/article/detail/855346
推荐阅读
article
2019CVPR
单目深度估计综述_
recurrent
neural network
for
(un-...
2019CVPR
单目深度估计综述Recurrent MVSNet
for
High-resolution Multi-v...
赞
踩
article
单目深度估计论文(1)—
Depth
M
a
p Pre
d
i
c
tion
from
a
Single Im...
第一篇利用CNN进行单目深度估计的论文(有监督)[1] Eigen D
,
Puhrs
c
h C
,
Fergus R. De...
赞
踩
article
NLP
论文(
情感
分析
):《
Aspect
sentiment
analysis based on ga...
NLP
论文(
情感
分析
):《
Aspect
sentiment
analysis based on gating convo...
赞
踩
article
NLP
论文(
情感
分析
):《
Aspect
Detection
and
Sentiment
Classi...
NLP
论文(
情感
分析
):《
Aspect
Detection
and
Sentiment
Classification
U...
赞
踩
article
基于
网络
的
入侵
检测
数据
集研究综述(A
Survey
of
Network
-
based
Intrusi...
摘要:该综述论文对基于
网络
的
入侵
检测
数据
集进行了分析和总结,强调了标记
数据
在训练和评估
入侵
检测
系统中的重要性。文章建议用...
赞
踩
article
Transformer的前世今生
day06
(
Self
-
Attention
和
RNN
、
LSTM
的区别)...
Self
-
Attention
和
RNN
、
LSTM
的区别
RNN
(循环神经网络)
RNN
,当前的输出oto_tot取决于上一个...
赞
踩
article
CAM-
RNN
:基于
RNN
的视频字幕共同
注意力
模型_co-
attention
model
based
...
CAM-
RNN
: Co-Attention Model Based
RNN
for Video CaptioningCA...
赞
踩
article
【EI级】
多头
注意力
机制多变量时间序列预测
TCN
-
LSTM
-
Multihead
-
Attention
【...
多头
注意力
机制多变量时间序列预测
TCN
-
LSTM
-
Multihead
-
Attention
完整的代码,方可运行;可提供运行...
赞
踩
article
发布一年了
,
做NLP
的
还有没看过这篇
论文
的
吗?--“
Attention
is
all
you nee...
笔记作者:王小草日期:2018年10月30日欢迎关注我
的
微信公众号“AI躁动街”1 Background说起深度学习和神...
赞
踩
article
【扩散模型
(
四)】
IP
-
Adapter
源码详解2-
训练
核心
(
cross
-
attention
)...
本文通过详细的结构图和相关代码片段介绍了
IP
-
Adapter
训练
代码的核心部分,下篇则介绍其推理代码。【扩散模型
(
四...
赞
踩
article
卷积
神经网络
(
Convolutional
Network
)_
卷积
神经网络
架构图 论文...
卷积
神经网络
(
Convolutional
Network
)目录:
卷积
神经网络
的发展与优势什么是
卷积
卷积
神经网络
的结构经典...
赞
踩
article
深度学习:
卷积
神经网络
(
convolution
neural
network
)...
(一)
卷积
神经网络
卷积
神经网络
最早是由Lecun在1998年提出的。
卷积
神经网络
通畅使用的三个基本概念为:1.局部视觉域...
赞
踩
article
Con
volutional
Neural
network
(
CNN
)_
con
-
volutional
...
Con
volutional
Neural
network
(part 1)李宏毅视频学习笔记1. Why
CNN
for ...
赞
踩
article
Convolutional
Neural
Network
(
卷积
神经网络
超详细解释)...
Why CNN for Image?我们可以使用fully connect
神经网络
去进行图像识别,但是所需要的参数太多了...
赞
踩
article
Convolution
Neural
Network
(CNN) 原理与实现_
convolution
...
本文结合Deep learning的一个应用,
Convolution
Neural
Network
进行一些基本应用,参...
赞
踩
article
macOS
mojave
10.14.1 WI-FI
crash
并且卡住整个 OS 的 menub...
剧情是这样:每天从公司把电脑盖上带回家,或者 在家把电脑带到公司 会遇到 Wi-Fi 无法正常链接,重启之后可以正常连接...
赞
踩
article
nlp
论文学习(
关系
抽取)——
Relation
Classification
via Convolu...
等待更新_
nlp
语序
关系
nlp
语序
关系
基本定义 关...
赞
踩
article
NLP-多
标签
文本
分类
_
bert
+ 双向
gru
+
attention
+ fc...
from https://www.cnblogs.com/jclian91/p/12671879.html 本文将会讲述...
赞
踩
article
深度学习——CV、
CNN
、
RNN
、梯度消失与梯度爆炸、
LSTM
、
GRU
、B
RNN
、上采样层、atte...
在时候可以,并且可以很多,。其包含了(Verticaledgedetection)和(Verticaledgedetec...
赞
踩
article
白话
机器
学习
-
Self
Attention
_
self
attention
有多少参数...
一 背景大抵是去年底吧,收到了几个公众号读者的信息,希望能写几篇介绍下
Attention
以及Transformer相关的...
赞
踩
相关标签
单目深度估计
深度学习
机器学习
cnn
自然语言处理
人工智能
网络
rnn
transformer
lstm
神经网络
视频处理
matlab
论文
机器翻译
计算机视觉
aigc
python
transformers