搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
很楠不爱3
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
【数据结构】顺序表(C语言)_c语言顺序表
2
Stanford University courses of computer science department(斯坦福计算机系课程设置)_fundamental graph cut problems
3
【简单入门】ChatGPT prompt engineering (中文版)笔记 |吴恩达ChatGPT 提示工程
4
红队的工作思路_红队思路
5
【阿里云生活物联网架构师专题 ①】esp32 sdk 直连接入阿里云物联网平台,实现天猫精灵语音控制;_java接收天猫精灵的音频
6
VSCode好用插件
7
linux 中 查看防火墙开放端口号 命令_ss algrep 6379
8
嵌入式项目流程:一、项目初期
9
OceanBase产品家族及基础概念_oceanbase数据库产品家族
10
『与善仁』Appium基础 — 17、Appium的第一个Demo_appium [appium] welcome to appium v1.17.1 [appium]
当前位置:
article
> 正文
递归网络卷积网络结合(CNN+RNN)_cnn结合rnn原理
作者:很楠不爱3 | 2024-04-03 05:58:03
赞
踩
cnn结合rnn原理
文章目录
1. CNN + RNNCNN卷积神经网络 RNN递归神经网络
1.1 相同点:
1.2 不同点:
1.3 组合方式实现
2. 图片标注
2.1 问题描述:
2.2 模型设计
2.3 模型设计
2.4 模型运行
2.5 图片标注升级
3. 视频行为识别
3.1. CNN特征简单组合
3.2. 3D版本CNN图像特征的前后关系没有很好的区别
4. 图片/视频问答
4.1 图片问答的意义
4.2 方法流程
1. CNN + RNNCNN卷积
神经网络
RNN递归神经网络
1.1 相同点:
都是传统神经网络的扩展 空间和时间扩展
前向计算产生结果,反向计算模型更新
每层神经网络横向可以多个神经元共存,纵向可以有多层神经网络连接
深度和广度注:梯度衰减: CNN ReLU不会衰减,RNN U参数梯度会大于或者小于1
1.2 不同点:
CNN空间扩展,神经元与特征卷积; RNN时间扩展,神经元与多个时间输出计算
RNN可以用于描述时间上连续状态的输出,有记忆功能,CNN用于静态输出
CNN高级深度100+深度,RNN深度有限1.2 组合意义
大量信息同时具备时间空间特性- 带有图像的对话,文本表达更具体
视频相对图片描述的内容更加完善图片标注: CNN特征提取,用于RNN语句生成
视频分类: RNN特征提取用于CNN内容分类
图片问答: CNN特征提取用于对话问答
1.3 组合方式实现
特征提取:LSTM输出,FC层输出
特征合并:Concatenate层,Attention相乘
结果输出:连续语句输出LSTM,组合分类回归DNN(深度神经网络)
2. 图片标注
2.1 问题描述:
有图片及标注信息,想要的模型是给图片,机器学习给标注
CNN网络中全连接层特征描述图片,特征与LSTM进行结构组合
2.2 模型设计
数据准备
图片CNN特征提取
图片标注生成Word2Vect向量
生成训练数据:图片特征+第n单词向量:第n+1单词向量
2.3 模型设计
运用迁移学习,CNN特征,语句特征应用已有模型
最终输出模型是LSTM,训练过程参数设定:梯度上限,学习率调整
训练时间很长
2.4 模型运行
CNN特征提取
CNN特征+语句开头,单词逐个预测
2.5 图片标注升级
详细标注Loss:目标探测loss 目标识别loss 区域标注loss
训练方式:end-to-end
开放性探测识别
3. 视频行为识别
3.1. CNN特征简单组合
3.2. 3D版本CNN图像特征的前后关系没有很好的区别
CNN特征提取
LSTM判断
多次识别结果分析
4. 图片/视频问答
4.1 图片问答的意义
是对纯文本语言问答系统的扩展
图片理解和语言处理的深度融合
提高人工智能能应用范围
观察,思考,表达
4.2 方法流程
按照语言问答流程解决
图片特征同语言特征融合
训练数据: 问题 + 图片 + 答案
FCN:只有卷积层的神经网络
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/很楠不爱3/article/detail/354553
推荐阅读
article
【
c
o
nda
】
c
o
nda
create 环境报错C
o
nda
HTTP
Err
o
r:
HTTP
000 C...
c
o
nda
创建虚拟环境报错C
o
nda
HTTP
Err
o
r:
HTTP
000 CONNECTION FAILED f
o
r ...
赞
踩
article
多
模态
情感
分析
研究综述
论文
笔记...
论文
标题:《多
模态
情感
分析
研究综述》引言:多
模态
情感
分析
现已成为自然语言处理领域的核心研究课题之一,分为两类子课题:1、...
赞
踩
article
复盘:从0到1
设计
A
/
B
测试
系统
...
本文由作者 Mr.Sen于社区发布笔者最近刚完成了 一个
A
/
B
测试
系统
的
设计
,虽然目前已顺利上线投产,但回想当初实在找了...
赞
踩
article
数据分析
之
Tebleau
可视化
:
折线
图
、饼
图
、环形
图
...
1.
折线
图
的绘制方法一:拖入订单日期和销售金额,自动生成一个
折线
图
方法二:选中订单日期和销售金额(摁住ctrl可以选择多...
赞
踩
article
基于
Python
近红外
光谱分析
与机器
学
、深度
学
习方法融合技术
应用
...
基于
Python
近红外
光谱分析
与机器
学
、深度
学
习方法融合技术
应用
基于
Python
近红外
光谱分析
与机器
学
、深度
学
习方法融合...
赞
踩
article
基于
Keras
:
CIFAR
-
10
-分类_在
keras
框架
下
,
请采用卷积
神经网络
对
cifar
-
10
...
一、概述
CIFAR
-
10
是一个比较经典的
数据
集,主要用于图像分类;该
数据
集共有60000张彩色图像,这些图像是32*32...
赞
踩
article
10
倍提升效率
,
号称取代
Elasticsearch
?
_
manticor
es
earch
和
es
比较...
对于小型数据集
,
比
Elasticsearch
快15倍对于中等大小的数据
,
比
Elasticsearch
快5倍对于大型数据
,
...
赞
踩
article
人工智能
算法
分类_智能分类
算法
...
一、
人工智能
学习
算法
分类
人工智能
算法
大体上来说可以分类两类:基于统计的机器学习
算法
(Machine Learning)和...
赞
踩
article
java
调用
chatgpt
,产生的证书问题
java
x.
net
.ssl.SSLHandshakeExc...
java
调用
chatgpt
,产生的证书问题
java
x.
net
.ssl.SSLHandshakeException: su...
赞
踩
article
“智能
语音
指令解析“ 基于
NLP
与
语音
识别的
工单
关键
信息提取
_
工单
基本
信息提取
模型...
智能
语音
指令解析集成了
语音
识别(ASR)与信息抽取(IE)等技术,广泛应用于智能
语音
填单、
语音
交互、手机APP
语音
唤醒等...
赞
踩
article
情感
分析
和
数据
集_
情感
分析
测试
数据
集...
情感
分析
和
数据
集Sentiment Analysis and the Dataset Natural Language ...
赞
踩
article
Android
之
Fragment
应用——
一个
简易版
的
新闻
应用_
fragment
的
最佳实践:
一个
简易版
...
内容1、准备工作2、新建
一个
新闻
的
实体类News3、新建布局文件news_content_frag.xml,作为
新闻
内容...
赞
踩
article
python
程序代码
解析_
Python
源码
分析
3 –
词法
分析
器
PyTokenizer
...
Introduction上次我们
分析
了
Python
中执行程序可分为5个步骤:Tokenizer进行
词法
分析
,把源程序分解...
赞
踩
article
python
调音
_
调音
和分贝...
虽然pydub没有直接停止audioSegment播放的方法,但根据this documentation的说法,它将音频...
赞
踩
article
R
语言
KERAS
用
RNN
、双向
RNN
S递归
神经网络
、
LSTM
分析
预测
温度时间序列、
IMDB
电影评分...
全文下载链接:http://tecdat.cn/?p=23616在这篇文章中,我们将回顾三种提高循环
神经网络
的性能和泛化...
赞
踩
article
Python
离线
安装
第三方库
_
pp38
-
pypy38
_
pp73
啥意识...
在服务器上,我们搭建完
Python
环境之后,因为服务器的网络限制原因,不能直接通过pip命令下载
安装
Python
的依赖包...
赞
踩
article
全面解析
特斯拉
自动
驾驶
体系
_
特斯拉
智驾
系统
框图...
汽车革命的上半场是电动化,下半场是智能化,电动化只是改变了汽车的动力供给方式,并没有改变汽车的性质,而智能化才是这场革命...
赞
踩
article
关于在
element
-
plus
中使用
vue3
开发项目的思考_
status
-
icon
element
...
vue3
,
element
-
plus
_
status
-
icon
element
plus
status
-
icon
elemen...
赞
踩
article
word2vec
实现踩坑
_
word2vec
service...
xorshift算法生成随机数的原理是什么?https://www.zhihu.com/question/2795135...
赞
踩
article
[每周一更]-(第82期):认识
自然
处理
语言
(
NLP
)_
nlp
和
大
模型
的
关系
...
自然
语言
处理
(英语:Natural Language Processing,缩写作
NLP
)是人工智能
和
语言
学领域
的
分支学...
赞
踩
相关标签
conda
http
python
深度学习
机器学习
计算机视觉
网络
论文阅读
人工智能
大数据
算法
编程语言
数据分析
数据挖掘
elasticsearch
搜索引擎
java
ssl
开发语言
自然语言处理
语音识别
xcode