赞
踩
不能提取图像的抽象信息
不能生成有意义的句子
检索问题:从候选句子中选择最匹配的
无法泛化:对新图像没有结果
图像搜索——丰富图像搜索元数据,增强搜索结果
盲人导航
少儿教育
eg1:
eg2:
N-gram Match = Min(matched_items,. Match_items_in_gt)/ items in result
Corrent 1-gram: 1/5
eg3:
其中,r表示实际句子的长度,c表示预测句子的长度
每一步需要图像特征输入
普通的RNN
LSTM:使得同样的图像特征没必要重复输入
使得词语的原始embedding没必要输入
引入attention机制,每个词语可以对应图片不同的位置
每一步都需要输入图像加权特征
分层机制解决一个LSTM同时学习两件事情的过载问题。
相关代码,详见github:https://github.com/crystal30/Deep_learning, 5_1——5_4
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。