赞
踩
https://github.com/sgrvinod/a-PyTorch-Tutorial-to-Image-Captioning
首先要感谢这个在github上公开代码的大佬,很牛~
“站在巨人的肩膀上”,这里记录一下最近一段时间理解这个代码的心得体会。
一、模型输入数据
1、create_input_files.py + utils.py(create_input_files函数)
这两个东西,是用来生成输入模型的数据文件的,不是特别难理解,其中:
(1)图像
HDF5文件:
由于直接输入图像会导致占用内存太多而降低效率(一般电脑都接受不了),所以要将图像都压缩存储在hdf5中,并在此过程中图像大小均被resize成(3,256,256),同时它也会记录每个图片有多少个描述句子,这里是5。
(2)词表
WORDMAP文件:
所谓的词表文件,格式为:“wo
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。