python encoder decoder_Image Caption 的 Encoder – Attention – Decoder pytorch实现（一）

作者：IT小白 | 2024-07-19 16:15:05

踩

image decoder python

https://github.com/sgrvinod/a-PyTorch-Tutorial-to-Image-Captioning

首先要感谢这个在github上公开代码的大佬，很牛~

“站在巨人的肩膀上”，这里记录一下最近一段时间理解这个代码的心得体会。

wAAACwAAAAAAQABAEACAkQBADs=

一、模型输入数据

1、create_input_files.py + utils.py(create_input_files函数)

这两个东西，是用来生成输入模型的数据文件的，不是特别难理解，其中：

(1)图像

wAAACwAAAAAAQABAEACAkQBADs= HDF5文件：

由于直接输入图像会导致占用内存太多而降低效率(一般电脑都接受不了)，所以要将图像都压缩存储在hdf5中，并在此过程中图像大小均被resize成(3，256，256)，同时它也会记录每个图片有多少个描述句子，这里是5。

(2)词表

wAAACwAAAAAAQABAEACAkQBADs= WORDMAP文件：

所谓的词表文件，格式为：“wo

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/IT小白/article/detail/852400