赞
踩
哈喽,大家好,本文我将来带大家复现一篇顶会论文 DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders,我将会分为两大部分来完成介绍。首先,我会带大家进行论文代码的复现操作,教会大家将代码跑起来。然后,我再来介绍论文的相关内容,便于大家更好的理解论文。这篇主要帮助大家将论文代码跑起来。(PS:本人也是科研小白,第一次进行复现论文的工作,对论文的整个理解可能也不是很到位,如有错误请大家积极指出,我会第一时间修改错误。)
论文内容介绍:小白论文复现
我们先简单介绍一下论文相关内容:
课题:DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders
领域:计算机视觉——图像上色
会议:ICCV
作者:Xiaoyang Kang, Tao Yang, Wenqi Ouyang, Peiran Ren, Lingzhi Li, Xuansong Xie
本人也是第一进行论文复现,我们先简要介绍一下论文复现的基本步骤(以本篇为例,带大家详细复现该篇论文代码):
我们需要利用文献检索去查询合适我们领域研究的论文(通常会选择发布在顶刊或顶会论文),然后我们去下载该论文。这里推荐大家采用专业的文献管理工具(如:EndNote、Zotero 等)来进行文献的管理。
首先我们要仔细阅读并尝试去理解原始论文,包括其中提出的问题、方法、实验设置和结果。最重要的是要清楚该篇论文的创新点(引言结尾处会给出),并根据图例去理解作者所提出的模型和方法。
一般来说作者会在论文中给出开源代码,大多数都会放在Github上(本篇论文代码:https://github.com/piddnad/DDColor),我们进入网页后去下载代码,并阅读Readme部分。通常Readme会告诉我们如何去获取数据集,并告诉我们如何去使用这份代码。
我们需要在本地计算机(需要配有GPU的电脑)或云服务器上设置适当的开发环境,包括所需的软件包、库和依赖项(可以跟着视频来做)。通常使用虚拟环境(例如Python的虚拟环境或conda环境)来管理这些依赖项。如下图所示,作者告诉了我们需要配置的环境要求。
根据论文中描述的方法和算法,重新实现论文中的模型和实验,确保尽可能地复制论文中描述的实验设置和超参数,以及模型架构和训练过程。这对于小白来说是最困难的部分,因为大部分小白拿到代码后都会和我一样不知道从哪一步开始看代码。以我自身来说,我会先去找到参数配置部分,以便我们去设置输入输出路径和其他一些设置。然后去找到代码中的训练部分,看代码是如何进行训练的。我们来举例说明:阅读Readme部分,作者告诉了我们该如何训练。
在这里我并没有直接运行该脚本文件,而是在代码中找到其对应的train.py(点击train.sh文件,我们可以看到作者设置的一些参数并在第二行最后告诉了我们路径basicsr/train.py)。之后,我的选择是在yml文件中配置好相关参数,运行train.py然后根据报错内容去相应修改代码,不会的我就会选择去百度。
在完成代码的实现后,我们要验证模型是否能够在所选择的数据集上运行并产生与原始论文相似的结果。进行一些简单的测试和验证,以确保实现的正确性。我们举例说明:阅读Readme部分,作者告诉了我们该如何进行验证:在这里我们可以直接运行给出的代码去下载作者训练好的模型,并告诉了我们下载路径。然后我们运行脚本文件inference.sh就可以了。
在这里我还是和之前一样,找到对应的 .py 文件。我们训练好的模型会放在experiments文件下面,然后我们进入colorization_pipeline.py 文件,找到参数配置部分,替换model_path的路径后运行即可。
根据我们的需要,可以去尝试调整模型的超参数、训练策略或其他设置,再来进行实验并尽可能地与原始结果进行比较和分析,来查看是否可以进一步优化模型的性能。
我们可以来撰写一份报告或笔记,记录论文复现的过程、实现细节、实验结果和分析。这有助于他人理解你的工作,并为其他研究人员提供有用的参考。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。