当前位置:   article > 正文

faster-rcnn.pytorch 小白踩坑

faster-rcnn.pytorch 小白踩坑

环境

Ubuntu18.04 + CUDA10.0.130 + Python3.6 + Pytorch1.2
环境搭建参考这里

代码下载

Pytorch1.0版本源码

git clone -b pytorch-1.0 https://github.com/jwyang/faster-rcnn.pytorch.git
  • 1

遇见的坑

一般情况都是由于包不完整或者版本不匹配造成

运行

python setup.py build develop
  • 1

后出现的问题

1

subprocess.CalledProcessError: Command '['which', 'x86_64-conda_cos6-linux-gnu-c++']' returned non-zero exit status 1

安装包

conda install gxx_linux-64
  • 1

2

ImportError: cannot import name '_mask'
或者
ModuleNotFoundError: no module named'pycocotools_mask'

运行

git clone https://github.com/cocodataset/cocoapi.git
cd cocoapi/PythonAPI
make
make install
  • 1
  • 2
  • 3
  • 4

将pycocotools文件夹复制到项目的faster-rcnn.pytorch/lib中,替换原有文件

3

训练时出现no CUDA-capable device is detected
查到相关资料说是显卡驱动的CUDA版本和Pytorch中的不一样
运行 nvidia-smi后的看到CUDA版本10.2

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.44       Driver Version: 440.44       CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce RTX 207...  Off  | 00000000:01:00.0  On |                  N/A |
|  0%   27C    P8     8W / 215W |     92MiB /  7979MiB |      1%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1125      G   /usr/lib/xorg/Xorg                            90MiB |
+-----------------------------------------------------------------------------+
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16

运行nvcc -V后看到CUDA版本10.0

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130
  • 1
  • 2
  • 3
  • 4

进入Python后查看Pytorch的CUDA版本

>>> import torch
>>> torch.version.cuda
'10.0.130'
  • 1
  • 2
  • 3

看到CUDA版本是相同的,nvidia-smi中版本不同并不影响

这个问题其实是没有设置要调用的GPU,在训练时设置GPU即可
我只有一块显卡,将下面代码中的$GPU_ID替换为0后可正常训练

CUDA_VISIBLE_DEVICES=$GPU_ID python trainval_net.py \
                   --dataset pascal_voc --net vgg16 \
  • 1
  • 2

4

ImportError: cannot import name 'imread'
一般缺少PIL或者pillow包
若安装后仍错误仍存在,查看scipy版本,若版本过高,降级安装scipy-1.2.1

5

VOC数据集

项目本身没有提供数据集,根据README中推荐项目找到的数据集并不完整,JEPGImages只有很少一部分,运行后会出现文件不存在的错误,所以需要自己找数据。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/783446
推荐阅读
相关标签
  

闽ICP备14008679号