赞
踩
Ubuntu18.04 + CUDA10.0.130 + Python3.6 + Pytorch1.2
环境搭建参考这里
git clone -b pytorch-1.0 https://github.com/jwyang/faster-rcnn.pytorch.git
一般情况都是由于包不完整或者版本不匹配造成
运行
python setup.py build develop
后出现的问题
subprocess.CalledProcessError: Command '['which', 'x86_64-conda_cos6-linux-gnu-c++']' returned non-zero exit status 1
安装包
conda install gxx_linux-64
ImportError: cannot import name '_mask'
或者
ModuleNotFoundError: no module named'pycocotools_mask'
运行
git clone https://github.com/cocodataset/cocoapi.git
cd cocoapi/PythonAPI
make
make install
将pycocotools文件夹复制到项目的faster-rcnn.pytorch/lib中,替换原有文件
训练时出现no CUDA-capable device is detected
查到相关资料说是显卡驱动的CUDA版本和Pytorch中的不一样
运行 nvidia-smi
后的看到CUDA版本10.2
+-----------------------------------------------------------------------------+ | NVIDIA-SMI 440.44 Driver Version: 440.44 CUDA Version: 10.2 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | |===============================+======================+======================| | 0 GeForce RTX 207... Off | 00000000:01:00.0 On | N/A | | 0% 27C P8 8W / 215W | 92MiB / 7979MiB | 1% Default | +-------------------------------+----------------------+----------------------+ +-----------------------------------------------------------------------------+ | Processes: GPU Memory | | GPU PID Type Process name Usage | |=============================================================================| | 0 1125 G /usr/lib/xorg/Xorg 90MiB | +-----------------------------------------------------------------------------+
运行nvcc -V
后看到CUDA版本10.0
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130
进入Python后查看Pytorch的CUDA版本
>>> import torch
>>> torch.version.cuda
'10.0.130'
看到CUDA版本是相同的,nvidia-smi中版本不同并不影响
这个问题其实是没有设置要调用的GPU,在训练时设置GPU即可
我只有一块显卡,将下面代码中的$GPU_ID替换为0后可正常训练
CUDA_VISIBLE_DEVICES=$GPU_ID python trainval_net.py \
--dataset pascal_voc --net vgg16 \
ImportError: cannot import name 'imread'
一般缺少PIL或者pillow包
若安装后仍错误仍存在,查看scipy版本,若版本过高,降级安装scipy-1.2.1
VOC数据集
项目本身没有提供数据集,根据README中推荐项目找到的数据集并不完整,JEPGImages只有很少一部分,运行后会出现文件不存在的错误,所以需要自己找数据。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。