论文复现前奏篇:漫漫长路之Caffe-C3D
- 2019 年 10 月 6 日
- 筆記
漫漫长路之Caffe-C3D
0.导语1.Caffe源码编译1.0 NVIDIA与Anaconda31.1 GCC与G++降级1.2 cuda 9.01.3 cuDNN1.4 caffe-gpu源码编译1.5 python库安装1.6 编译1.7 环境变量1.8 导包测试2.caffe-cifar10测试2.1 获取数据集2.2 转换数据集格式2.3 训练及测试3.Caffe-C3D3.1 下载及配置3.2 安装库与编译4.C3D-cifar10测试4.1 获取数据集4.2 转换数据集格式4.3 训练及测试
0.导语
我终于复活了,哈哈,好几天没更文了,这次更文内容为:Caffe源码编译及Caffe-C3D搭建及测试!
由于需要复现与C3D相关的论文,所以需要配置Caffe及C3D。这几天折腾了好久,终于解决了。发现了最大的bug在于我没有把cuda装好,痛苦流涕,随后,两次按照网上教程将系统崩溃了,只有重新来过,在然后,就直接看官方的issue,结果搞成功了,于是写出这篇文章,希望对大家有点帮助,欢迎转发,点赞等!
学习本文,需要有足够的毅力与动手能力,否则不要尝试,因为你会碰到各种问题,同时你也可以学到更多内容!学习指导是动起手来!
1.Caffe源码编译
1.0 NVIDIA与Anaconda3
关于NVIDIA显卡驱动与Anaconda3安装,见之前的一篇文章:Ubuntu18.04完美搭建Tensorflow-GPU1.8
1.1 GCC与G++降级
我使用的是Ubuntu18.04系统,该系统默认装的gcc为7.3,而cuda支持的版本是6.0以下,所以我们需要降级,这里选择的版本为gcc5.5。
安装gcc5:
sudo apt-get install gcc-5 g++-5
降级方法:
sudo mv gcc gcc.bak sudo ln -s gcc-5 gcc sudo mv g++ g++.bak sudo ln -s g++-5 g++
测试版本:
gcc --version g++ --version
输出显示5.5即可!

1.2 cuda 9.0
之前安装的cuda是通过xxx.run安装,并且没有安装补丁,所以先将原先的卸载,卸载方法:
sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl
然后下载deb与补丁,如下图:

一定要全部下载并安装,不要只下载第一个,不然后面各种bug!
sudo dpkg -i cuda-repo-ubuntu1704-9-0-local_9.0.176-1_amd64.deb sudo apt-key add /var/cuda-repo-9-0-local/7fa2af80.pub sudo dpkg -i cuda-repo-ubuntu1704-9-0-local-cublas-performance-update_1.0-1_amd64.deb sudo dpkg -i cuda-repo-ubuntu1704-9-0-local-cublas-performance-update-2_1.0-1_amd64.deb sudo dpkg -i cuda-repo-ubuntu1704-9-0-local-cublas-performance-update-3_1.0-1_amd64.deb sudo dpkg -i cuda-repo-ubuntu1704-9-0-176-local-patch-4_1.0-1_amd64.deb sudo apt-get update

sudo apt install cuda
问题:

解决:
sudo apt install aptitude sudo aptitude install cuda

sudo gedit ~/.bashrc
export CUDA_HOME=/usr/local/cuda-9.0 export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:/usr/local/cuda-9.0/extras/CUPTI/lib64:$LD_LIBRARY_PATHs export PATH=/usr/local/cuda-9.0/bin:$PATH export LD_LIBRARY_PATH="/usr/local/cuda-9.0/lib64:/usr/local/cuda-9.0/extras/CUPTI/lib64:/usr/local/cuda-9.0/lib64:/usr/local/cuda-9.0/lib64"
生效:
source ~/.bashrc
1.3 cuDNN
https://developer.nvidia.com/rdp/cudnn-archive
选择下载最新版本cuDNN v7.4.1 for CUDN 9.0。
解压:
tar -zxvf xxx.tgz
解压后为一个cuda目录:cuda
终端输入:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
完成cuDNN配置!
终端输入:
nvcc -V
若显示如下信息:

则成功!
1.4 caffe-gpu源码编译
caffe-cuda安装:
sudo apt install caffe-cuda
依赖库安装:
sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev sudo apt-get install libhdf5-serial-dev protobuf-compiler sudo apt-get install --no-install-recommends libboost-all-dev sudo apt-get install libopenblas-dev liblapack-dev libatlas-base-dev sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev
clone源码:
git clone https://github.com/BVLC/caffe.git
配置文件:
cd caffe sudo cp Makefile.config.example Makefile.config sudo vim Makefile.config
如下配置Makefile.config:
(1)CUDA配置
找到CUDA_ARCH,删除前两行(含compute_20的两行)!
(2)去掉注释:
USE_CUDNN:= 1 # CUDNN配置 OPENCV_VERSION := 3 # opencv版本 WITH_PYTHON_LAYER := 1 # python编写layer配置
(3)python配置
关闭默认的python2配置,也就是添加#
号即可!
将python环境更换为anaconda3环境:
ANACONDA_HOME := $(HOME)/anaconda3 PYTHON_INCLUDE := $(ANACONDA_HOME)/include $(ANACONDA_HOME)/include/python3.6m $(ANACONDA_HOME)/lib/python3.6/site-packages/numpy/core/include
修改lib目录,原PYTHON_LIB注释,打开anaconda的PYTHON_LIB,如下所示:
# PYTHON_LIB := /usr/lib PYTHON_LIB := $(ANACONDA_HOME)/lib
(4)修改
找到INCLUDE_DIRS与LIBRARY_DIRS修改为下面配置项:
INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include /usr/include/hdf5/serial LIBRARY_DIRS := $(PYTHON_LIB) /usr/local/lib /usr/lib /usr/lib/x86_64-linux-gnu /usr/lib/x86_64-linux-gnu/hdf5/serial
如下配置Makefile:
首先打开该配置文件:
sudo vim Makefile
(1)修改python版本
PYTHON_LIBRARIES ?= boost_python python2.7 修改为: PYTHON_LIBRARIES ?= boost_python-py36 python3.6m
(2)修改NVCCFLAGS
NVCCFLAGS +=-ccbin=$(CXX) -Xcompiler-fPIC $(COMMON_FLAGS) 修改为: NVCCFLAGS += -D_FORCE_INLINES -ccbin=$(CXX) -Xcompiler -fPIC $(COMMON_FLAGS)
(3)修改LIBRARIES
将: LIBRARIES += glog gflags protobuf boost_system boost_filesystem m hdf5_hl hdf5 改为: LIBRARIES += glog gflags protobuf boost_system boost_filesystem m hdf5_serial_hl hdf5_serial
1.5 python库安装
- 进入python文件夹
pip install --upgrade python-dateutil for req in $(cat requirements.txt); do pip install $req; done
- 问题

- 解决
修改requirement.txt
sudo vim requirement
1.6 编译
进入caffe根目录:
sudo make clean sudo make all -j16
-j16表示使用16核处理器执行当前指令。

test:
sudo make test -j16

runtest:
sudo make runtest -j16

配置pycaffe:
sudo make pycaffe -j16 //配置pycaffe

1.7 环境变量
环境变量配置:
vim ~/.bashrc
尾部添加:
这里填写你的caffe下面的python目录
export PYTHONPATH=~/caffe/python:$PYTHONPATH
使环境变量生效:
source ~/.bashrc
1.8 导包测试
输入python进入python环境,然后继续输入
import caffe
报错:

解决:
解决方法,可通过输入:
pip install --upgrade python-dateutil

2.caffe-cifar10测试
在上述源码编译caffe后,对数据集cifar10做测试。
2.1 获取数据集
进入caffe根目录,直接运行下面脚本:
./data/cifar10/get_cifar10.sh
该脚本下载数据集比较慢,可以通过其他方式下载数据集后,直接解压数据集到cifar10文件夹下即可!注:解压是将文件夹下所有文件复制到cifar10目录下!通过这样操作可以不用执行这个脚本,当然也就是这个脚本的作用!
2.2 转换数据集格式
./examples/cifar10/create_cifar10.sh
运行后报错:Cannot create Cublas handle. Cublas won't be available.

解决:
sudo rm -rf ~/.nv/

2.3 训练及测试
./examples/cifar10/train_quick.sh


最后,在测试集上的精度为75%左右!
3.Caffe-C3D
3.1 下载及配置
下载:
git clone https://github.com/facebook/C3D.git
配置:
还是将Makefile.config.example
复制为Makefile.config
,并配置Makefile.config
与Makefile
!
cd caffe sudo cp Makefile.config.example Makefile.config sudo vim Makefile.config
(1)配置Makefile.config
# CUDA_ARCH修改(去掉前两行) CUDA_ARCH := -gencode arch=compute_30,code=sm_30 -gencode arch=compute_35,code=sm_35 -gencode=arch=compute_50,code=sm_50 #-gencode=arch=compute_50,code=compute_50 # opencv配置 OPENCV_VERSION := 3 # open for OpenBlas BLAS := open # anaconda环境修改 ANACONDA_HOME := $(HOME)/anaconda3 PYTHON_INCLUDE := $(ANACONDA_HOME)/include $(ANACONDA_HOME)/include/python3.6m $(ANACONDA_HOME)/lib/python3.6/site-packages/numpy/core/include PYTHON_LIB := $(ANACONDA_HOME)/lib # INCLUDE与LIBRARY修改 INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include /usr/include/hdf5/serial LIBRARY_DIRS := $(PYTHON_LIB) /usr/local/lib /usr/lib /usr/lib/x86_64-linux-gnu /usr/lib/x86_64-linux-gnu/hdf5/serial
(2)Makefile
PYTHON_LIBRARIES ?= boost_python-py36 python3.6m
3.2 安装库与编译
库安装:
cd python/ pip install -r requirements.txt
编译:
sudo make clean sudo make -j8

4.C3D-cifar10测试
4.1 获取数据集
进入数据集目录:
cd 你的C3D路径/C3D-V1.0/data/cifar10/
运行脚本:
./get_cifar10.sh
这个下载数据集比较慢,具体可以参考上面的方法手动来!
4.2 转换数据集格式
进入脚本目录:
cd 你的C3D路径/C3D-V1.0/examples/cifar10/
运行脚本:
./create_cifar10.sh
报错:

解决:
(1)编辑bashrc
sudo vim ~/.bashrc
(2)尾部添加:
export LD_LIBRARY_PATH="/usr/local/cuda/lib64" export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/home/light/anaconda3/lib"
(3)生效:
source ~/.bashrc
重新运行:

4.3 训练及测试
./train_quick.sh