Centos7+RTX2080Ti深度学习环境配置

不穿秋裤的南方人    2019-01-10 20:40

首先介绍一下实验室服务器的硬件配置:两块Xeon(R) CPU E5-2620 v4; 两块RTX2080Ti; 内存DDR4 32G; 固态硬盘256G

一、安装前准备工作:

1.检查是否安装GPU,查看显卡信息:
lspci |grep -i nvidia
2.升级系统,准备工具:
yum -y update
yum -y groupinstall 'Development Tools'
yum -y install kernel-devel
yum -y install epel-release
yum -y install dkms
3.添加ElRepo源:
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm
4.安装显卡驱动检查:
yum install nvidia-detect
5.获取所需驱动版本:
nvidia-detect -v # 输入该命令,返回所需显卡驱动版本
6.下载对应版本.run文件:
下载网址:https://www.geforce.cn/drivers
7.编辑grub文件:
vim /etc/default/grub
在"GRUB_CMDLINE_LINUX"中添加"rd.driver.blacklist=nouveau nouveau.modeset=0"
随后生成配置
grub2-mkconfig -o /boot/grub2/grub.cfg
8.创建blacklist:
vim /etc/modprobe.d/blacklist.conf
添加"blacklist nouveau"
9.重启:
reboot
10.确认禁用了nouveau:
lsmod | grep nouveau # 若无显示则禁用成功

二、安装显卡驱动

!!!切记,我们需要关闭图形界面去安装驱动,否则会报错!!!
1.同时按键Ctrl、Alt和F2键,使用root用户登录:
2.接着输入init 3进入文本模式:
3.在文本模式下输入:
chmod a+x NVIDIA-Linux-x86_64-410.78.run
./NVIDIA-Linux-x86_64-410.78.run -no-opengl-files
(集显需加opengl相关系数)
4.根据对话选项,选择按钮,完成安装,退回到命令行:
安装过程中,选择accept
如果提示要修改xorg.conf,选择yes
5.查看GPU详细信息:
nvidia-smi
若出现GPU详细信息,表示显卡驱动安装成功

三、安装CUDA及cuDNN

1.根据上一篇博客的介绍,选择合适版本的CUDA及cuDNN:
2.同样需要关闭图形界面来安装CUDA:
同“步骤二”进入到文本模式
3.安装CUDA:
chmod +x cuda_9.0.176_384.81_linux.run
sh cuda_9.0.176_384.81_linux.run
由于事先我们自己安装了匹配的驱动,所以第一项Driver出来的时候选择N后面全是Y即可
4.添加至全环境变量,所有用户都能使用:
vim /etc/profile
在其中,添加
export PATH=$PATH:/usr/local/cuda-9.0/bin    
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64
5.立即生效文件:
source /etc/profile
6.验证操作一:
nvcc -V # 可以看到CUDA版本
7.验证操作二:
cd /usr/local/cuda/samples/
make
./bin/x86_64/linux/release/deviceQuery
./bin/x86_64/linux/release/bandwidthTest
显示Result=PASS,则测试通过
8.官网下的cuDNN是solitairetheme8格式的,将其转化并解压:
cp cudnn-8.0-linux-x64-v5.1.solitairetheme8 cudnn-8.0-linux-x64-v5.1.tgz
tar -xvf cudnn-8.0-linux-x64-v5.1.tgz
9.将cuDNN解压后的文件复制到cuda的路径下:
cd cuda
cp include/* /usr/local/cuda-9.0/inlcude/
cp lib64/lib* /usr/local/cuda-9.0/lib64/
10.修改文件权限:
chmod a+r /usr/local/cuda-9.0/include/cudnn.h /usr/local/cuda-9.0/lib64/libcudnn*

配置完成!Python环境在此就不进行介绍了

参考教程:

驱动安装教程:https://blog.csdn.net/darkeyers/article/details/80235386

在linux下解压 .solitairetheme8 文件:https://blog.csdn.net/qq_38451119/article/details/85340267

ERROR: You appear to be running an X server; please exit X before installing:http://blog.51cto.com/8656934/1727329

chmod a+r file:给所有用户添加读的权限:https://blog.csdn.net/lixiangyong123/article/details/53012843

anaconda下载地址:https://www.anaconda.com/download/#linux

配置GPU版本的tensorflow:https://www.jianshu.com/p/c5ee19cdc9b6/?tdsourcetag=s_pcqq_aiomsg

一文贯通 CentOS 7 下安装tensorflow-gpu:https://blog.csdn.net/weixin_41294780/article/details/80482186

centos 7 安装CUDA9.0 +CUDNN:https://www.jianshu.com/p/a201b91b3d96

centos下显卡驱动和cuda安装:https://blog.csdn.net/qq_41493990/article/details/82183035

 

Views: 6.5K

[[total]] comments

Post your comment
  1. [[item.time]]
    [[item.user.username]] [[item.floor]]Floor
  2. Click to load more...
  3. Post your comment