CUDA环境配置---深度学习的硬件基础

2020-01-23 18:17栏目:龙竞技官网
TAG:

在工业界和学术界的科学家已将GPU用于机器学习以便于在各种应用中实现开创性的改进。将 GPU 加速器用于机器学习的早期用户包括诸多规模的网络和社交媒体公司,另外还有数据科学和机器学习领域中一流的研究机构。 与单纯使用 CPU 的做法相比,GPU 具有数以千计的计算核心、可实现 10-100 倍应用吞吐量,因此 GPU 已经成为数据科学家处理大数据的处理器。像Theano, tensorflow ,caffe 这类机器学习工具都支持GPU。

1.anaconda安装

环境:Ubuntu 16.04 64bit

下面就介绍一下 使用深度学习工具前的CPU环境搭建。

(1)在官网下载对应的安装包

Nvidia GeForce GTX 1070 (驱动Nvidia-Linux-x86_64-367.57)

Step1: 首先,需要在服务器上安装有NVIDA的GPU. 这是我们的硬件条件。

(2)在下载目录下执行以下操作

安装:CUDA 8.0.44

Step2: 安装CUDA

bash Anaconda3-5.0.1-Linux-x86_64.sh

cuDNN 5.1

进入Cuda下载页面 , 并根据 uname -a 的输出结果来选择下载的软件。

(3)对于安装提示,回车确认;进入licence文档,q跳过,yes确认,输入安装路径,开始安装

显卡驱动安装:Ubuntu 16.04 Nvidia 显卡驱动安装 见 http://www.linuxidc.com/Linux/2016-12/138907.htm

例如:

(4)安装完成后,选择将anaconda3的binary路径加入到.bashrc,以后Python和ipython命令会自动使用anaconda的Python环境

CUDA是NVIDIA的编程语言平台,想使用GPU就必须要使用cuda。

uname -a

Linux uA4-52 4.10.0-19-generic #21-Ubuntu SMP Thu Apr 6 17:04:57 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux # 这是一个x86_64架构的Ubuntu发行版, 属于linux操作系统

2.NVIDIA驱动安装

cuDNN是GPU加速计算深层神经网络的库。

于是选择:

(1)删除原有的NVIDIA驱动sudo apt-get remove --purge nvidia-*

下载CUDA

图片 1建议选择runfile文件,这种安装方式不仅简单,而且会在终端上提供用户安装选项(比如: 是否支持OpenGL,指定CUDA的安装位置, 以及是否下载CUDA实例),并且输出安装信息;

(2)从NVIDIA官网下载适合的驱动,下载完后

去官网下载CUDA。

runfile 文件的安装:

cd Downloads

我选择的是:

sudo chmod a+x cuda_9.0.176_384.81_linux.run # 添加执行权限

sudo sh cuda_9.0.176_384.81_linux.run # 执行run文件

sudo chmod a+x NVIDIA-Linux-x86_64-375.66.run #给驱动run文件赋予执行权限

Operating System : Linux

查看系统是否存在 /usr/local/cuda 和/usr/local/cuda-9.0 目录, 如果有,证明安装成功。

sudo ./NVIDIA-Linux-x86_64-375.66.run #安装驱动

Architecture : x86_64

在runfile文件安装的时候,会检测是否已经安装NVIDA驱动,如果没有,则会默认安装最新版本的驱动。在这个驱动可能和当前的GPU版本不符合。

reboot #重启

Distribution : Ubuntu

这个时候输入 nvidia-smi ,正常情况下会显示显卡信息。如果驱动和GPU版本不匹配,需要在NVIDIA驱动页面下载相应的驱动

(3)nvidia-smi #检验是否安装成功

Version : 16.04

这个时候,需要先查看服务器的GPU信息:

3.安装cuda8.0

Installer Type : runfile(local)

lspci | grep -i vga 或者 lspci | grep -i nvidia

注:目前最新的cuda版本为9.1,之前安装的时候与TensorFlow出现版本兼容问题,建议去TensorFlow官网查看版本支持之后再选择安装。

deb里似乎带了旧显卡驱动,安装完后还要重新装显卡驱动,有些麻烦。就用runfile。

根据输出信息选择下载的驱动:

(1)去官网下载:https://developer.nvidia.com/cuda-downloads

安装cuda

图片 2命令输出的信息是 NVIDIACorporation GK110GL [Tesla K20Xm]

我们选择下载runfile的local版本进行下载

我安装的时候运行完,显示安装cuda_toolkit的时候库libGLU.so和libXmu.so缺失。或许可以尝试先安装:

Step3: 按装驱动

(2)ctrl+alt+F1进入命令行界面

apt-get install libglu1-mesa libxi-dev libxmu-dev libglu1-mesa-dev

图片 3英伟达的驱动也是*.run 文件,安装方法与Cuda类似。不在赘述

cd Downloads

(见Missing recommended library: libGLU.so)

在安装驱动过程中可能会出现如下信息:

sudo service lightdm stop #禁用X服务

我是先装Nvidia驱动的,第一次装cuda的时候总是报Warning : Incomplete installation ...然后提示没有驱动。我感觉可能是显卡驱动那边有问题,于是

图片 4Linux安装Nvidia显卡驱动:禁用The Nouveau kernel driver的方法不需要查找,继续点击ok图片 5仔细阅读上面的英文信息;发现英伟达驱动已经做出了解决方案

sudo /etc/init.d/lightdm stop #一样的命令

sudo update-initramfs -u

于是重新启动电脑,激活驱动程序

sudo sh cuda-8.0.44_linux.run --no-opengl-libs

重启。

重启之后,使用 nvidia-smi 验证驱动是否安装正确:

选择不安装NVIDIA驱动,后面选择yes或默认即可

sudo modprobe nvidia

图片 6nvidia-smi 命令输入以后现实正常的GPU使用信息

sudo /etc/init.d/lightdm start #启用服务

然后安装Cuda。

保证了驱动和GPU安装正确之后, 接下来需要配置CUDA环境

reboot

具体参考:this installation did not install the CUDA driver

Step4 配置CUDA 环境

(3)修改环境配置sudo gedit ~/.bashrc

安装:

vim ~/.bashrc # 编辑bash shell

将下面两句加入路径并保存

sudo sh ./cuda_8.0.44_linux.run

在bashrc末尾追加一下文字;

export CUDA_HOME=/usr/local/cuda

(可通过sudo sh ./cuda_8.0.44_linux.run --help查看一些参数命令,安装某一部分或是卸载的参数都可以看到,可能有些情况安装要带--override参数)

CUDA_HOME="/usr/local/cuda"

exportPATH="${CUDA_HOME}/bin:${PATH}"

exportLD_LIBRARY_PATH=${LD_LIBRARY_PATH}:${CUDA_HOME}/lib64

export PATH=$PATH:$CUDA_HOME/bin

一大堆条款什么的,愿意看就看吧,不想看直接回车按到底。

版权声明:本文由龙竞技官网发布于龙竞技官网,转载请注明出处:CUDA环境配置---深度学习的硬件基础