cuda指定某块gpu运行程序
(1)先查看当前服务器下的显卡情况: nvidia-smi
(2)用如下命令指定某张卡,来运行程序:
CUDA_VISIBLE_DEVICES=4 python mainpy --cuda
主流的nvidia显卡都支持GeForce是面向一般用户的主流显卡Quadro是面向工作站的显卡Tesla是面向服务器的显卡使用cuda进行计算是一样的一般用户可以只用考虑流处理、带宽等参数(geforce,quadro显卡)Tesla显卡有特殊要求
GPU占用没释放。服务器有八个gpu但是还是显示cuda没内存的原因是GPU占用没释放。解决方法:
1、首先打开dos窗口(windows+R键)。
2、其次输入nvidia-smi命令获取GPU信息。
3、然后查看运行的processor。
4、最后关掉正在运行的processor,taskkill-PID进程号-F。
戴尔 PowerEdge T110 II 服务器主板上支持PCI Express x16插槽,可以安装一些低端或中端显卡来提供基本的图形处理功能。根据戴尔官方网站的技术规格说明,PowerEdge T110 II 主板与 NVIDIA Quadro K620 显卡兼容。NVIDIA Quadro K620 是一款面向专业应用的低端显卡,采用 Kepler GPU 架构,具有2GB GDDR3显存、384个CUDA核心和支持 DirectX 11 和 OpenGL 44 等特性。如果您需要在 PowerEdge T110 II 服务器上使用这款显卡,建议选择OEM厂商认证过的产品,以确保其良好的兼容性和稳定性。当然,您还需要确认服务器电源和散热系统是否足够支持额外的显卡功耗和热量产生,以避免过度负载和故障。
1 下载
11 系统镜像
由于我尝试了ubuntu1404,安装Nvidia驱动之后,会出现循环登录的问题,并始终无法找到有效的解决途径,所以只能选择ubuntu1604了。
12 CUDA 80
说明:
(1)在NVIDIA的CUDA下载页面下,选择要使用的CUDA版本进行下载。
(2)我们这里使用CUDA80(页面有提示GTX1070、GTX1080支持80版本),学员如果没有使用以上两个版本的GPU,可以下载CUDA75。DOWNLOAD(下载)。
(3)下载需要注册。
(4)图解选择
13 cuDNN v5
说明:
(1)下载需要填写一个调查问卷,就三个选项,建议认真填写,毕竟人家免费给咱使用。
(2)填写完毕点击 I Agree To 前面的小方框,出现如下:
14 Tensorflow 011
tensorflow github上面提到 4 种安装方式,本教程使用 第四种 源码安装
Virtualenv installation
Anaconda installation
Docker installation
Installing from sources
说明:
(1)打开下载页面,往下翻,直到下图这个位置:
(2) 点击Python 2开始下载。
最后,将12-14中下载文件全部存放至自己的移动硬盘/U盘内,等待安装时候使用。
2 安装ubuntu1604 LTS 系统
安装Ubuntu1604:
说明:
(1)我们直接安装的英文原版系统,语言也是选择英文的。
(2)上述链接在–第三步:安装类型上选择的是–自定义。我们选择的是–清除整个磁盘并且安装,如果你有Windows系统,还会提示安装Ubuntu1604与Windows并存模式。这个自行选择,切记!这个地方谨慎选择。
(3)感谢百度经验上传者!
3 安装NVIDIA驱动
打开terminal输入以下指令:
sudo apt-get update1
然后在系统设置->软件更新->附加驱动->选择nvidia最新驱动(361)->应用更改
3 cuda 80
31 安装cuda
在cuda所在目录打开terminal依次输入以下指令:
cd /home/(自己的用户名)/Desktop/###(这个命令意思是找到刚刚我们用U盘传过来的文件)
sudo dpkg -i cuda-repo-ubuntu1604-8-0-rc_8027-1_amd64deb
sudo apt-get update
sudo apt-get install cuda1234
32 gcc降版本
ubuntu的gcc编译器是540,然而cuda80不支持50以上的编译器,因此需要降级,把编译器版本降到49:
在terminal中执行:
sudo apt-get install g++-49
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-49 20
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 10
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-49 20
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 10
sudo update-alternatives --install /usr/bin/cc cc /usr/bin/gcc 30
sudo update-alternatives --set cc /usr/bin/gcc
sudo update-alternatives --install /usr/bin/c++ c++ /usr/bin/g++ 30
sudo update-alternatives --set c++ /usr/bin/g++123456789
3 安装cuDNN
打开terminal依次输入以下指令:
cd /home/(自己的用户名)/Desktop/###(这个命令意思是找到刚刚我们用U盘传过来的文件)
tar xvzf cudnn-80-linux-x64-v51-gatgz###(解压这个文件)
sudo cp cuda/include/cudnnh /usr/local/cuda/include###(复制)
sudo cp cuda/lib64/libcudnn /usr/local/cuda/lib64###(复制)
sudo chmod a+r /usr/local/cuda/include/cudnnh /usr/local/cuda/lib64/libcudnn12345
4 安装其他依赖
41 配置环境变量
按照上图的教程,在terminal中输入以下命令:
sudo gedit ~/bash_profile #打开bash_profile1
然后在打开的文本末尾加入:
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64"
export CUDA_HOME=/usr/local/cuda12
继续在terminal中输入:
source ~/bash_profile #使更改的环境变量生效1
当然,也有其他教程在文件~/bashrc文件中写入的,方法与上面的类似。如果在后面配置/config文件出现问题时,可以实现这个方法。
42 安装其他库
/tensorflow/tensorflow/blob/master/tensorflow/g3doc/get_started/os_setupmd
我们是在github的Tensorflow官方网页上,根据提示安装,地址如上。
按步骤截图如下
在terminal中输入以下命令:
sudo apt-get install python-pip python-dev 1
4 安装Bazel
41 安装Bazel依赖
由于本教程使用tensorflow源码编译/安装,所以需要使用 bazel build。
在terminal中依次输入以下1-7的命令
42 安装Bazel
之后回到之前的Tensorflow安装教程页面: /tensorflow/tensorflow/blob/master/tensorflow/g3doc/get_started/os_setupmd
点击链接: installer for your system,跳转到Bazel的下载页面:
下载bazel-032-installer-linux-x86_64sh到桌面,然后在terminal中输入以下命令
cd /home/(自己的用户名)/Desktop/###(这个命令意思是找到刚刚我们用U盘传过来的文件)
chmod +x PATH_TO_INSTALLSH #对sh文件授权
/PATH_TO_INSTALLSH --user #运行sh文件123
43 安装第三方库
在terminal中输入以下命令
sudo apt-get install python-numpy swig python-dev python-wheel #安装第三方库
sudo apt-get install git
git clone git://githubcom/numpy/numpygit numpy 123
5 安装tensorflow
51 下载tensorflow
在terminal中输入以下命令
git clone /tensorflow/tensorflow1
特别注意,我使用的是tensorflow 011版本,该版本要求cuda 75 以上,cuDNN v5。
默认下载目录是在/home下
52 配置tensorflow
还是刚刚的网址
/tensorflow/tensorflow/blob/master/tensorflow/g3doc/get_started/os_setupmd
在terminal中输入以下命令:
cd ~/tensorflow #切换到tensorflow文件夹
/configure #执行configure文件12
然后按照下图选项进行操作:
53 创建pip
在terminal中输入以下命令:
bazel build -c opt //tensorflow/tools/pip_package:build_pip_package
bazel build -c opt --config=cuda //tensorflow/tools/pip_package:build_pip_package
bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg
sudo pip install /home/(你自己的用户名)/Desktop/tensorflow-0100-cp2-none-anywhl1234
54 设置tensorflow环境
bazel build -c opt //tensorflow/tools/pip_package:build_pip_package
# To build with GPU support:
bazel build -c opt --config=cuda //tensorflow/tools/pip_package:build_pip_package
mkdir _python_build
cd _python_build
ln -s /bazel-bin/tensorflow/tools/pip_package/build_pip_packagerunfiles/org_tensorflow/
ln -s /tensorflow/tools/pip_package/
python setuppy develop12345678
这样就大功告成啦~!!!
6 测试tensorflow
这里进行测试,如果你能跟我看到同样的画面,那恭喜你成功配置GPU版的tensorflow啦!
0条评论