基于ZStack构建深度学习云平台

发布时间：2019-02-24 01:41:00 所属栏目：评测来源：朱天顺

导读：副标题#e# 前言深度学习是机器学习和人工智能研究的热门分支，也是当今最流行的科学研究趋势之一。深度学习方法为计算机视觉、机器学习带来了革命性的进步，而新的深度学习技术也正在不断诞生。由于深度学习正快速发展，新的研究者很难对这一技术实时跟进

3.1 运行环境准备

安装pip
# curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
# python get-pip.py
# pip --version
pip 18.1 from /usr/lib/python2.7/site-packages/pip (python 2.7)
# python --version
Python 2.7.5
安装GCC G++
# yum install gcc gcc-c++
# gcc --version
gcc (GCC) 4.8.5 20150623 (Red Hat 4.8.5-36)
安装一些需要的包
#yum -y install zlib*
#yum install openssl-devel -y
#yum install sqlite* -y
升级CentOS默认Python2.7.5版本到3.6.5
下载Python源码包
# wget -c https://www.python.org/ftp/python/3.6.5/Python-3.6.5.tgz
解压源码包
# tar -zvxf Python-3.6.5.tgz
进入源码目录
# cd Python-3.6.5/
# ./configure --with-ssl
编译并安装
# make && make install
查看一下新安装的python3的文件位置
# ll /usr/local/bin/python*

基于ZStack构建深度学习云平台

3.2 安装CUDA

升级内核：  
  
# rpm -import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org  
  
# rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm  
  
# yum -y --enablerepo=elrepo-kernel install kernel-ml.x86_64 kernel-ml-devel.x86_64  
  
查看内核版本默认启动顺序：  
  
awk -F' '$1=="menuentry " {print $2}' /etc/grub2.cfg  
  
CentOS Linux (4.20.0-1.el7.elrepo.x86_64) 7 (Core)  
  
CentOS Linux (3.10.0-862.el7.x86_64) 7 (Core)  
  
CentOS Linux (0-rescue-c4581dac5b734c11a1881c8eb10d6b09) 7 (Core)  
  
#vim /etc/default/grub  
  
GRUB_DEFAULT=saved 改为GRUB_0=saved  
  
运行grub2-mkconfig命令来重新创建内核配置  
  
# grub2-mkconfig -o /boot/grub2/grub.cfg  
  
#reboot  
  
# uname -r 重启后验证一下内核版本  
  
4.20.0-1.el7.elrepo.x86_64  
  
CUDA Toolkit安装有两种方式：  
  
Package安装 (RPM and Deb packages)  
Runfile安装  
这里选择使用Runfile模式进行安装  
  
安装包下载：https://developer.nvidia.com/compute/cuda/10.0/Prod/local_installers/cuda_10.0.130_410.48_linux  
 
根据自身操作系统进行安装包筛选，并下载。复制下载链接直接用wget -c命令进行下载  
  
# wget -c https://developer.nvidia.com/compute/cuda/10.0/Prod/local_installers/cuda_10.0.130_410.48_linux  
  
#chmod +x cuda_10.0.130_410.48_linux  
  
#./cuda_10.0.130_410.48_linux  
  
Do you accept the previously read EULA?  
  
accept/decline/quit: accept  
  
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?  
  
(y)es/(n)o/(q)uit: y  
  
Install the CUDA 10.0 Toolkit?  
  
(y)es/(n)o/(q)uit: y  
  
Enter Toolkit Location  
  
[ default is /usr/local/cuda-10.0 ]:  
  
Do you want to install a symbolic link at /usr/local/cuda?  
  
(y)es/(n)o/(q)uit: y  
  
Install the CUDA 10.0 Samples?  
  
(y)es/(n)o/(q)uit: y  
  
Enter CUDA Samples Location  
  
[ default is /root ]:  
  
配置CUDA运行环境变量：  
  
# vim /etc/profile  
  
# CUDA  
  
export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}  
  
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}  
  
# source /etc/profile  
  
检查版本  
  
# nvcc --version  
  
nvcc: NVIDIA (R) Cuda compiler driver  
  
Copyright (c) 2005-2018 NVIDIA Corporation  
  
Built on Sat_Aug_25_21:08:01_CDT_2018  
  
Cuda compilation tools, release 10.0, V10.0.130  
  
使用实例验证测试CUDA是否正常：  
  
#cd /root/NVIDIA_CUDA-10.0_Samples/1_Utilities/deviceQuery  
  
# make  
  
"/usr/local/cuda-10.0"/bin/nvcc -ccbin g++ -I../../common/inc -m64 -gencode arch=compute_30,code=sm_30 -gencode arch=compute_35,code=sm_35 -gencode arch=compute_37,code=sm_37 -gencode arch=compute_50,code=sm_50 -gencode arch=compute_52,code=sm_52 -gencode arch=compute_60,code=sm_60 -gencode arch=compute_61,code=sm_61 -gencode arch=compute_70,code=sm_70 -gencode arch=compute_75,code=sm_75 -gencode arch=compute_75,code=compute_75 -o deviceQuery.o -c deviceQuery.cpp  
  
"/usr/local/cuda-10.0"/bin/nvcc -ccbin g++ -m64 -gencode arch=compute_30,code=sm_30 -gencode arch=compute_35,code=sm_35 -gencode arch=compute_37,code=sm_37 -gencode arch=compute_50,code=sm_50 -gencode arch=compute_52,code=sm_52 -gencode arch=compute_60,code=sm_60 -gencode arch=compute_61,code=sm_61 -gencode arch=compute_70,code=sm_70 -gencode arch=compute_75,code=sm_75 -gencode arch=compute_75,code=compute_75 -o deviceQuery deviceQuery.o  
  
mkdir -p ../../bin/x86_64/linux/release  
  
cp deviceQuery ../../bin/x86_64/linux/release  
  
# cd ../../bin/x86_64/linux/release/  
  
# ./deviceQuery  
  
#./deviceQuery Starting...  
  
CUDA Device Query (Runtime API) version (CUDART static linking)  
  
Detected 1 CUDA Capable device(s)  
  
Device 0: "Quadro P2000"  
  
CUDA Driver Version / Runtime Version 10.0 / 10.0  
  
CUDA Capability Major/Minor version number: 6.1  
  
Total amount of global memory: 5059 MBytes (5304745984 bytes)  
  
( 8) Multiprocessors, (128) CUDA Cores/MP: 1024 CUDA Cores  
  
GPU Max Clock rate: 1481 MHz (1.48 GHz)  
  
Memory Clock rate: 3504 Mhz  
  
Memory Bus Width: 160-bit  
  
L2 Cache Size: 1310720 bytes  
  
Maximum Texture Dimension Size (x,y,z) 1D=(131072), 2D=(131072, 65536), 3D=(16384, 16384, 16384)  
  
Maximum Layered 1D Texture Size, (num) layers 1D=(32768), 2048 layers  
  
Maximum Layered 2D Texture Size, (num) layers 2D=(32768, 32768), 2048 layers  
  
Total amount of constant memory: 65536 bytes  
  
Total amount of shared memory per block: 49152 bytes  
  
Total number of registers available per block: 65536  
  
Warp size: 32  
  
Maximum number of threads per multiprocessor: 2048  
  
Maximum number of threads per block: 1024  
  
Max dimension size of a thread block (x,y,z): (1024, 1024, 64)  
  
Max dimension size of a grid size (x,y,z): (2147483647, 65535, 65535)  
  
Maximum memory pitch: 2147483647 bytes  
  
Texture alignment: 512 bytes  
  
Concurrent copy and kernel execution: Yes with 2 copy engine(s)  
  
Run time limit on kernels: No  
  
Integrated GPU sharing Host Memory: No  
  
Support host page-locked memory mapping: Yes  
  
Alignment requirement for Surfaces: Yes  
  
Device has ECC support: Disabled  
  
Device supports Unified Addressing (UVA): Yes  
  
Device supports Compute Preemption: Yes  
  
Supports Cooperative Kernel Launch: Yes  
  
Supports MultiDevice Co-op Kernel Launch: Yes  
  
Device PCI Domain ID / Bus ID / location ID: 0 / 0 / 11  
  
Compute Mode:  
  
< Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >  
  
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 10.0, CUDA Runtime Version = 10.0, NumDevs = 1  
  
Result = PASS  
  
Result = PASS且测试过程中无报错，表示测试通过！

3.3安装 cuDNN

（编辑：宣城站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/15

首页

尾页

技嘉B550M AORUS ELIT	高通骁龙G3x游戏掌机上
手机也能拍宽幅一加X	华为率先完成中国电信