当前位置：服务支持 > 软件文章 > TensorFlow GPU版安装详解

TensorFlow GPU版安装详解

阅读数 715

TensorFlow™ 是一个开放源代码软件库，用于进行高性能数值计算。借助其灵活的架构，用户可以轻松地将计算工作部署到多种平台（CPU、GPU、TPU）和设备（桌面设备、服务器集群、移动设备、边缘设备等）。TensorFlow™ 最初是由 Google Brain 团队（隶属于 Google 的 AI 部门）中的研究人员和工程师开发的，可为机器学习和深度学习提供强有力支持，并且其灵活的数值计算核心广泛应用于许多其他科学领域。目前TensorFlow™ 有适用于CPU（TensorFlow CPU）和GPU（TensorFlow GPU）的两种安装选择。有区别于通过pip安装TensorFlow CPU版本，安装TensorFlow GPU还需要更多的底层依赖。

$ pip install tensorflow==1.12

TensorFlow GPU主要是通过NVIDIA提供的CUDA和cuDNN存取GPU,从而实现比CPU快数十倍的深度学习训练加速能力。本文主要介绍TensorFlow GPU版本的安装和使用。

名词解释

在进入正题之前，首先详细介绍一下其所涉及的几个名词。

Graphic Processing Unit（GPU）：用于个人计算机、工作站和服务器的专用图像设备。又名显示卡或显卡，目前主要的生产厂商是NVIDA生产的N卡和AMD 生产的A卡。相比于由几个核组成CPU专注于顺序串行处理，GPU 则拥有一个由数以千计的更小、更高效的核组成的大规模并行计算架构，其更擅长并行计算。
Compute Unified Device Architecture（CUDA）：它是NVIDIA推出的能够解决GPU复杂计算问题的并行计算架构。目前NVIDIA面向分布式计算的显卡架构的演变已经历了Tesla、Fermi、Kepler、Maxwell、Pascal、Volta（以物理学家名字命名），且随着架构的演变其浮点计算的能力也越来越强。在NVIDIA Tesla常以第一个字母来命名其产品，比如Tesla M40、Tesla P100、Tesla V100。

详解TensorFlow™ GPU 安装_java_02

CUDA Toolkit：CUDA Toolkit是为创建高性能GPU加速应用程序提供了开发环境。目前支持C，C ++，Fortran，Python和MATLAB的编程，编译器的名称是nvcc。
NVIDIA GPU drivers（显卡驱动）：它是用来驱动NVIDIA显卡所对应的软件程序。
CUDA Deep Neural Network Library（cuDNN）：NVIDIA打造的针对深度神经网络的加速库，是一个用于深层神经网络的GPU加速库。如果你要用GPU训练模型，cuDNN不是必须的，但是一般会采用这个加速库。

GPU支持

安装TensorFlow GPU相应的硬件和软件（驱动和库）支持。TensorFlow™ 最新版本（1.12）对硬件：

NVIDIA® GPU card with CUDA® Compute Capability 3.5 or higher.

具有计算能力3.5或更高版本的NVIDIA®GPU卡。

对软件的要求：

NVIDIA® GPU drivers—CUDA 9.0 requires 384.x or higher.

NVIDIA® GPU 驱动程序 -CUDA 9.0需要384.x或更高版本。

CUDA® Toolkit—TensorFlow supports CUDA 9.0.

CUDA® Toolkit- TensorFlow支持CUDA 9.0。

CUPTIships with the CUDA Toolkit.

CUPTI附带CUDA工具包。

cuDNN SDK（> = 7.2）

NVIDIA深度神经网络的加速库(版本大于等于7.2)

硬件支持

从TensorFlow 所需要软件CUDA和CUDA的名词描述可以得出TensorFlow仅仅支持N卡，如果计算机属于A卡，则只能安装TensorFlow CPU版本，或者用AMD的ROCm GPU平台来安装GPU 版本的TensorFlow。本文重点讲以最为流行的N卡支持CUDA为重点讲解。使用lspci命令可以查看机器的NVIDIA显卡配置

$ lspci |grep -i nvidia

从显示结果看当前机器的GPU卡的型号是NVIDIA Tesla M40。当然，也并非所有的N卡都支持TensorFlow GPU 版本，其还要求GPU具有相应的计算能力，比如TensorFlow最新版1.12就要求计算能力大于3.5。NVIDIA GPU卡的计算能力可以通过其官网列表查询得到。目前NVIDIA产品主要系列有：

GeForce, 面向普通大众用户，包括GTX和TITAN系列，价格比较亲民，用于科学计算精度稍低。GTX桌面版750以上、笔记本930M以上和全系的TITAN X计算能力均大于等于5。
Tesla，面向企业部署而设计的用于大规模并行计算的产品，包含有F（Fermi 架构）、K（Kepler架构）、M（Maxwell架构）、P（Pascal架构）和V（Volta架构）系列产品。目前除Tesla K10以外，K、M、P、V系列的产品的计算能力均大于5。Tesla系列与GeForce 系列的TITAN X相比，其单机长期上线运行，稳定性更好。
Quadro，面向专业的绘图设计，其分为桌面版和手机版两个系列。
Terga/Jetson, 面向移动和嵌入式设备。

软件支持

TensorFlow官方文档会指定每一个TensorFlow GPU版本所依赖的python、cuDNN、GPU显卡驱动和CUDA的版本。在安装的时候一定注意版本的对应关系，若Python、cuDNN、GPU显卡驱动和CUDA的版本有低于TensorFlow GPU 要求的版本，在安装和使用过程中会出现错误。下表是TensorFlow GPU在Linux系统下版本对应表。

TensorFlow GPU	python	cuDNN	CUDA
1.12	2.7、3.3-3.6	>=7.2	9
1.11	2.7、3.3-3.6	>=7.2	9
1.10	2.7、3.3-3.6	7	9
1.9.0	2.7、3.3-3.6	7	9
1.8.0	2.7、3.3-3.6	7	9
1.7.0	2.7、3.3-3.6	7	9
1.6.0	2.7、3.3-3.6	7	9
1.5.0	2.7、3.3-3.6	7	9
1.4.0	2.7、3.3-3.6	6	8
1.3.0	2.7、3.3-3.6	6	8
1.2.0	2.7、3.3-3.6	5.1	8
1.1.0	2.7、3.3-3.6	5.1	8
1.0.0	2.7、3.3-3.6	5.1	8