当前位置：服务支持 > 软件文章 > TensorFlow 2.0快速上手教程（一）

TensorFlow 2.0快速上手教程（一）

阅读数 2038

使用GPU加速

1 安装配置GPU环境

1. 安装GPU版TF

在2.2节中我们已经安装了CPU版的TensorFlow，为了使用GPU来加速计算，我们必须安装GPU版的TensorFlow。这里我们可以直接使用pip命令来安装：

apip install tensorflow-gpu==2.0.0-alpha01.

安装完成后我们后我们可以查看一下当前可用的GPU：

from tensorflow.python.client import device_libdef get_available_gpus(): local_device_protos = device_lib.list_local_devices() return [x.name for x in local_device_protos if x.device_type == 'GPU']print(get_available_gpus())1.2.3.4.5.6.

由于作者的机器上有两块GPU，所以输出两块GPU的编号：“[‘/device:GPU:0’, ‘/device:GPU:1’]”。

2. 安装显卡驱动

根据你的显卡型号到官网（https://www.nvidia.cn/Download/index.aspx?lang=cn）下载对应的驱动。我的服务器上有两块Tesla P100的显卡，如图1所示选择对应的驱动程序。这里一定要注意选择正确的版本，要和你的显卡版本、操作系统版本以及想要安装的CUDA版本一一对应（关于TensorFlow与CUDA的版本对应关系，在后面CUDA的安装部分有说明）。

一文上手Tensorflow2.0（四）_linux

图1 NVIDA驱动下载列表

点击搜索，如图2所示，点击下载即可。

一文上手Tensorflow2.0（四）_官网_02

图2 NVIDA驱动下载提示

安装完成之后可以使用“nvidia-smi”命令查看显卡，如图3所示是我的服务器上的两块显卡。

一文上手Tensorflow2.0（四）_解压文件_03

图3 作者机器上的两块显卡的信息

3. 安装CUDA

在安装CUDA之前，我们一定要先搞清楚TensorFlow各个版本与CUDA版本的对应关系。在TensorFlow官网有相似的说明（https://tensorflow.google.cn/install/source），其中Linux系统环境下TensorFlow GPU版本与CUDA版本的对应关系如图4所示。

一文上手Tensorflow2.0（四）_安装配置_04

图4 TensorFlow与CUDA的版本对应关系

作者在撰写本章内容时的时间是2019年的3月，TensorFlow2.0的Alpha版上周才发布，因此这里还没有显示出TensorFlow2.0-GPU的信息。不过TensorFlow的官网有说明，如图5所示。

一文上手Tensorflow2.0（四）_安装配置_05

图5 TensorFlow2.0 GPU版依赖的NVIDA软件包

TensorFlow-GPU的2.0.0-alpha版对应的NVIDA驱动版本、CUDA版本、cuDNN的版本号如图5所示。

1）下载CUDA

首先我们到NVIDIA官网（https://developer.nvidia.com/cuda-toolkit）下载CUDA。作者在撰写本节内容时，CUDA的最新版本是10.1版本，这里再次提醒读者，一定要按照TensorFlow官网的说明下载10.0版本，否则安装好后TensorFlow是不能正常运行的。

一文上手Tensorflow2.0（四）_linux_06

图6 选择对应的CUDA版本

如图6所示，选择对应系统环境的CUDA版本，点击下载。

2）安装CUDA

CUDA下载页面有安装指引，如图7所示。

一文上手Tensorflow2.0（四）_tensorflow_07

图7 CUDA的安装步骤

第一步：执行安装命令

sudo dpkg -i cuda-repo-ubuntu1604-10-0-local-10.0.130-410.48_1.0-1_amd64.deb1.

第二步：添加kay

sudo apt-key add /var/cuda-repo-10-0-local-10.0.130-410.48/7fa2af80.pubupdate1.

第三步：依次执行

sudo apt-get updatesudo apt-get install cuda-10.01.2.

安装完成后，在“/usr/local”目录下会生成“cuda”和“cuda-10.0”两个文件夹，如图8所示，我们可以使用命令“cat/usr/local/cuda/version.txt”查看CUDA版本。

注意不要使用“sudo apt-getinstall cuda”，这样默认安装的是最新版，所以一定要指定版本。

一文上手Tensorflow2.0（四）_官网_08

图8 查看CUDA版本

第四步：设置环境变量

打开“~/.bashrc”文件，在文件的最后最后添加如下内容：

export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}1.2.

第五步：验证安装是否成功在终端执行命令“source ~/.bashrc”让环境变量生效。

1.进入目录“/usr/local/cuda-10.0/samples/1_Utilities/deviceQuery”中打开终端；

2.终端下执行编译命令：sudo make

3.然后执行命令：./deviceQuery，可以看到两块GPU的信息

如图9所示，检测到作者的两块显卡，图中是其中一块显卡的信息。到这里CUDA已经安装完成了。

一文上手Tensorflow2.0（四）_官网_09

图9 显卡的信息

4.安装cuDNN

1）下载（https://developer.nvidia.com/rdp/cudnn-download）

这里一定要下载与CUDA10.0对应的版本。下载CNDNN需要登录NVIDIA账号，没有的话，可以按照提示创建一个账号。

一文上手Tensorflow2.0（四）_tensorflow_10

图10 cuDNN与CUDA的版本对应关系

选择好cuDNN版本后，点击下载“cuDNN Library for Linux”，如图11所示。

一文上手Tensorflow2.0（四）_安装配置_11

图11 cuDNN下载列表

2）安装

第一步：解压文件

使用“tar”命令解压文件：

tar zxvf cudnn-10.0-linux-x64-v7.5.0.56.tgz1.

第二步：拷贝文件，并修改文件权限

sudo cp cuda/include/cudnn.h /usr/local/cuda/includesudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*1.2.3.

到这里TensorFlow2.0的GPU版就安装配置完成了。

2 使用TensorFlow-GPU

如果我们的机器上安装配置好了GPU版的TensorFlow，那么运行的时候TensorFlow会自行去选择可用的GPU。我们也可以通过“os.environ["CUDA_VISIBLE_DEVICES"]”来选择我们要使用的GPU：

import tensorflow as tfimport os# 选择编号为0的GPUos.environ["CUDA_VISIBLE_DEVICES"] = "0"# 创建模型model = tf.keras.Sequential()model.add(layers.Dense(16, activation='relu', input_shape=(10,)))model.add(layers.Dense(1, activation='sigmoid'))# 设置目标函数和学习率optimizer = tf.keras.optimizers.SGD(0.2)# 编译模型model.compile(loss='binary_crossentropy', optimizer=optimizer)# 输出模型概况model.summary()1.2.3.4.5.6.7.8.9.10.11.12.13.14.

代码中我们选择了编号为“0”的这个GPU，执行完上面的这段代码后我们使用命令“nvidia-smi”来查看一下GPU的占用情况，如图12所示，编号为“0”的GPU正在被占用。我们可以将代码中的“0”改为“1”来使用另一个GPU。

一文上手Tensorflow2.0（四）_官网_12

图12 查看GPU占用情况

如果我们希望使用多块GPU，例如同时使用“0”、“1”两块GPU，可以设置“os.environ["CUDA_VISIBLE_DEVICES"]= "0,1"”，除此之外我们还可以使用TensorFlow为“tf.keras”提供的分布式训练策略“tf.distribute.MirroredStrategy”来实现单机环境下的多GPU训练：

import tensorflow as tffrom tensorflow.keras import layersstrategy = tf.distribute.MirroredStrategy()# 优化器以及模型的构建和编译必须嵌套在“scope()”中with strategy.scope(): model = tf.keras.Sequential() model.add(layers.Dense(16, activation='relu', input_shape=(10,))) model.add(layers.Dense(1, activation='sigmoid')) optimizer = tf.keras.optimizers.SGD(0.2) model.compile(loss='binary_crossentropy', optimizer=optimizer)model.summary()1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.

小结

在本章中我们介绍了TensorFlow的一些基本概念以及基本的使用方法，本章内容旨在帮助读者快速的入门TensorFlow。后面章节的内容会围绕着深度神经网络展开，通过一些实战项目我们会加深对TensorFlow的了解和掌握，并能够使用TensorFlow搭建相应的神经网络模型，解决实际的问题。

免责声明：本文系网络转载或改编，未找到原创作者，版权归原作者所有。如涉及版权，请联系删

武汉格发信息技术有限公司，格发许可优化管理系统可以帮你评估贵公司软件许可的真实需求，再低成本合规性管理软件许可,帮助贵司提高软件投资回报率，为软件采购、使用提供科学决策依据。支持的软件有: CAD,CAE,PDM,PLM,Catia,Ugnx, AutoCAD, Pro/E, Solidworks 等。

返回上级列表