如果想对TensorFlow进行灵活的运用,就需要知道TensorFlow中一些概念与TensorFlow程序的搭建流程,这里我们需要操作(op)、图 (graph)、 会话 (Session) 、变量 (Variable) 等基本概念。同时应该这些变量一般的作用为:

  1. 使用图 (graph) 来表示计算任务。
  2. 在被称之为 会话 (Session) 的上下文 (context) 中执行图。
  3. 使用 tensor 表示数据
  4. 通过 变量 (Variable) 维护状态
  5. 使用 feed 和 fetch 可以为任意的操作(arbitrary operation) 赋值或者从其中获取数据.

文章目录

  • 变量 (Variable)
  • 张量(Tensor )
  • 操作(op)
  • 图 (graph)
  • 构件图
  • 启动图
  • 会话 (Session)
  • 会话的创建与关闭
  • 方法一 tf.Session()
  • 方法二 with tf.Session() as sess:
  • 实例
  • 参考


变量 (Variable)

当训练模型时,用变量来存储和更新参数。变量包含张量 (Tensor)存放于内存的缓存区。建模时它们需要被明确地初始化,模型训练后它们必须被存储到磁盘。这些变量的值可在之后模型训练和分析是被加载。

张量(Tensor )

学习TensorFlow自然得知道Tensor是什么东西?tensor可以 看作是一个 n 维的数组或列表。一个 tensor 包含一个静态类型 rank, 和 一个 shape。TensorFlow在进行计算的时候全部是使用的Tensor,每个 Tensor 可以看做类型化的多维数组。

操作(op)

操作(op)是在TensorFlow执行最基本的运算,一个 op 获得 0 个或多个 Tensor, 执行计算, 产生 0 个或多个 Tensor。操作就相当于基本的运算,每一个TensorFlow程序都是由很多的操作组成的。

import tensorflow as tf

# 创建一个常量 op, 产生一个 1x2 矩阵. 这个 op 被作为一个节点
# 加到默认图中.
#
# 构造器的返回值代表该常量 op 的返回值.
matrix1 = tf.constant([[3., 3.]])

# 创建另外一个常量 op, 产生一个 2x1 矩阵.
matrix2 = tf.constant([[2.],[2.]])

# 创建一个矩阵乘法 matmul op , 把 'matrix1' 和 'matrix2' 作为输入.
# 返回值 'product' 代表矩阵乘法的结果.
product = tf.matmul(matrix1, matrix2)

现在有三个节点, 两个 constant() op, 和一个matmul() op。

图 (graph)

TensorFlow 程序通常被组织成一个构建阶段和一个执行阶段。在构建阶段, op 的执行步骤被描述成一个图。 在执行阶段, 使用会话执行执行图中的 op。通常在构建阶段创建一个图来表示和训练神经网络, 然后在执行阶段反复执行图中的训练 op。

构件图

构建图的第一步, 是创建源 op (source op). 源 op 不需要任何输入, 例如 常量 (Constant). 源 op 的输出被传递给其它 op 做运算。Python 库中, op 构造器的返回值代表被构造出的 op 的输出, 这些返回值可以传递给其它 op 构造器作为输入。TensorFlow Python 库有一个默认图 (default graph), op 构造器可以为其增加节点. 这个默认图对 许多程序来说已经足够用了。

import tensorflow as tf

# 创建一个常量 op, 产生一个 1x2 矩阵. 这个 op 被作为一个节点
# 加到默认图中.
#
# 构造器的返回值代表该常量 op 的返回值.
matrix1 = tf.constant([[3., 3.]])

# 创建另外一个常量 op, 产生一个 2x1 矩阵.
matrix2 = tf.constant([[2.],[2.]])

# 创建一个矩阵乘法 matmul op , 把 'matrix1' 和 'matrix2' 作为输入.
# 返回值 'product' 代表矩阵乘法的结果.
product = tf.matmul(matrix1, matrix2)

默认图现在有三个节点, 两个 constant() op, 和一个matmul() op。

启动图

构造阶段完成后, 才能启动图. 启动图的第一步是创建一个 Session 对象, 如果无任何创建参数, 会话构造器将启动默认图.

# 启动默认图.
sess = tf.Session()
# 调用 sess 的 'run()' 方法来执行矩阵乘法 op, 传入 'product' 作为该方法的参数. 
# 上面提到, 'product' 代表了矩阵乘法 op 的输出, 传入它是向方法表明, 我们希望取回
# 矩阵乘法 op 的输出.
#
# 整个执行过程是自动化的, 会话负责传递 op 所需的全部输入. op 通常是并发执行的.
# 
# 函数调用 'run(product)' 触发了图中三个 op (两个常量 op 和一个矩阵乘法 op) 的执行.
#
# 返回值 'result' 是一个 numpy `ndarray` 对象.
result = sess.run(product)
print result
# ==> [[ 12.]]

# 任务完成, 关闭会话.
sess.close()

会话 (Session)

Tensorflow依赖于一个高效的C++后端来进行计算。与后端的这个连接叫做会话 (Session)。一般而言,使用TensorFlow程序的流程是先创建一个图,然后在session中启动它。

会话的创建与关闭

会话创建与关闭有两种方法,不同方法创建的会话关闭的方法不一样。

方法一 tf.Session()

使用

import tensorflow as tf
# 创建一个会话
sess = tf.Session()
# 使用这个创建好的会话来得到关心的运算的结果。比如可以调用sess.run(result),
# 来得到张量result的取值
result = sess.run(product)
print result
# 关闭会话释放资源
sess.close()
方法二 with tf.Session() as sess:
import tensorflow as tf
# 创建一个会话,并通过Python中的上下文管理器来管理这个会话。
with tf.Session() as sess:
    # 使用这创建好的会话来计算关心的结果。
    sess.run(...)
# 不需要再调用“Session.close()”函数来关闭会话,
# 当上下文退出时,会话会自动关闭和资源也会自动释放。

实例

import tensorflow as tf
import numpy as np
# 创建一个变量, 初始化为标量 0.
state = tf.Variable(0, name="counter")

# 创建一个 op, 其作用是使 state 增加 1

one = tf.constant(1)
new_value = tf.add(state, one)
update = tf.assign(state, new_value)

# 启动图后, 变量必须先经过`初始化` (init) op 初始化,
# 首先必须增加一个`初始化` op 到图中.
init_op = tf.initialize_all_variables()

# 启动图, 运行 op
with tf.Session() as sess:
  # 运行 'init' op
  sess.run(init_op)
  # 打印 'state' 的初始值
  print sess.run(state)
  # 运行 op, 更新 'state', 并打印 'state'
  for _ in range(3):
    sess.run(update)
    print sess.run(state)

上边程序的输出为:

0
 1
 2
 3

代码中 assign() 操作是图所描绘的表达式的一部分, 正如 add() 操作一样. 所以在调用 run() 执行表达式之前, 它并不会真正执行赋值操作.

通常会将一个统计模型中的参数表示为一组变量. 例如, 你可以将一个神经网络的权重作为某个变量存储在一个 tensor 中. 在训练过程中, 通过重复运行训练图, 更新这个 tensor.