TensorFlow1学习
TensorFlow学习
1.简介与基础
1.1 构建计算图(Graph)
1.1.1默认图
1.1.2创建新图
1.1.3Tensor张量/数据
(1). 0阶张量
(2). 1阶张量
(3). 2阶张量
(4). 关于张量的一些操作
1.tf.reshape(x,shape)
2.Tensor中的常量(constant)
3.Tensor中的随机数(random)
4.Tensor中的初始化(initialize)
(5). 关于变量的一些操作
1.变量创建variable相关
2.对列表中变量的相关操作
3.变量命名空间
1.2 会话/运行计算图(Session)
1.2.1会话/运行计算图的两种方式
1.2.2会话/运行计算图的run
2.TensorBoard:可视化学习
2.1数据序列化-event文件
2.2启动TensorBoard
2.3 增加变量显示功能
3.模型的保存与加载
3.1 模型保存
3.2 模型加载
3.3 通过checkpoint找到模型文件名
4.一些小技巧
1.简介与基础
深度学习的框架有很多:TensorFlow、Caffe、Theano、Torch等,其中Keras是在TensorFlow基础上构建的高层API,Keras在TensorFlow中,本次使用的tensorflow为1.12.0。
tensorflow包括两个阶段:
- 构建计算图(tf.Graph):
- 张量/数据(Tensor):主要包括[名称、维度、类型],即[name,shape,type]
- 操作(OPeration):我们构建的计算图的节点
- 运行计算图/会话(tf.Session)
- 以下为一个简单的tensorflow示例:
import tensorflow as tf
#第一阶段,构建计算图(用的是默认图)
a = tf.constant(2.0, dtype=tf.float32)
b = tf.constant(3.0)
c = tf.add(a, b)
print('a', a)
print('b', b)
print('c', c)
#第二阶段,运行计算图(默认图)
with tf.Session() as sess:
print(sess.run(b))
print('在会话中run后的加法结果', sess.run(c))
#运行结果
a Tensor("Const:0", shape=(), dtype=float32)
b Tensor("Const_1:0", shape=(), dtype=float32)
c Tensor("Add:0", shape=(), dtype=float32)
3.0
在会话中run后的加法结果 5.0
1.1 构建计算图(Graph)
1.1.1默认图
通常Tensorflow会默认帮我们创建一张图,查看默认图有两种方法;
- default_g = tf.get_default_graph() #创建一个默认图,赋值给default_g
- 使用上面代码的a与sess,a.graph或sess.graph,因为这两个便是节点与运行,且都有默认的graph属性。
其运行的代码如下(拼接上面的代码,下面没有重新import的都一样,之后不重复说明):
default_g = tf.get_default_graph()
print('attribute', default_g)
print('attribute', a.graph)
print('attribute', sess.graph)
#结果显示
attribute <tensorflow.python.framework.ops.Graph object at 0x000001CB0F8DE748>
attribute <tensorflow.python.framework.ops.Graph object at 0x000001CB0F8DE748>
attribute <tensorflow.python.framework.ops.Graph object at 0x000001CB0F8DE748>
1.1.2创建新图
与上面的默认图差不多的形式:
new_g = tf.Graph() #创建一个新的图,赋值给new_g
如果要对新图进行相关处理,则用new_g.as_default()。
代码如下:
new_g = tf.Graph()
with new_g.as_default():
a_new = tf.constant([15])
print('a_new', a_new)
#结果显示
a_new Tensor("Const:0", shape=(1,), dtype=int32)
1.1.3Tensor张量/数据
张量Tensor有3个属性(attrtibute):名称(name)、维度(shape)、类型(type)
(1). 0阶张量
mammal = tf.Variable("Elephant", tf.string)
ignition = tf.Variable(451, tf.int16)
floating = tf.Variable(3.14159265359, tf.float64)
its_complicated = tf.Variable(12.3 - 4.85j, tf.complex64)
print(mammal, type(mammal))
print(ignition, type(ignition))
print(floating, type(floating))
print(its_complicated, type(its_complicated))
#结果显示
<tf.Variable 'Variable:0' shape=() dtype=string_ref> <class 'tensorflow.python.ops.variables.Variable'>
<tf.Variable 'Variable_1:0' shape=() dtype=int32_ref> <class 'tensorflow.python.ops.variables.Variable'>
<tf.Variable 'Variable_2:0' shape=() dtype=float32_ref> <class 'tensorflow.python.ops.variables.Variable'>
<tf.Variable 'Variable_3:0' shape=() dtype=complex128_ref> <class 'tensorflow.python.ops.variables.Variable'>
0阶张量就是一个数,其中tf.variable就是构造一个variable(变量)添加进图中,而variable()则是构造函数所需要的变量的初始值可以是一个任意形状、任意类型的张量/数据Tensor,而括号里的格式形如(initialization,name)分别是初始化的参数,即我们要的数据值,和数据的名字,所以下面一阶、二阶都用了,具体使用方法在下方变量相关操作中提到。
(2). 1阶张量
myst = tf.Variable(["Hello"], tf.string)
cool_numbers = tf.Variable((3.14159, 2.71828), tf.float32)
first_primes = tf.Variable((2, 3, 5, 7, 11), tf.int32)
its_very_complicated = tf.Variable([12.3 - 4.85j, 7.5 - 6.23j], tf.complex64)
print(myst, type(myst))
print(cool_numbers, type(cool_numbers))
print(first_primes, type(first_primes))
print(its_very_complicated, type(its_very_complicated))
#结果显示
<tf.Variable 'Variable_4:0' shape=(1,) dtype=string_ref> <class 'tensorflow.python.ops.variables.Variable'>
<tf.Variable 'Variable_5:0' shape=(2,) dtype=float32_ref> <class 'tensorflow.python.ops.variables.Variable'>
<tf.Variable 'Variable_6:0' shape=(5,) dtype=int32_ref> <class 'tensorflow.python.ops.variables.Variable'>
<tf.Variable 'Variable_7:0' shape=(2,) dtype=complex128_ref> <class 'tensorflow.python.ops.variables.Variable'>
(3). 2阶张量
mymat = tf.Variable([[7],[11]], tf.int16)
myxor = tf.Variable([[False, True],[True, False]], tf.bool)
linear = tf.Variable([[4], [9], [16], [25]], tf.int32)
squarish_squares = tf.Variable([ [4, 9], [16, 25] ], tf.int32)
rank = tf.rank(squarish_squares)
print(mymat, type(mymat))
print(myxor, type(myxor))
print(linear,type(linear))
print(squarish_squares,type(squarish_squares))
print(rank, type(rank))
#结果显示
<tf.Variable 'Variable_8:0' shape=(2, 1) dtype=int32_ref> <class 'tensorflow.python.ops.variables.Variable'>
<tf.Variable 'Variable_9:0' shape=(2, 2) dtype=bool_ref> <class 'tensorflow.python.ops.variables.Variable'>
<tf.Variable 'Variable_10:0' shape=(4, 1) dtype=int32_ref> <class 'tensorflow.python.ops.variables.Variable'>
<tf.Variable 'Variable_11:0' shape=(2, 2) dtype=int32_ref> <class 'tensorflow.python.ops.variables.Variable'>
Tensor("Rank:0", shape=(), dtype=int32) <class 'tensorflow.python.framework.ops.Tensor'>
其中tf.rank()为返回矩阵秩的函数, 注意:张量的秩与矩阵的秩不一样。张量的秩是唯一选择张量的每个元素所需的索引的数量。秩也被称为 “order”,“degree” 或 “ndims”。
在图像处理过程中,还有很多4阶张量,形如:
my_image = tf.zeros([10, 299, 299, 3]) #参数依次为:批处理大小、图像宽、图像高、图像颜色通道数
(4). 关于张量的一些操作
1.tf.reshape(x,shape)
作用是改变形状
matrix = tf.ones([3, 4, 5])
matrixA = tf.reshape(matrix, [6, 10]) #重塑成 6*10
matrixB = tf.reshape(matrixA, [3, -1]) # 重塑成 3x20
print(matrix)
print(matrixA)
print(matrixB)
#结果显示
Tensor("ones:0", shape=(3, 4, 5), dtype=float32)
Tensor("Reshape:0", shape=(6, 10), dtype=float32)
Tensor("Reshape_1:0", shape=(3, 20), dtype=float32)
2.Tensor中的常量(constant)
- 生成0的张量函数 tf.zeros(shape=[2,2], dtypt=tf.float32, namhanghe=None)
- 生成1的张量函数 tf.ones(shape=[2,2], dtypt=tf.float32, namhanghe=None)
- 生成常数 tf.constant(value, dtype=None, Shape=None, name="Const")
- numpy变为tensorflow数:data_tensor= tf.convert_to_tensor(data_numpy)
- 生成都是value值的dims形状的张量 tf.fill(dims, value, name=None) ,形如:
import tensorflow as tf
t1 = tf.fill([2, 3], 3)
print(t1)
sess = tf.Session()#这部分其实是计算部分,先用,看我们的t1变成了什么
print(sess.run(t1))
#结果显示
Tensor("Fill:0", shape=(2, 3), dtype=int32)
[[3 3 3]
[3 3 3]]
3.Tensor中的随机数(random)
- tf.random_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)
生成标准正态分布的随机张量 - tf.truncated_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)
shape表示生成张量的维度,mean是均值,stddev是标准差。这个函数产生截断的正态分布,就是说产生正态分布的值与均值的差值大于两倍的标准差,那就重新生成。和一般的正态分布的产生随机数据比起来,这个函数产生的随机数与均值的差距不会超过两倍的标准差,但是一般的别的函数是可能的。 - tf.random_uniform(shape, minval=0, maxval=None, dtype=tf.float32, seed=None, name=None)
从均匀分布中返回随机值,shape形状、minval最小值、maxval最大值。 - tf.random_shuffle(value, seed=None, name=None)
沿着要被洗牌的张量的第一个维度,随机打乱。value要洗牌的张量
4.Tensor中的初始化(initialize)
- tf.constant_initializer(value=0, dtype=tf.float32)
也可以简写为tf.Constant(),初始化为常数,这个非常有用,通常偏置项就是用它初始化的。
由它衍生出的几个初始化方法:
- tf.zeros_initializer(shape, dtype=tf.float32, partition_info=None)
- tf.ones_initializer(dtype=tf.float32, partition_info=None)
- tf.constant_initializer(0),tf.Constant(0)
- tf.truncated_normal_initializer(mean=0.0, stddev=1.0, seed=None, dtype=tf.float32)
可简写为tf.TruncatedNormal(),生成截断正态分布的随机数,在tf中使用较多。
- tf.ranndom_normal_initializer (mean=0.0, stddev=1.0, seed=None, dtype=tf.float32)
使用正态分布张量的初始化器,参数依次为:均值、方差、随机种子、数据类型
- tf.random_uniform_initializer(minval=0, maxval=None, seed=None, dtype=tf.float32)
使用均匀分布张量的初始化器,参数依次为:最小值、最大值、随机种子、数据类型
- tf.cast(x, dtype, name=None)
把张量x,变成任何的dtype,这里要与reshap分开,cast是变类型,如float32变成float16;reshap变的是维度,也就是我们说的形状,如zero[2, 3]变成zero[1, 6]。
注意:这些数据的类型都为float32,如果直接用都应该在tf.get_variable()中的initializer中
(5). 关于变量的一些操作
注意:所有变量进行相关操作都需要进行初始化。
1.变量创建variable相关
tf.Variable(initial_value=None, trainable=None, collections=None, validate_shape=True, caching_device=None, name=None, variable_def=None, dtype=None, expected_shape=None, import_scope=None, constraint=None, use_resource=None, shape=None)
在graph中创建变量,详细讲述请点击函数名,以下介绍了其常用参数。
- initial_value:Tensor,定义Variable的初始值。
- trainable:如果为True,则会默认将变量添加到图形集合GraphKeys.TRAINABLE_VARIABLES中,此集和用于优化器优化的默认变量列表 。
- collections:graph集合列表的关键字。新变量将添加到这个集合中。默认为[GraphKeys.GLOBAL_VARIABLES]。
- validate_shape:如果为True,则默认为initial_value的形状必须已知。如果为False,则允许使用未知形状的值初始化变量。
- name:变量名,可选,默认为“Variable”并自动获取
- dtype:数据类型
tf.get_variable(name,shape=None, dtype=None, initializer=None, regularizer=None, trainable=None, collections=None, caching_device=None, partitioner=None, validate_shape=True, use_resource=None, custom_getter=None, constraint=None)
这也是获取或创建一个变量的形式,与tf.Variable参数区别最主要在于如果新建变量名称原来存在,就会显示错误,不会像Variable一样,自动处理相同的变量名称,另外tf.get_variable还可以读取以前有的变量,也可以创建新的变量,而Variable只是直接创建,不管之前有没有存在,以下介绍了其常用参数。
- name:新变量或现有变量的name
- shape:新变量或现有变量的shape
- dtype:新变量或现有变量的类型(默认为DT_FLOAT)。
- initializer:变量的初始化方式
- regularizer:函数(tensor-->tensor),将函数应用于新创建的变量,结果将添加到集合tf.GraphKeys.REGULARIZATION_LOSSES中,并可用于正则化。
- trainable:如果为True,还将变量添加到图形集合GraphKeys.TRAINABLE_VARIABLES,此集和用于优化器优化的默认变量列表 。
- collections:要将变量添加到的图表集合列表。默认为[GraphKeys.GLOBAL_VARIABLES](参见tf.Variable) 。
- validate_shape:如果为True,则默认为initial_value的形状必须已知。如果为False,则允许使用未知形状的值初始化变量。
- use_resource:如果为False,则创建常规变量。如果为true,则使用定义良好的语义创建实验性ResourceVariable。默认为False(以后版本中将更改为True)。在Eager模式下,此参数始终强制为True。
v = tf.get_variable("v", shape=(), initializer=tf.zeros_initializer())
u = tf.Variable([1, 2], trainable=True, validate_shape=True, name='u')
w = v + 1
w1 = u + 2
print(v, type(v))
print(u, type(u))
print(w, type(w))
print(w1, type(w1))
#结果显示
<tf.Variable 'v:0' shape=() dtype=float32_ref> <class 'tensorflow.python.ops.variables.Variable'>
<tf.Variable 'u:0' shape=(2,) dtype=int32_ref> <class 'tensorflow.python.ops.variables.Variable'>
Tensor("add:0", shape=(), dtype=float32) <class 'tensorflow.python.framework.ops.Tensor'>
Tensor("add_1:0", shape=(2,), dtype=int32) <class 'tensorflow.python.framework.ops.Tensor'>
tf.global_variables_initializer(),一般只用于统一初始化,因为其不会指定变量的初始化顺序,当一个变量的初始值取决于另一个变量的值时,使用这种方法可能会出现错误,所以我们要在命名时就进行初始化。
#形如:init = tf.global_variables_initializer()
使用assign与assign_add方法对tf.Variable进行值的变换
import tensorflow as tf
a = tf.Variable(initial_value=0, name='counter') # 创建一个变量,初始化为标量0
b = tf.constant(1)
c = tf.get_variable('c', shape=(), initializer=tf.zeros_initializer())
assignment = c.assign_add(1) # 利用assign_add实现变量c初始值+1
new_value = tf.add(a, b) # 利用add实现a与b的相加
update = tf.assign(a, new_value) # 将新的值new_value赋值给a,只是描绘图,并不会执行
#启动图前,变量必须经过初始化(init)
init = tf.global_variables_initializer() # 统一初始化
#启动图,运行op,这部分在运行计算图中会再详细介绍
with tf.Session() as sess:
sess.run(init) # 运行‘init’
print(sess.run(a)) # 打印‘a’的值
print(sess.run(assignment)) # 打印‘assignment’的值
#运行op,更新a,并打印a
for _ in range(2): # 补充一个小知识,range是一种与list与tuple同等类型的数据类型
sess.run(update)
print(sess.run(update))
#结果显示
0
1.0
2
4
2.对列表中变量的相关操作
- tf.add_to_collection:把变量放入一个集合,把很多变量变成一个列表
- tf.get_collection:从一个列表中取出全部变量,是一个列表
- tf.add_n:把一个列表的东西都依次加起来
import tensorflow as tf
v1 = tf.get_variable(name='v1', shape=[1], initializer=tf.constant_initializer(2))
tf.add_to_collection('loss', v1) # 将v1放入loss列表中
v2 = tf.get_variable(name='v2', shape=[1], initializer=tf.constant_initializer(1))
tf.add_to_collection('loss', v2)
init = tf.global_variables_initializer()
with tf.Session() as sess:
sess.run(init)
print(tf.get_collection('loss')) # 将上面加进去的v1与v2从loss列表取出并打印
print(sess.run(tf.get_collection('loss')))
print(sess.run(tf.add_n(tf.get_collection('loss')))) # 将v1与v2取出相加再打印最后运行的结果
#结果显示
[<tf.Variable 'v1:0' shape=(1,) dtype=float32_ref>,
<tf.Variable 'v2:0' shape=(1,) dtype=float32_ref>]
[array([2.], dtype=float32),
array([1.], dtype=float32)]
[3.]
3.变量命名空间
- tf.name_scope() # 修改变量的命名空间
tf.name_scope主要结合tf.Variable()来使用,它的主要目的是为了方便管理参数命名,以下为它的一个简单示例:
import tensorflow as tf
with tf.name_scope('conv1'):
weights1 = tf.Variable([1.0, 2.0], name='weights')
bias1 = tf.Variable([0, 3], name='bias')
# 下面是在另一个命名空间来定义变量
with tf.name_scope('conv2'):
weights2 = tf.Variable([4.0, 2.0], name='weights')
bias2 = tf.Variable([0, 44], name='bias')
print(weights1.name)
print(weights2.name)
#如果重复执行,则会生成新的命名空间
with tf.name_scope('conv1'):
weights1 = tf.Variable([1.0, 2.0], name='weights')
bias1 = tf.Variable([0, 3], name='bias')
# 下面是在另一个命名空间来定义变量
with tf.name_scope('conv2'):
weights2 = tf.Variable([4.0, 2.0], name='weights')
bias2 = tf.Variable([0, 44], name='bias')
print(weights1.name)
print(weights2.name)
#结果显示
conv1/weights:0
conv2/weights:0
conv1_1/weights:0
conv2_1/weights:0
- tf.variable_scope('scope_name')
这种方法主要是与tf.get_variable()来使用,实现变量共享,以下为它的一个简单示例:
with tf.variable_scope('v_scope'):
Weights1 = tf.get_variable('Weights', shape=[2, 3])
bias1 = tf.get_variable('bias', shape=[3, ])
# print(Weights1, type(Weights1))
# print(bias1, type(bias1))
# 下面共享上面已经定义好的变量
# 在下面的scope中的变量必须经过get.variable()定义过了,才能设置reuse=True,否则会报错
with tf.variable_scope('v_scope', reuse=True):
Weights2 = tf.get_variable('Weights')
print(Weights1.name)
print(Weights2.name)
#结果显示
v_scope/Weights:0
v_scope/Weights:0
共享变量有两种方法:
#方法一:
with tf.variable_scope('name') as scope:
我们定义的变量,最好使用tf.get_variable生成
#方法二:
with tf.variable_scope('name', reuse=True):
我们定义的变量,只有tf.get_variable定义变量,才能是reuse(重复使用)为真的必要条件
总结:这两种都是变量空间操作,但是name_scope一般是与Variable一起用,variable_scope一般与tf.get_variable一起使用。
1.2 会话/运行计算图(Session)
要评估张量,就需要实例化一个tf.Session()对象,在会话/运行计算图中,调用run方法来运行图节点以及查看张量。
- sess.run(张量)与Tensor.eval(),即张量.eval(),都是返回与张量内容相同的numpy数组。
- Tensor.eval与sess.run方法能运行的前提都是tf.Session处于活跃状态。
下面是两种方法的简单示例(接的是一开始的总体简单示例):
with tf.Session() as sess:
print(a.eval())
print(sess.run(a))
#结果显示
2.0
2.0
1.2.1会话/运行计算图的两种方式
- tf.Session(graph=None, config=None) #如果括号内什么都不写就默认为None。
也可以graph=new_graph # new_graph是自定义创建的新的图的对象实例
config:清晰地显示操作运行在哪些设备上 如果想要知道设备信息,把config设置成config = tf.ConfigProto(allow_soft_placement=True, log_device_placement=True)
- tf.InteractiveSession() #用于在交互模式中打开会话,ipython,shell,jupyter Notebook。
最后,会话/运行计算图(Session)在使用完后需要释放资源,除了使用sess.close()外,一般使用“with代码块”来自动关闭。
1.2.2会话/运行计算图的run
run(fetches, feed_dict=None, options=None, run_metadata=None)
其中的几个参数介绍:
- fetches:单一的operation(操作或者叫节点),或者元组operation、列表operation
- feed_dict:参数允许调用者覆盖图中张量的值,运行时赋值。与tf.placeholder(),即我们所说的feed操作配合使用,则会检测值的形状是否与占位符匹配。
以下为run的简单示例:
import tensorflow as tf
a = tf.constant(2.)
b = tf.constant(3.)
c = a + b
sess = tf.Session() # 等价与with tf.Session() as sess:
s = sess.run(c)
print(s)
print(c.eval(session=sess)) # 如果上面用的是with则Session是活跃的不用在()中再声明
#结果显示
5.0
5.0
以下是feed_dict的相关操作(接上面的代码):
input1 = tf.constant(2.0)
input2 = tf.constant(3.0)
input3 = tf.constant(4.0)
input4 = tf.add(input2, input3)
input5 = tf.multiply(input1, input4)
with tf.Session() as sess:
result = sess.run([input5, input4])#通过run取回多个张量
print(result, type(result))
#结果显示
[14.0, 7.0] <class 'list'>
结合tf.placeholder()进行相关操作:
import tensorflow as tf
a = tf.placeholder(tf.float32) # 就是用placeholder创建一个占位符,最后必须通过feed_dict进行参数替换
b = tf.placeholder(tf.float32)
c = tf.add(a, b)
with tf.Session() as sess:
re1 = sess.run(c, feed_dict={a: 1, b: 2.5})
print(re1)
print(sess.run(c, feed_dict={a: [1., 2.], b: [2., 2.]}))
#结果显示
3.5
[3. 4.]
2.TensorBoard:可视化学习
TensorBoard是tensorflow的可视化工具,实现程序可视化的过程。
2.1数据序列化-event文件
tf.summary.FileWriter('path', garph=sess.graph) #在会话/运行计算图中写入事件文件,然后在path路径创建一个even文件。
- path 事件文件的写入地址
- graph 选择描绘的计算图,sess.graph或tf.get_default_graph()都是默认图,tf.graph()是新图
以下是一个简单示例:
import tensorflow as tf
a = tf.constant(20, name='ax')
b = tf.constant(30, name='bx')
c = a + b
with tf.Session() as sess:
c = sess.run(c)
writer = tf.summary.FileWriter('./', sess.graph) # 写入事件文件
writer.close() # 写完之后的关闭操作,必须要有
#这只是写入事件的代码,并没有打印什么结果
2.2启动TensorBoard
- 将项目中的.py文件(这个py文件是拥有写入事件语句的)运行,生成event文件,如图:
- 在cmd中或者Git Bash中运行 tensorboard --logdir="path" (注意,一定要是在event存在的文件夹中打开cmd,在命令中path一定要用双引号,单引号会出错),如图:
- 然后在谷歌浏览器中 localhost:6006 就可以看到图了 ,如图:
下面是一个py文件显示tensorboard示例:
# 实现一个线性回归
import tensorflow as tf
import os
os.environ["TF_CPP_MIN_LOG_LEVEL"] = "2"
# 准备数据
X = tf.random_normal(shape=[100, 1])
y_true = tf.matmul(X, [[0.8]]) + 0.7
# 构建线性模型的tensor变量Weight, bias
Weight = tf.Variable(initial_value=tf.random_normal(shape=[1, 1]))
bias = tf.Variable(initial_value=tf.random_normal(shape=[1, 1]))
y_predict = tf.matmul(X, Weight) + bias
# 构建损失方程,优化器及训练模型操作train
loss = tf.reduce_mean(tf.square(y_predict - y_true))
optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.5)
train = optimizer.minimize(loss)
init = tf.global_variables_initializer() # 构建变量初始化操作init
with tf.Session() as sess:
sess.run(init)
writer = tf.summary.FileWriter("D:/project-minyuan/study/logs", sess.graph)
for step in range(1000):
sess.run(train)
if step % 20 == 0: # 每20次打印一次
print(step, sess.run(Weight), sess.run(bias))
writer.close()
2.3 增加变量显示功能
目的:在TensorBoard中观察模型参数、损失值等变量的变化
- 收集变量用于tensorboard可视化
- tf.summary.scalar(name="", tensor) # 收集标量,例:loss、accuary、learing_rate
- tf.summary.histogram(name="", tensor) # 收集高维度的变量,例:训练过程中的变量, 以直方图的形式显示变量分布情况 。
- tf.summaty.image(name="", tensor) # 收集图片张量[image_num, height, width, channels],展示训练过程中记录的图像
- tf.summaty.audio(name="", tensor) # 收集音频张量[audio_num, frames, channels],播放训练过程中记录的音频
import tensorflow as tf
import os
os.environ["TF_CPP_MIN_LOG_LEVEL"] = "2"
# 准备数据
X = tf.random_normal(shape=[100, 1])
y_true = tf.matmul(X, [[0.8]]) + 0.7
# 构建线性模型的tensor变量Weight, bias
Weight = tf.Variable(initial_value=tf.random_normal(shape=[1, 1]))
bias = tf.Variable(initial_value=tf.random_normal(shape=[1, 1]))
y_predict = tf.matmul(X, Weight) + bias
# 构建损失方程,优化器及训练模型操作train
loss = tf.reduce_mean(tf.square(y_predict - y_true))
optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.01)
train = optimizer.minimize(loss)
# 收集变量
tf.summary.scalar("error", loss) # 收集标量
tf.summary.histogram("Weight", Weight) # 收集高维变量
tf.summary.histogram("bias", bias)
merged = tf.summary.merge_all() # 合并变量
init = tf.global_variables_initializer() # 变量初始化操作
with tf.Session() as sess:
sess.run(init)
event_file = tf.summary.FileWriter("D:/project-minyuan/study/logs", sess.graph) # 创建事件文件
for step in range(100):
sess.run(train)
if step % 20 == 0: # 每20次打印一次
print(step, sess.run(Weight), sess.run(bias))
summary = sess.run(merged) # 运行合并变量的操作
event_file.add_summary(summary, step) # 将每次迭代后的变量写入事件文件
event_file.close()
其中一些参数的解释:
- merged = tf.summary.merge_all() # 将所有的summary保存到磁盘,以便tensorboard可视化
- event_file = tf.summary.FileWriter("./", sess.graph) # 在会话中创建事件文件保存图
- summary = sess.run(merged) # 在会话中运行合并操作
- event_file.add_summary(summary, step) # 将每次迭代更新后的summary写入事件文件
- event_file.close() # 最后记得关闭事件文件
结果如图:
3.模型的保存与加载
3.1 模型保存
- saver = tf.train.Saver(var_list=None, max_to_keep=5) # 保存和加载模型
其中相关参数:
- var_list:指定要保存的变量,可以作为一个dict或列表传递,如果为None,就是保存所有变量。
- max_to_keep:保留检查点文件的数量,创建新文件时会删除旧的文件 。
- saver.save(sess, save_path="./liner.ckpt", global_step=step) # 保存模型
- sess:会话名字 。
- save_path:设定权重参数保存的路径和文件名。
- global_step=step:将训练的次数作为后缀加入到模型名字中。
以下是一个简单训练模型并保存的示例:
import tensorflow as tf
import os
os.environ["TF_CPP_MIN_LOG_LEVEL"] = "2"
v1 = tf.get_variable("v1", shape=[3], initializer=tf.zeros_initializer)
v2 = tf.get_variable("v2", shape=(5), initializer=tf.zeros_initializer)
# inc_v1 = v1.assign(v1+1) # v1变量+1
a = tf.constant(1.0)
b = tf.add(v1, a)
inc_v1 = tf.assign(v1, b)
dec_v2 = v2.assign(v2-1) # v2变量-1
init = tf.global_variables_initializer()
saver = tf.train.Saver() # 创建Saver对象
with tf.Session() as sess:
sess.run(init)
inc_v1.op.run()
dec_v2.op.run()
for epoch in range(300):
if epoch % 10 ==0:
# 在会话中保存模型
save_path = saver.save(sess, save_path="./model/model.ckpt", global_step=epoch)
print("Model saved in path: %s" % save_path)
运行完代码在model文件夹中生成下列几个文件:
其中几个文件名的意思如下:
- checkpoint 记录最新的模型
- ().data/ ().index 存储训练好的参数
- ().meta 存储网络结构
3.2 模型加载
- saver.restore(sess, "./liner.ckpt") # 加载模型
- checkpoint = tf.train.latest_checkpoint("./model/") # 获取最新的模型
import tensorflow as tf
import os
os.environ["TF_CPP_MIN_LOG_LEVEL"] = "2"
v1 = tf.get_variable("v1", shape=[3])
v2 = tf.get_variable("v2", shape=[5])
tf.add_to_collection("variable", v1)
tf.add_to_collection("variable", v2)
def load_model(sess, ckpt):
# ckpt是模型路径
if os.path.isdir(ckpt):
# 获取最新的模型
checkpoint = tf.train.latest_checkpoint(ckpt)
else:
checkpoint = ckpt
print(checkpoint) # ./model/model.ckpt-290
meta = checkpoint + '.meta' # ./model/model.ckpt-290.meta
print(meta)
saver = tf.train.import_meta_graph(meta) # 加载graph图结构
saver.restore(sess, checkpoint) # 加载模型参数
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
model_dir = "./model/"
load_model(sess, model_dir)
# 从变量集和名为"variable"的集和中取出变量
a, b = tf.get_collection('variable')
print(a, b)
print("模型恢复....")
print("v1 : %s" % v1.eval())
print("v2 : %s" % v2.eval())
#结果显示
./model/model.ckpt-290
./model/model.ckpt-290.meta
<tf.Variable 'v1:0' shape=(3,) dtype=float32_ref> <tf.Variable 'v2:0' shape=(5,) dtype=float32_ref>
模型恢复....
v1 : [-0.30017233 0.87121487 -0.7292707 ]
v2 : [-0.301401 -0.7233736 0.5275371 0.37816596 -0.61047554]
3.3 通过checkpoint找到模型文件名
tf.train.get_checkpoint_state(checkpoint_dir,latest_filename=None)
其中参数解释:
- checkpoint_dir:checkpoint文件的路径
- latest_filename:指定checkpoint的名字,返回的是CheckpointState proto对象,CheckpointState proto对象有两个可用属性。
命令行参数的使用
tensorflow支持程序从命令行接受参数,即使用tf.app.flag,tf.app.flag可以定义各种参数类型
- 整形参数 tf.app.flag.DEFINE_integer(flag_name, default, docstring)
- 字符串参数 tf.app.flag.DEFINE_string(flag_name, default, docstring)
- 布尔值参数 tf.app.flag.DEFINE_boolean(flag_name, default, docstring)
- 浮点值参数 tf.app.flag.DEFINE_float(flag_name, default, docstring)
4.一些小技巧
- 可以中的main(argv)函数,如果脚本没有main(argv)函数,会报错。
- 运行tensorflow的时候,会出现红色警告I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2
如果不想看到这个,在脚本开始的时候,加
import os
os.environ["TF_CPP_MIN_LOG_LEVEL"]= "2"