一、DNN全连接层的正则化
说明:对于DNN神经网络的正则化的了解可以参考DNN神经网络正则化,这里主要讲怎么利用tensorflow实现正则化。
二、tensorflow实现L1、L2正则化的内置函数
函数介绍:
在tensorflow里面实现L1、L2的正则化有专门的函数,下面介绍四种函数:
1、L1正则化:tf.contrib.layers.l1_regularizer(scale,scope)(weights);L2正则化:tf.contrib.layers.l2_regularizer(scale,scope)(weights)
参数说明:
- scale:正则表达式的超参数\lambda ,即惩罚系数。
- scope:作用域的名字scope name,作用是在名字后面加个命名域(后续内容会说明)。
- weights:需要正则化的参数,如神经网络的权重矩阵。
函数说明:
l1(weights, name=None),而调用l1函数返回一个计算weights正则化后的tensor。详情查看官方文档。
3、tfc.layers.l1_l2_regularizer(scale_l1,scale_l2,float=1.0,scope=None) (weights)
参数说明:
- scale_l1、scale_l2:一个正则化超参数\lambda。
- scope:作用域的名字scope name,作用是在名字后面加个命名域(后续内容会说明)。
- weights:需要正则化的参数,如神经网络的权重矩阵。
函数说明:
这里是同时使用L1、L2正则化方法。
4、tfc.layers.sum_regularizer(regularizer_list,scope)(weights)
参数说明:
- regularizer_list:定义的正则化方法的函数列表,注意是函数列表,不是tensor列表。
- scope:作用域的名字scope name,作用是在名字后面加个命名域(后续内容会说明)。
函数说明:
这里是一个正则化方法的混合体,regularizer_list列表中正则化方法的混合。
三、实现L1、L2正则化的示例
import tensorflow as tf
import tensorflow.contrib as tfc
import numpy as np
#创造数据集
x_data=np.linspace(-1,1,10000,dtype=np.float).reshape(10000,1)
y_data=2*x_data*x_data+3
#占位符
x_p=tf.placeholder(tf.float32,[None,1])
y_p=tf.placeholder(tf.float32,[None,1])
#定义第一个隐藏层Layer1,输入为x有5个神经元,无激活函数
weights1=tf.Variable(tf.random_normal([1,5]))
biases1=tf.Variable(tf.zeros([1,5])+0.001)
input1=tf.matmul(x_p,weights1)+biases1
weights1_reg=tfc.layers.l2_regularizer(0.1)(weights1) #构建正则项,这里是直接得到计算正则化后的tensor值
#定义输出层,输入为input1,激活函数为tahn
weights2=tf.Variable(tf.random_normal([5,1]))
biases2=tf.Variable(tf.zeros([1,5])+0.001)
prediction=tf.nn.tanh(tf.matmul(input1,weights2)+biases2)
#定义损失函数,loss=均方差+正则化项
loss=tf.reduce_mean(tf.square(y_p-prediction)) + weights1_reg
#定义优化方式为梯度下降
train=tf.train.GradientDescentOptimizer(0.1).minimize(loss)
init=tf.global_variables_initializer()
with tf.Session() as sess:
sess.run(init)
#训练200次,每隔10次输出一次loss
for i in range(200):
sess.run(train,feed_dict={x_p:x_data,y_p:y_data})
if i % 9 == 0:
print(sess.run(loss,feed_dict={x_p:x_data,y_p:y_data}))
四、tensorflow实现drop正则化的函数
函数介绍:
tensorflow自带的drop的函数方法:tf.nn.frop_out(x,keep_prop)
参数说明:
- x:需要drop的权重矩阵(建议对对过拟合影响大的才进行drop处理,可以根据与需求选择)。
- keep_prop:保留的神经元的比重(建议选0.5)。
代码示例:
简单的示例:
#定义第一个隐藏层Layer1,输入为x有5个神经元,无激活函数
weights1=tf.Variable(tf.random_normal([1,5]))
biases1=tf.Variable(tf.zeros([1,5])+0.001)
weights1_drop=tf.nn.dropout(weights1,0.5) #实现drop正则化,一般对过拟合影响高的才使用drop
input1=tf.matmul(x_p,weights1_drop)+biases1 #使用定义的drop处理的weight
完整示例:
import tensorflow as tf
import tensorflow.contrib as tfc
import numpy as np
#创造数据集
x_data=np.linspace(-1,1,10000,dtype=np.float).reshape(10000,1)
y_data=2*x_data*x_data+3
#占位符
x_p=tf.placeholder(tf.float32,[None,1])
y_p=tf.placeholder(tf.float32,[None,1])
#定义第一个隐藏层Layer1,输入为x有5个神经元,无激活函数
weights1=tf.Variable(tf.random_normal([1,5]))
biases1=tf.Variable(tf.zeros([1,5])+0.001)
weights1_drop=tf.nn.dropout(weights1,0.5) #实现drop正则化,一般对过拟合影响高的才使用drop
input1=tf.matmul(x_p,weights1_drop)+biases1 #使用定义的drop处理的weight
#定义输出层,输入为input1,激活函数为tahn
weights2=tf.Variable(tf.random_normal([5,1]))
biases2=tf.Variable(tf.zeros([1,5])+0.001)
prediction=tf.nn.tanh(tf.matmul(input1,weights2)+biases2)
#定义损失函数,loss=均方差+正则化项
loss=tf.reduce_mean(tf.square(y_p-prediction))
#定义优化方式为梯度下降
train=tf.train.GradientDescentOptimizer(0.1).minimize(loss)
init=tf.global_variables_initializer()
with tf.Session() as sess:
sess.run(init)
#训练200次,每隔10次输出一次loss
for i in range(200):
sess.run(train,feed_dict={x_p:x_data,y_p:y_data})
if i % 9 == 0:
print(sess.run(loss,feed_dict={x_p:x_data,y_p:y_data}))