激活函数(Activation Function),就是在人工神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端。
如果不用激活函数,每一层输出都是上层输入的线性函数,无论神经网络有多少层,输出都是输入的线性组合,这种情况就是最原始的感知机。
如果使用的话,激活函数给神经元引入了非线性因素,使得神经网络可以任意逼近任何非线性函数,这样神经网络就可以应用到众多的非线性模型中。
#!/usr/bin/env python# -*- coding: UTF-8 -*-# _ooOoo_# o8888888o# 88" . "88# ( | - _ - | )# O\ = /O# ____/`---'\____# .' \\| |// `.# / \\|||:|||// \# / _|||||-:- |||||- \# | | \\\ - /// | |# | \_| ''\---/'' | _/ |# \ .-\__ `-` ___/-. /# ___`. .' /--.--\ `. . __# ."" '< `.___\_<|>_/___.' >'"".# | | : `- \`.;`\ _ /`;.`/ - ` : | |# \ \ `-. \_ __\ /__ _/ .-` / /# ==`-.____`-.___\_____/___.-`____.-'==# `=---=''''@Project :pythonalgorithms @File :Activationfunction.py@Author :不胜人生一场醉@Date :2021/8/11 0:14 '''import numpy as np
from matplotlib import pyplot as plt
def drawpic(x, y, label=' ', title=' '):
plt.figure(figsize=(10, 8))
ax = plt.gca() # 通过gca:get current axis得到当前轴 plt.rcParams['font.sans-serif'] = ['SimHei'] # 绘图中文 plt.rcParams['axes.unicode_minus'] = False # 绘图负号 plt.plot(x, y, label=label)
# 设置图片的右边框和上边框为不显示 ax.spines['right'].set_color('none')
ax.spines['top'].set_color('none')
# 挪动x,y轴的位置,也就是图片下边框和左边框的位置 # data表示通过值来设置x轴的位置,将x轴绑定在y=0的位置 ax.spines['bottom'].set_position(('data', 0))
# axes表示以百分比的形式设置轴的位置,即将y轴绑定在x轴50%的位置 ax.spines['left'].set_position(('axes', 0.5))
# ax.spines['left'].set_position(('data', 0)) plt.title(title)
plt.legend(loc='upper right')
plt.show()
if __name__ == '__main__':
std = 0.1 # 标准差为0.1 avg = 1 # 平均值为1 x = np.linspace(avg - 5 * std, avg + 5 * std, 100)
y = normaldistribution(x, avg, std)
drawpic(x, y, 'normaldistribution', 'normal distribution function')
x = np.linspace(-5, 5, 100)
y = sigmoid(x)
drawpic(x, y, 'sigmoid', 'sigmoid Activation function')
y = tanh(x)
drawpic(x, y, 'tanh', 'tanh Activation function')
y = stepfunction(x)
drawpic(x, y, 'tanh', 'step Activation function')
y = relu(x)
drawpic(x, y, 'relu', 'relu Activation function')
y = leakyrelu(x)
drawpic(x, y, 'leakyrelu', 'leakyrelu Activation function')
y = softmax(x)
drawpic(x, y, 'softmax', 'softmax Activation function')
# 求正态分布值,avg表示期望值,std表示标准差def normaldistribution(x, avg=0, std=1):
return np.exp(-(x - avg) ** 2 / (2 * std ** 2)) / (np.sqrt(2 * np.pi) * std)
# return np.exp(-(x - avg) ** 2 / (2 * std ** 2)) / (math.sqrt(2 * math.pi) * std)
# Sigmoid函数# Sigmoid函数是一个在生物学中常见的S型函数,也称为S型生长曲线。# 在信息科学中,由于其单增以及反函数单增等性质,Sigmoid函数常被用作神经网络的阈值函数,将变量映射到0,1之间def sigmoid(x):
return 1 / (1 + np.power(np.e, -x))
# Tanh函数# Tanh是双曲函数中的一个,Tanh()为双曲正切。# 在数学中,双曲正切“Tanh”是由基本双曲函数双曲正弦和双曲余弦推导而来。# 函数tanh(蓝色)和函数sigmoid(橙色)一样,在其饱和区的接近于0,都容易产生后续梯度消失、计算量大的问题def tanh(x):
return (np.exp(x) - np.exp(-x)) / (np.exp(x) + np.exp(-x))
# 阶跃函数def stepfunction(x):
return np.array(x > 0, dtype=np.int32)
# ReLU函数# Relu激活函数(The Rectified Linear Unit),用于隐层神经元输出。# Relu会使一部分神经元的输出为0,这样就造成了网络的稀疏性,并且减少了参数的相互依存关系,缓解了过拟合问题的发生。def relu(x):
return np.maximum(0, x)
# leaky ReLU函数def leakyrelu(x):
return np.maximum(0.01 * x, x)
# softmax函数# softmax函数可以看做是Sigmoid函数的一般化,用于多分类神经网络输出。def softmax(x):
return np.exp(x) / np.sum(np.exp(x))