B站up主“刘二大人”视频 笔记
详细过程:
本课程的主要任务是构建一个完整的线性模型:
导入numpy和matplotlib库;
导入数据 x_data 和 y_data;
定义前向传播函数:
forward:输出是预测值y_hat
定义损失函数:
loss:损失函数定义为MSE:均方根误差
创建两个空列表,因为后面绘图的时候要用:
分别是横轴的w_list和纵轴的mse_list
开始计算(我觉得这里没有训练的概念,只是单纯的计算每一个数据对应的预测值,然后让预测值跟真是y值根据MSE求损失):
外层循环,创建40个横坐标自变量:
用w表示;
在0.0~4.0之间均匀取点,步长0.1;
内层循环:核心计算内容
从数据集中,按数据对儿取出自变量x_val和真实值y_val;
先调用forward函数,计算预测值 w*x(y_hat)
调用loss函数,计算单个数据的损失数值;
累加损失,并记下来(此处要提前初始化一个值为0的变量,后面才能不报错);
随意打印想要看到的内容,一般是打印x_val、y_val、loss_val;
在外层循环中(也就是每一个数据对儿计算的时候),都要把计算的结果,放进之前的空列表,用于绘图;
在获得了打印所需的数据列表只有,模式化地打印图像。
程序如下:
import numpy as np
import matplotlib.pyplot as plt
x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]
def forward(x):
return x * w
def loss(x, y):
y_pred = forward(x)
return (y_pred - y) * (y_pred - y)
w_list =[]
mse_list = []
for w in np.arange(0.0, 4.1, 0.1):
print('w=', w)
l_sum = 0
for x_val, y_val in zip(x_data, y_data):
y_pred_val = forward(x_val)
loss_val = loss(x_val, y_val)
l_sum += loss_val
print('\t', x_val, y_pred_val, loss_val)
print("MSE=", l_sum/3)
w_list.append(w)
mse_list.append(l_sum/3)
plt.plot(w_list, mse_list)
plt.ylabel('Loss')
plt.xlabel('w')
plt.show()
运行结果如下:
视频讲解截图:
设计步骤:1、选择合适的数据集;2、选择适合的模型;3、训练;4、推论(测试)
把训练集分成2部分,一部分为训练集,另一部分为开发集,开发集用于模型的评估;若开发集评估后的模型效果比较好的话,我们便把所有的训练集(训练集+开发集)给模型进行训练。
在模型的选择中,可以先选择线性模型,若效果不好,则改选其他模型
模型简化,去除b
模型w初始化一个随机权重,w=随机值
把评估模型称为损失(真实值与预测值之间的误差)
寻找一个最好的权重w,使得损失最低
模型可视化 visdom包
- 训练过程中,要存盘
- visdom 可视化