训练集 & 验证集 & 测试集

划分比例一般为 6:2:2

训练集:

用来拟合模型,通过设置模型内部的参数,训练模型。

验证集:

作用是当通过训练集训练出多个模型后,为了能找出效果最佳的模型,使用各个模型对验证集数据进行预测,并记录模型准确率。选出效果最佳的模型所对应的参数,即用来调整模型参数。

测试集:

通过训练集和验证集得出最优模型后,使用测试集进行模型预测。用来衡量该最优模型的性能。即可以把测试集当做从来不存在的数据集,当已经确定模型参数后,使用测试集进行模型性能评价。