一般做分类比较重要的有三个步骤,每一步都对分类结果有很大的影响
1.找到合适的特征,举个栗子,例如题主的年龄估计,可以对图像进行预处理二值化(对图像分类这步很重要), 之后取横向的线的数目作为一个特征(纯属猜测,不确定这个特征是否有效),把很多个特征组成一个特征向量
2.选择合适的分类器,常用的分类器有SVM,LR,ANN等,对不同场景使用合适的分类器,上面有朋友提到LR,当然LR比较简单而且速度快,目前实际应用很多公司也是以LR为主。但并不是说其他分类器不好,SVM和ANN在很多场景下正确率也很高,甚至优于LR。但是因为调参比较困难和不容易理解(意思是很难从训练结果中找到事物间的规律,很多时候我们还想知道是怎么得出这个结果的),导致实际生产中使用较小
3.调参,很多分类器都有参数,例如SVM的选核,设定容错等。这些参数的设定对结果有很大影响。
最后针对题主的分类器是如何训练来简单说说
SVM的训练结果实际就是找到一个超平面,将不同的样本分开,以两个特征的二分类来说明比较容易理解
svm分类器_SVM