最近在学习推荐模型的评估,关于其常用评估指标,这里大概根据理解整理一下。
具体概念啥的西瓜书和网上都有大量的文章,这里也就不再赘述。只是简单总结一下各指标的计算及用法。
首先直接上Confusion Matrix(混淆矩阵)
然后是几个常用指标的公式及意义
下面直接通过两个例子来理解
例1:某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。
例2:假如某个班级有男生80人,女生20人,共计100人.目标是找出所有女生.
现在某人挑选出50个人,其中20人是女生,另外还错误的把30个男生也当作女生挑选出来了.
作为评估者的你需要来评估下他的工作
在Item CF算法中的简单理解,
准确率(Accuracy)是一个常见的指标,不过在样本不平衡时会出错。
召回率(Recall)指一个用户喜欢的产品被推荐的概率
精确率(Precision)指用户对一个被推荐物品感兴趣的可能性
F1指标,更好地评价算法优劣。
未完,,待续、、、、、
参考文章:
准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure