UGC(user generated content)为推荐系统中用户生成的内容,标签为其中的一种。标签应用根据打标签的人不同,一般分为:专家给物品打标签和用户给物品打标签(也就是UGC的标签应用)。接下来我们只讨论第二种打标签的方式会遇到的问题。

首先用户给物品打标签,包含两层意义:一方面体现了用户的兴趣,另一方面体现了物品的属性。那么存在两个主要问题:

  1. 如何利用用户打标签的行为为用户进行个性化推荐(具体解决办法,看同一目录下的《基于标签的推荐方法概述》文档);
  2. 如何让用户为物品打上合适的标签。

接下来讨论“如何让用户为物品打上合适的标签”:

对于现在常用的方式是:用户为物品打标签,其中标签来源于两个部分,其一是该用户经常使用的标签,其二是该物品被其他用户打过最多的标签。第二个常用的方式可以采用图算法进行推荐。只不过此时问题是当用户u碰到商品i会打什么样的标签。此时需要将用户u对应的点赋值,商品i对应的点赋值,其余为零。

android 仿美团筛选标签 美团ugc标签_赋值

但是利用用户打标签的数据,会面临着两个问题。第一个问题是标签数据噪声大的问题,比如:同义不同形的词。针对此问题一般采用nlp处理技术和用户反馈技术来进行标签清理,提高标签的质量。第二个问题是对于新用户或者冷门物品如何推荐标签的问题。一般采用在物品内容信息中提取关键词作为标签或者对已有的(少量)标签做相关性拓展,来以此扩充推荐标签数量。