KDD商品推荐

商品推荐系统学习资料(一)_推荐系统

1. 推荐系统的整体架构

 

商品推荐系统学习资料(一)_数据_02
商品推荐系统学习资料(一)_ide_03

  1. 什么是item
    商品推荐系统学习资料(一)_数据_04

  2. item中的特征
    商品推荐系统学习资料(一)_相似度_05
    滑窗:

  3. 离散特征和连续特征
    Bucket-分桶:将连续型变量转化为离散型变量
    商品推荐系统学习资料(一)_推荐系统_06
    商品推荐系统学习资料(一)_数据_07
    商品推荐系统学习资料(一)_推荐系统_08

  4. 需要什么特征
    商品推荐系统学习资料(一)_数据_09
    5.特征挖掘

埋点数据、目标管理的理解
埋点数据:商品推荐系统学习资料(一)_ide_10
目标管理:商品推荐系统学习资料(一)_推荐系统_11

商品推荐系统学习资料(一)_ide_12

  1. u2i特征

user to item
用户浏览过item的特征
商品推荐系统学习资料(一)_ide_13

  1. 召回

召回首先就是砍item的维度:(要求复杂度低,快速)商品推荐系统学习资料(一)_推荐系统_14

商品推荐系统学习资料(一)_相似度_15

  1. Collaborative Filtering

协同过滤
商品推荐系统学习资料(一)_tensorflow_16
求用户的相似度:商品推荐系统学习资料(一)_推荐系统_17

  1. Matrix Formulation
    商品推荐系统学习资料(一)_相似度_18
  2. svd

商品推荐系统学习资料(一)_推荐系统_19

  1. new svd
    商品推荐系统学习资料(一)_ide_20

  2. Matrix Factorization
    商品推荐系统学习资料(一)_相似度_21

  3. SVD++
    商品推荐系统学习资料(一)_相似度_22
    独领风骚了一段时间

  4. 深度模型 ----wide and deep商品推荐系统学习资料(一)_相似度_23商品推荐系统学习资料(一)_数据_24

  5. 为什么?
    商品推荐系统学习资料(一)_数据_25

  6. ESMM

商品推荐系统学习资料(一)_推荐系统_26

2. 特征和特征工程

 

3. 召回.

 

召回阶段会用协同算法

4. Ranking

 

排序阶段会用CTR算法

5.Tensorflow

 

商品推荐系统学习资料(一)_推荐系统_27
商品推荐系统学习资料(一)_相似度_28

  1. what is tensor
    商品推荐系统学习资料(一)_推荐系统_29
  2. numpy and tensorflow

商品推荐系统学习资料(一)_数据_30

  1. numpy

商品推荐系统学习资料(一)_相似度_31

  1. tensorflow
    商品推荐系统学习资料(一)_数据_32
    商品推荐系统学习资料(一)_推荐系统_33
    商品推荐系统学习资料(一)_相似度_34
print(c.eval())
with 上下文管理器

商品推荐系统学习资料(一)_数据_35
商品推荐系统学习资料(一)_数据_36
商品推荐系统学习资料(一)_推荐系统_37
商品推荐系统学习资料(一)_相似度_38

6 从算法角度讲推荐:排序模型,y=model(user,item,context)

 

基本target:带来点击—(1,0),就是说这个item会被点击的概率

y=model(user,item,context)
输入:用户信息、品类(货)信息、和上下文环境(比如时间)

做推荐的,一个基本点,货找人

货:
pgc: 规范产品,质量有保障
ugc:个体户产品,质量没保障

user:喜好(用标签表示)

context:地点、ip、时间

监督模型:lr、gbdt、xgb、dnn、fm、ffm、deepfm、deep cross net、wide and deep、

y:label–{0,1} 点击或者未点击

针对短视频我们能抽取那些特征?
1.item(货):统计特征,最重要的特征
2.内容特征:title、标签、视频内容
3.用户特征:统计特征、用户的浏览点击记录 、用户的本身的属性

排序:通过数据 或者模型的优化进行排序

从货出发:
短视频,每天新增1000万
咨询每天新增1亿

如果对这么多item,让模型进行预测,过于耗费计算机资源,同时,延迟latency超过0.1s
影响用户体验,
所以有了召回。
召回的本质是平衡资源和推荐效率
召回不是粗排

精排(个性化排序模型):y=model(user,item,context)
粗排(非个性化排序模型):y=model(item,context)
粗排一般是没办法的情况下为了节约资源,提高效率,采取的下策
learn to rank:
lr、gbdt、xgb、dnn、fm、ffm、deepfm、deep cross net、wide and deep、

召回-》粗排(一般不要)-》精排 直接产出top n (一般 :0<n<20)

召回是对于大量item而言,如果只有100个item,那就不需要召回

7.从算法的角度讲推荐召回分支,key-value

 

召回的数据结构一般是个字典dict:key-value

cf ,协同过滤(dnn)—一系列的算法产生召回分支

==>i2i 、 u2u、 u2i、city2i、sex2i、category2i [key:value](这些都是召回分支)

设计召回分支,设计召回算法,优化召回算法

有多个召回分支在召回
召回:多类型key的字典
召回方法:多个分支召回后经过人工选定的阈值截断top1000,去重后1000个候选
送给排序模型进行排序

搞推荐的,每天都要思考怎么优化召回分支算法

点击item,这个itme会通过埋点回传服务器,会标记你的user_id,会推荐你点的类似的物品

feed是将用户主动订阅的若干消息源组合在一起形成内容聚合器,帮助用户持续地获取最新的订阅源内容。feed流即持续更新并呈现给用户内容的信息流。

数据从哪里来?
从日志(log)来
log的具体线上链路是什么?
app客户端埋点–》用户产生相应的点击,浏览,点赞,评论–》回传服务器
–》kafka,无延迟的上传到实时计算集群(storm)–》进行label拼接,形成log
–>根据数据进行建模

rerank:规则打散,业务逻辑,类似于强插,比如某明星必须放在第一条

8.从产品视角优化推荐,头条、快手、淘宝

 

隐式负反馈,什么不被点,就会被。。。
商品推荐系统学习资料(一)_tensorflow_39

9.推荐系统评估与实践

 

商品推荐系统学习资料(一)_ide_40
但是当我们形式化为算法问题,基本都是AUC

商品推荐系统学习资料(一)_ide_41

学术界标准

商品推荐系统学习资料(一)_ide_42

工业界

商品推荐系统学习资料(一)_tensorflow_43

冷启动问题

没有log怎么做
商品推荐系统学习资料(一)_数据_44
商品推荐系统学习资料(一)_推荐系统_45
商品推荐系统学习资料(一)_推荐系统_46

商品推荐系统学习资料(一)_ide_47
商品推荐系统学习资料(一)_ide_48
商品推荐系统学习资料(一)_tensorflow_49
真正的实时学习很难work

商品推荐系统学习资料(一)_推荐系统_50

推荐阅读资料

商品推荐系统学习资料(一)_相似度_51

工业界资料

商品推荐系统学习资料(一)_相似度_52

业界通用推荐框架

Deep Neural Networks for YouTube Recommmendations, RecSys’16
商品推荐系统学习资料(一)_推荐系统_53

商品推荐系统学习资料(一)_tensorflow_54
商品推荐系统学习资料(一)_tensorflow_55
Deep Collaborative Filtering Model
商品推荐系统学习资料(一)_数据_56
商品推荐系统学习资料(一)_推荐系统_57
商品推荐系统学习资料(一)_tensorflow_58
wide and deep 排序模型的示意图:
商品推荐系统学习资料(一)_ide_59
商品推荐系统学习资料(一)_数据_60
商品推荐系统学习资料(一)_tensorflow_61

推荐系统概述

 

商品推荐系统学习资料(一)_推荐系统_62
商品推荐系统学习资料(一)_ide_63
商品推荐系统学习资料(一)_tensorflow_64
商品推荐系统学习资料(一)_数据_65
商品推荐系统学习资料(一)_tensorflow_66
商品推荐系统学习资料(一)_数据_67
商品推荐系统学习资料(一)_相似度_68
商品推荐系统学习资料(一)_ide_69
商品推荐系统学习资料(一)_tensorflow_70
商品推荐系统学习资料(一)_tensorflow_71
商品推荐系统学习资料(一)_推荐系统_72
商品推荐系统学习资料(一)_数据_73
商品推荐系统学习资料(一)_推荐系统_74
商品推荐系统学习资料(一)_数据_75
商品推荐系统学习资料(一)_数据_76
商品推荐系统学习资料(一)_数据_77
商品推荐系统学习资料(一)_数据_78
商品推荐系统学习资料(一)_tensorflow_79
商品推荐系统学习资料(一)_ide_80
商品推荐系统学习资料(一)_ide_81
商品推荐系统学习资料(一)_ide_82

商品推荐系统学习资料(一)_推荐系统_83
商品推荐系统学习资料(一)_数据_84
商品推荐系统学习资料(一)_tensorflow_85
商品推荐系统学习资料(一)_相似度_86
商品推荐系统学习资料(一)_tensorflow_87
商品推荐系统学习资料(一)_ide_88
商品推荐系统学习资料(一)_相似度_89

商品推荐系统学习资料(一)_相似度_90
商品推荐系统学习资料(一)_tensorflow_91
商品推荐系统学习资料(一)_相似度_92
商品推荐系统学习资料(一)_推荐系统_93
商品推荐系统学习资料(一)_ide_94
商品推荐系统学习资料(一)_tensorflow_95
商品推荐系统学习资料(一)_数据_96
商品推荐系统学习资料(一)_tensorflow_97
商品推荐系统学习资料(一)_推荐系统_98
商品推荐系统学习资料(一)_ide_99
商品推荐系统学习资料(一)_ide_100
商品推荐系统学习资料(一)_推荐系统_101
商品推荐系统学习资料(一)_tensorflow_102
商品推荐系统学习资料(一)_推荐系统_103

最流行的推荐系统:itemCF和userCF

 

商品推荐系统学习资料(一)_推荐系统_104
商品推荐系统学习资料(一)_ide_105
商品推荐系统学习资料(一)_相似度_106
商品推荐系统学习资料(一)_相似度_107
商品推荐系统学习资料(一)_tensorflow_108
商品推荐系统学习资料(一)_推荐系统_109
商品推荐系统学习资料(一)_推荐系统_110
商品推荐系统学习资料(一)_数据_111
商品推荐系统学习资料(一)_相似度_112
基于距离计算相似度:
商品推荐系统学习资料(一)_tensorflow_113
基于相关系数计算相似度
商品推荐系统学习资料(一)_数据_114
越接近1,相似度越高
商品推荐系统学习资料(一)_推荐系统_115
商品推荐系统学习资料(一)_相似度_116
商品推荐系统学习资料(一)_tensorflow_117
商品推荐系统学习资料(一)_ide_118
商品推荐系统学习资料(一)_ide_119
商品推荐系统学习资料(一)_tensorflow_120
商品推荐系统学习资料(一)_ide_121
商品推荐系统学习资料(一)_tensorflow_122
商品推荐系统学习资料(一)_相似度_123
商品推荐系统学习资料(一)_推荐系统_124
商品推荐系统学习资料(一)_推荐系统_125
CF:协同过滤
商品推荐系统学习资料(一)_ide_126
一张表既可以icf 也可以ucf
商品推荐系统学习资料(一)_ide_127

商品推荐系统学习资料(一)_tensorflow_128
商品推荐系统学习资料(一)_推荐系统_129
商品推荐系统学习资料(一)_ide_130
商品推荐系统学习资料(一)_数据_131

item CF 一般会比 User CF好一点,因为User CF 需要长时间的观察
User CF一般会用在社交网络中

商品推荐系统学习资料(一)_数据_132
商品推荐系统学习资料(一)_数据_133
商品推荐系统学习资料(一)_相似度_134
商品推荐系统学习资料(一)_数据_135
商品推荐系统学习资料(一)_数据_136
商品推荐系统学习资料(一)_数据_137
商品推荐系统学习资料(一)_tensorflow_138
商品推荐系统学习资料(一)_ide_139
商品推荐系统学习资料(一)_推荐系统_140
商品推荐系统学习资料(一)_tensorflow_141
商品推荐系统学习资料(一)_ide_142
商品推荐系统学习资料(一)_相似度_143
商品推荐系统学习资料(一)_相似度_144
商品推荐系统学习资料(一)_推荐系统_145
商品推荐系统学习资料(一)_tensorflow_146
商品推荐系统学习资料(一)_相似度_147
商品推荐系统学习资料(一)_推荐系统_148
商品推荐系统学习资料(一)_相似度_149
商品推荐系统学习资料(一)_数据_150
推荐给u3,除去看过的,选剩下最高分 上面就是24.5分的电影

商品推荐系统学习资料(一)_ide_151

商品推荐系统学习资料(一)_数据_152
商品推荐系统学习资料(一)_相似度_153
AUC是衡量二分类模型优劣的一种评价指标,表示预测的正例排在负例前面的概率

商品推荐系统学习资料(一)_相似度_154
商品推荐系统学习资料(一)_推荐系统_155
商品推荐系统学习资料(一)_相似度_156
商品推荐系统学习资料(一)_推荐系统_157
商品推荐系统学习资料(一)_tensorflow_158
商品推荐系统学习资料(一)_ide_159
Slope One基本被放弃
商品推荐系统学习资料(一)_推荐系统_160
商品推荐系统学习资料(一)_数据_161

大数据环境下的itemCF实现

 

基于频繁模式的推荐系统,套餐设计

 

基于内容的推荐,隐语义模型

 

商品推荐系统学习资料(一)_tensorflow_162
商品推荐系统学习资料(一)_推荐系统_163

SVD,基于标签的推荐系统

 

网络好友

 

 

 

 

 

商品推荐系统学习资料(一)_相似度_164
商品推荐系统学习资料(一)_数据_165
商品推荐系统学习资料(一)_数据_166
商品推荐系统学习资料(一)_推荐系统_167
商品推荐系统学习资料(一)_ide_168

商品推荐系统学习资料(一)_ide_169
商品推荐系统学习资料(一)_推荐系统_170

商品推荐系统学习资料(一)_推荐系统_171

商品推荐系统学习资料(一)_数据_172
商品推荐系统学习资料(一)_tensorflow_173
商品推荐系统学习资料(一)_推荐系统_174
商品推荐系统学习资料(一)_tensorflow_175
商品推荐系统学习资料(一)_推荐系统_176
商品推荐系统学习资料(一)_tensorflow_177

商品推荐系统学习资料(一)_数据_178
商品推荐系统学习资料(一)_相似度_179
ge

商品推荐系统学习资料(一)_数据_180
商品推荐系统学习资料(一)_相似度_181
Faiss库
商品推荐系统学习资料(一)_推荐系统_182
商品推荐系统学习资料(一)_ide_183
商品推荐系统学习资料(一)_相似度_184
商品推荐系统学习资料(一)_ide_185
商品推荐系统学习资料(一)_推荐系统_186

商品推荐系统学习资料(一)_数据_187
商品推荐系统学习资料(一)_ide_188
商品推荐系统学习资料(一)_相似度_189
商品推荐系统学习资料(一)_推荐系统_190
商品推荐系统学习资料(一)_数据_191
商品推荐系统学习资料(一)_ide_192
2种防止过拟合的方法:
商品推荐系统学习资料(一)_相似度_193
长尾效应指那些原来不受到重视的销量小但种类多的产品或服务由于总量巨大,累积起来的总收益超过主流产品的现象

商品推荐系统学习资料(一)_相似度_194
商品推荐系统学习资料(一)_数据_195
商品推荐系统学习资料(一)_数据_196