报告笔记-推荐系统101

2018/11/25

Categories: RecommenderSystems Tags: RecommenderSystems

报告者: 小红书 - 姚旭

无限下拉feed流的个性化推荐:主要针对兴趣,次针对follow关系

曝光 $\rightarrow$ 点击 $\rightarrow$ 交互 $\rightarrow$ 用户价值【最优化的目标】$\rightarrow$ 用户留存

Q: 为什么纯优化点击、提升点击率(CTR, Click-Through-Rate)不是最好的优化目标?

A:

优化停留时长?是kill time而已

好的推荐:尽量引导客户行为,考虑读者、作者双边价值


优化目标:让用户产生价值

转化为公式:对不同行为赋予不同的value权重,加权求和 $$ \begin{aligned} S=&\Pr(click)\times V(click)\newline &+\Pr(like)\times V(like) \newline &+\Pr(comment)\times V(comment)\newline &+\Pr(share)\times V(share)\newline &+\Pr(follow)\times V(follow)\newline &+\Pr(hide)\times V(hide) \end{aligned} $$



排序模型的迭代

  1. 人工规则
  2. LR, FM/FFM, GBDT
  3. DNN: 不要一开始就选择DNN,响应慢,调参是黑匣子,投入产出不成正比

scaling对逻辑回归的作用:

  1. 梯度下降收敛速度更快
  2. 使用正则化项,则必须要做scaling

推荐的迭代路径

人工规则 $\rightarrow$ GBDT $\rightarrow$ GBDT+LR $\rightarrow$ DNN


个性化:和人相关的特征

top features:

raw features的持续建设:覆盖率 * 区分度


用户画像:

内容画像:

将用户和内容映射到同一空间进行匹配:e.g. 都 $\in \mathbb{R}^{1024}$,再计算相似度,用NN

用户内容embedding


每天300+ A/B Test: 10%成功率