基于内容的推荐系统
定位: 最早被使用的推荐算法,年代久远,但当今仍然被广泛使用,效果良好。 定义: 给用户 X 推荐之前喜欢的物品的相似的物品。即 U2I2I
、U2Tag2i
基于物品打标签,
- 找物品的特征,标签、分类、关键词
- 得到结果:
- 钢铁侠: 动作片、科幻片
- 蜘蛛侠: 动作片、科幻片
- 功夫: 动作片、喜剧、周星驰
- 得到结果:
- 基于用户的行为的物品列表
- 计数当前用户的标签。
- 使用余弦相似度算法,计算用户标签向量最相似的 TopN 的物品列表。
- 返回结果 优缺点:
- 不需要其他用户的数据,能给具备独特口味的用户推荐,可以推荐最新的、冷门的物品,容易做推荐结果的解释
- 很难找到能表达物品的标签。有时候需要人工打标签,过于局限于自己的世界,无法挖掘出用户的潜在兴趣,新用户没有行为则没法做推荐,只能选择冷启动
基于协同过滤的推荐系统
基于用户的协同过滤
- 找到相似度最高的用户,做物品推荐 基于物品的协同过滤 同现相似度: 基于历史数据计算不同商品之间的相似度. 商品 A 和商品 B 之间的交集, 看个数 人话: 同一个用户, 买了商品 A 和 B 的数量有多少除以人数, 同时购买人数占各自购买的比例
多路召回的融合策略
推荐系统的 ABTest
内容相似推荐
私货: 你可能认识的朋友
应用场景: 小红书、拼多多、抖音
实现原理
- 通讯录授权: 读取通讯录的信息,通过通讯录查找相关账号做推送。
- 共同联系人: 你关注了 A、B。 AB 又同时关注了 C,那么这个时候 C 可能你也认识。
- 其他属性信息: 附近定位、
余弦相似度: 用户向量和物品向量的取夹角