以小白的身份了解推荐系统。

召回

名词解释 “召回”（Retrieval）是推荐系统中的第一阶段，指当用户输入查询关键词（Query）后，搜索引擎 首先从海量的商品库中快速找出与该关键词相关的一系列候选商品的过程。推荐召回能够决定推荐系统的上限

这一阶段的目标是尽可能全面且高效地找出所有可能满足用户需求的商品，而不仅仅是精确匹配的结果。

召回机制是推荐系统中常用的算法策略 通过用户的属性和行为来进行数据的筛选和匹配。

它的目标是根据用户的历史浏览记录、购物记录、推测出可能感兴趣的商品从而提供符合用户需求的商品推荐。

与传统的排名方式不同，召回机制更关注匹配度而非明确的排名。

召回机制的目标是提供个性化、精准的商品推荐，让用户能够更轻松的找到自己感兴趣的商品，并提升用户购物体验。（阿里巴巴千人千面）

总而言之, 召回机制是一种基于 用户历史行为 和 兴趣 的算法策略，用于预测和推荐可能感兴趣的商品，并在电商平台等推荐系统中提供个性化精准的商品推荐。

常见的召回策略

协同过滤召回
内容相似度召回
图算法召回
热门召回
新课召回

排序

使用另一个模型对候选集进行评分和排序。所筛选的子集数据量为万/千。

常见的排序策略

机器学习
- 线性回归
二分策略
- 逻辑回归
- 梯度提升决策树
- 深度学习网络

重排

考虑最终排名的其他限制

删除重复商品
删除用户已购买的商品
删除已经下线、无库存的商品
删除用户明确表示了不感兴趣的商品
提高时效内容的得分和权重
热门补足：有些新用户，用户行为数据较少，涉及冷启动问题，可以使用一些热门物品进行补足
合并内容信息，推荐过程中使用的基本都是物品的 SKU ，此时需要基于 SKU 做数据填充例如相关商品名称、价格、图片等信息

业务决策

业务制定的规则，例如：夏天时针对某些有 tag 标签的商品增加权重

推荐系统怎么知道我喜欢什么？

基于用户行为分析的推荐算法, 那么推荐系统需要基于哪些基础数据来做支撑?

离线行为有日志记录用户点击、页面浏览链路、停留时间、点击、评分、评论。得到这些行为信息进而推测出用户的兴趣

协同过滤算法

基于用户的协同过滤算法（User Collaboration Filter，UserCF）。给用户推荐和他兴趣相似的其他用户喜欢的物品。更加社会化
基于物品的协同过滤算法（Item Collaboration Filter，ItemCF）。给用户推荐和他之前喜欢的物品相似的物品。更加个性化 (周边、类型类别)

最常用的两种通用召回策略, 基于物品表示向量的相似度召回, 基于物品关联规则 (tag) 的召回

基于物品表示向量的相似度召回, 物品 Item 的显示画像的表示, 把整个 item 嵌入到向量的表示, 用户-物品的矩阵
基于物品关联规则的召回 (常用在电商的购物车页面推荐或者购买页面推荐中), 找出所有用户购买的所有商品数据里频繁出现的 item 排序, 来做频繁集挖掘, 找到满足支持度 (即两个商品被同时购买的概率) 阈值的关联物品. 关联规则中分析的关键概念包括
- 支持度 (Support): 它是两件商品 (A＆B) 在总销量 (N) 中出现的概率, 即 A 和 B 同时被购买的概率;
- 置信度 (Confindence): 它是购买 A 后再购买 B 的概率;
- 提升度 (Lift): 它表示先购买 A 对购买 B 的概率的提升作用, 用来判断规则是否有实际价值, 及使用规则后商品在购物车中出现的次数是否高于商品单独出现购物车中的频率

U 2 i 和 i 2 i

U 2 i : 从用户到 Item
I 2 i : 从 item 到 item

参考文献

《个性化和推荐的系统架构》 | Netflix官方技术博客

推荐系统系列之推荐系统概览（上） | 亚马逊 AWS 官方博客

【推荐系统系列】Amazon的推荐系统是如何运行的？ – Twocups

向量检索简述 - 知乎

《推荐系统实战入门》

《个性化推荐系统开发指南》

《从零开始构建企业级推荐系统》

01 并发编程

深入理解Java虚拟机

深入理解Redis

自定义 start

01 搜索

02 推荐

00 《推荐系统从入门到放弃》

01 京东推荐系统

03 网红联盟广告营销

01 网红系统

程序人生

书单

读书有感

推荐系统的实现 ​

推荐系统的一般流程 ​

召回 ​

常见的召回策略 ​

排序 ​

常见的排序策略 ​

重排 ​

业务决策 ​

推荐系统怎么知道我喜欢什么？ ​

协同过滤算法 ​

U 2 i 和 i 2 i ​

参考文献 ​

推荐系统的实现

推荐系统的一般流程

召回