机器学习中的推荐算法

发布:2023-01-30 10:46:32
阅读:544
作者:网络整理
分享:复制链接

推荐算法已经被很多公司使用,其中尤其是电商、短视频公司,这些算法根据用户提供的数据(如用户的偏好和兴趣)过滤最重要的信息来处理大量数据。简单来说就是根据用户感兴趣的偏好来推荐。

推荐算法决定了用户和对象的相容性,以及用户和物品之间的相似性,从而做出推荐。这些类型的系统对用户和交付的服务都有帮助。这些解决方案还改进了质量和决策过程。这类算法可以推荐范围广泛的项目,如电影、书籍、新闻、文章、工作和广告等等。

推荐算法主要分为三种类型:

  1. 基于内容的过滤
  2. 协同过滤
  3. 混合推荐系统

基于内容的过滤

这种形式的推荐算法根据用户之前搜索过的项目的内容显示相关的项目。用户喜欢的产品的属性/标签在这种情况下被称为内容。在这种类型的系统中,项目用关键字标记,之后系统试图通过搜索其数据库来理解用户想要什么,最后尝试推荐用户想要的不同产品。

以电影推荐算法为例,其中每部电影都被分配了一个类型,在上述情况下称为标签/属性。假设用户访问,系统没有关于他的信息。因此,首先,系统会尝试向消费者推荐热门电影,或者它会尝试通过让用户填写表格来收集有关用户的信息。一段时间后,用户可能对某些电影进行了评级,例如对动作片给予良好评级而对动漫电影给予低评级。而这样的结果就是推荐算法会向用户推荐动作片。

基于内容的过滤的优点

  • 因为推荐是针对单个用户定制的,所以该模型不需要来自其他用户的数据。
  • 使扩展变得更加容易。
  • 该模型可以识别用户的个人兴趣,并推荐只有少数其他用户感兴趣的商品。

基于内容的过滤的缺点

  • 在某种程度上,项目的特征表示是手工设计的,这项技术需要大量的领域知识。
  • 该模型只能根据用户之前的兴趣给出建议。

协同过滤

基于协作的过滤本质上是根据其他类似用户的兴趣和偏好向消费者推荐新商品。举个例子:当我们在网络购物时,它会通过“买了这个的顾客也买了”之类的话来推荐新产品。这避免了基于内容的过滤依赖于用户交互而不是来自用户正在使用的事物的内容的缺点。它只需要用户以前的表现。根据之前的数据,假设过去同意的用户将来会再次同意。

协同过滤可以分为两类:

基于用户的协同过滤:在这种类型中,系统识别具有相似购买偏好的个人,并根据购买行为计算用户之间的相似度。

基于项目的协同过滤:算法在此寻找与消费者购买的商品具有可比性的商品。对于预测,不同项目之间的相似性是基于项目而不是用户来计算的。

协同过滤的优势

  • 即使数据很小,它也能很好地工作。
  • 该模型帮助用户发现对特定项目的新兴趣,尽管如果其他用户也有同样的兴趣,该模型可能仍会推荐它。
  • 不需要领域知识。

协同过滤的缺点

  • 它无法处理新事物,因为该模型未针对数据库新添加的对象进行训练。
  • 次特征的重要性被忽略不计。

混合推荐算法

不同类型的推荐算法各有优缺点。单独使用时,这些策略中的有一部分是被限制的,特别是当多个数据源用于同一问题时。

并行和顺序是混合推荐系统的两种最常见的设计。并行架构向众多推荐算法提供输入,然后将这些算法组合起来提供单一输出。顺序架构为单个推荐引擎提供输入参数,并将输出传递给系列中的下一个推荐器。

混合推荐系统的优势

混合系统集成了多种模型以克服一种模型的缺点。总体而言,这减轻了使用单个模型的缺点,并有助于生成更可靠的建议。因此,用户将收到更强大和量身定制的推荐。

混合推荐系统的缺点

这些模型通常在计算上很困难,并且它们需要一个庞大的评级数据库和其他标准来保持最新状态。如果没有最新的指标就很难重新训练和提供来自不同用户的更新项目和评分的新推荐。

总而言之,推荐算法让用户可以轻松选择他们喜欢的选项和感兴趣的领域,会根据用户的喜好量身定制。目前,推荐算法已经在许多常见的应用上使用。

扫码进群
微信群
免费体验AI服务