首页 > 心得体会 > 学习材料 / 正文

大数据时代基于用户需求的推荐多样性方法研究综述

2023-02-05 19:10:07 ℃

钱玉婷

(桂林理工大学商学院广西桂林 541004)

关键字：推荐系统；
推荐多样性；
推荐方法

随着大数据时代的到来[1]，人们逐步从信息匮乏时代跨越到信息过载时代[2]。如今人们面临的信息问题大多是由爆炸式增长的数据带来的[3]，比如难以在纷繁的数据中找到符合自己需求的信息。推荐系统由此孕育而生，其凭借信息过滤和信息筛选能力成为有效解决信息过载问题的工具。21世纪初，史密斯等人提出在推荐过程中引入多样性概念。推荐多样性通过增加推荐列表中物品之间的种类，使得推荐物品的覆盖范围和用户兴趣的偏好覆盖范围更加广泛，但是目前推荐系统相关综述类文章研究的侧重点主要集中在提高推荐的准确性，缺乏对推荐多样性的研究。所以，本文从推荐多样性的角度出发，对提高推荐多样性的方法进行梳理和总结。

基于长尾效应的推荐多样性方法的基本思想是通过增加推荐列表中长尾产品的数量实现推荐多样性。研究表明，增加长尾物品的推荐会提高总体多样性，多样性强的推荐会给企业带来好处[4]。在基于长尾效应的推荐多样性方法中，根据长尾效应增加推荐多样性方法的不同，又可分为多标准推荐多样性方法和尾部聚类推荐多样化方法。

1.1 多标准推荐多样性方法

多标准推荐多样性方法是引入物品流行度、用户偏好度或用户间相似关系多个推荐标准对物品重新排序，从而调节长尾物品的推荐比例、提高长尾物品的推荐率，进而生成最终推荐列表的方法。谢修娟等(2019)[5]在预测评分时，使用物品流行度权重来恰当地协调长尾商品与流行商品，惩罚物品流行度对物品推荐期望的影响。刘业政等(2018)[6]提出一种推荐方法，用户偏好相似度用余弦相似性来衡量，以达到优化推荐多样性算法的目的。邓乐乐等(2021)[7]在结合热门物品评分和物品流行度的基础上，进一步优化协同过滤算法，动态调整物品权重，综合衡量了推荐结果的多样性和覆盖率问题。刘浩翰等[8]通过计算出的用户间相关关系来计算长尾分布约束推荐的推荐权重，对长尾商品的推荐表现良好。

1.2 尾部聚类推荐多样性方法

尾部聚类推荐多样性方法[9]先将整个物品集分成头部和尾部，再对尾部物品进行聚类，最后基于此进行多样性推荐。史明哲等(2018)[10]通过分词获取长尾尾部物品信息，抽象出物品主题，再结合用户的最终偏好主题进行相似度计算，并对相似度进行排名，可发现用户的未来偏好趋势，进而对尾部商品推荐。考虑到长尾商品大部分缺少评分数据这一特点，吴国栋(2020)[11]在选取分割点后，将形成的尾部运用Kmeans++进行聚类，在长尾推荐带来多样性的同时，以有效提高长尾物品推荐的准确性。徐小菁(2019)[12]以物品流行度作为标准进行长尾推荐是存在有偏性的问题，提出ITCC双聚类和Kmeans聚类算法，在尾部聚类下用户物品矩阵的稠密度得以提高，优化长尾物品的推荐效果。Sinha等(2019)[13]表示通过尾部聚类的方法把相似的用户聚类到同一个聚类中，可以克服协同过滤带来的数据稀疏问题，从而提高推荐多样性。

基于二部图的推荐多样性方法的基本思想是在二部图的基础上，结合物质扩散和热传导思想来提高推荐多样性。在推荐方法中，二部图可表示为G(U,O,E)，U为用户的集合={u，u，u，…，um}，o是物品的集合={o，o，o，…，on}，E是二部图中的边所构成的集合，其中用户集合U和物品集合I是两个互不相交的集合。塔赫基于二部图推荐提出了著名的基于图的推荐算法，能够缓解冷启动和数据稀疏问题，提高推荐结果的多样性。邓松等(2017)[14]在区分用户高低评分的基础上，改进二部图中初始资源分配，从而解决推荐多样性问题。苏健民、郭付超(2018)[15]在调整两次资源分配方式后，成功向用户推荐更多符合用户偏好的产品。王冉等(2018)[16]提出一种基于加权二部图的斜坡算法推荐算法，在一定程度上增加推荐结果的多样性。刘忠宝等(2018)[17]提出了一种基于二部图的学习资源混合推荐模型，将热传导提高推荐多样性的特点和物质扩散能提高推荐准确性的特点结合起来，并通过设定可调参数λ进行调整。黄继婷等(2019)[18]提出融合偏好度和二部图的推荐算法，降低热门物品推荐概率和提高冷门物品推荐概率，从而达到提高推荐多样性的目的。

基于行列式点过程的推荐多样性方法[19]的基本思想是最大化抽取推荐给用户的物品集的概率来实现推荐多样性。DPP是一种用求解行列式来计算概率的方法。Hulu在2018年提出了基于行列式点过程的推荐多样性提升算法，能同时衡量相关性和多样性，并在提高推荐系统多样性中表现良好。他将基于DPP的推荐多样性问题转化为MAP问题求解，从而达到提高推荐多样性的目的。李金龙基于DPP在求解多目标问题时，虽然在核矩阵的定义上与Hulu不同，但其同样可以综合评价收敛性和多样性。李金龙还在求解DPP问题过程中，将DPP转化为k-DPP，借助矩阵的特征值分解降低其时间复杂程度。行列式点过程推荐多样化方法，不仅能同时度量物品的多样性和相关性，还能简化计算，提高推荐效率和效果。

基于注意力机制的推荐多样性方法的基本思想是利用注意力机制覆盖更加全面的用户兴趣范围，从而提高推荐多样性。传统的序列推荐模型重点关注用户过去的偏好，所以预测结果偏向以往类似或补充的物品，在结果多样性上表现不佳。基于注意力机制的推荐多样性方法对用户以往的历史行为分配权重，更加全面和有针对性地抓取用户的兴趣点，消除一定程度的“头部效应”，从而在多样性上表现良好。Hu等(2021)提出了一个多目标LPR框架，使用卷积神经网络捕捉学习者之间的动态交互，建立注意力机制来根据内容的特点调整交互行为的权重，优化由交互强度、多样性和新颖性三个相互冲突的指标组成的多目标函数。曲昕彤(2020)[20]在NeuMF的模型基础上，对多层感知机部分进行改进。在权衡多样性和有侧重性的精准推荐前提下，新增注意力机制来实现局部激活单元。用户历史行为向量与物品嵌入向量的外积构成前馈神经网络，从而输出其激活权重，即

综上所述，推荐多样性可以提高推荐质量，并且提高推荐多样性的方法主要基于长尾效应、二部图、行列式点过程及注意力机制四个方面。本文从性能特点和局限性两个方面对推荐多样性方法进行比较和总结。(1)基于长尾效应的推荐多样性方法能比较全面地覆盖利基产品种类，但准确性表现不佳。(2)基于二部图的推荐多样性方法可在不考虑内容特征的前提下，达到缓解冷启动和数据稀疏等问题，但存在大量信息浪费的缺点。(3)基于行列式点过程的推荐多样性方法，用简单的行列式计算替换复杂的概率计算，从而降低时间复杂度，但粗排序阶段需要有相应的多样性策略，否则无法保证其多样性。(4)基于注意力机制的推荐多样性方法，对用户以往的历史行为分配权重，更加全面和有针对性地抓取用户的兴趣点，消除一定程度的“头部效应”，从而在多样性上表现良好，但计算过程需要大量资源与储存空间，增加多样性推荐模型的复杂度。

大数据时代下，推荐多样性逐步成为推荐领域的热点，推荐多样性弥补了以准确率为目标进行优化的推荐算法所导致的“信息茧房”问题，对信息提供方、用户和商家而言，都具有重要意义。本文经过论文梳理将推荐多样性方法主要总结为以下四个：基于长尾效应的推荐多样性方法、基于二部图的推荐多样性方法、基于行列式点过程的推荐多样性方法和基于注意力机制的推荐多样性方法，并对这四种推荐多样性方法的性能特点和局限性做了详细比较。但是，提高推荐多样性的方法还存在不少挑战，例如推荐多样性的感知是主观的，相关性与多样性之间的权衡等，这些都是提高推荐多样性方法未来需要解决的难题。

猜你喜欢行列式长尾尾部船舶尾部响应特性试验与计算舰船科学技术(2022年20期)2022-11-28基于动态语义记忆网络的长尾图像描述生成北京航空航天大学学报(2022年8期)2022-08-31范德蒙德行列式在行列式计算中的应用数学学习与研究(2020年17期)2020-12-30长尾狐卖树小学生学习指导(高年级)(2020年6期)2020-07-07计算行列式的几种不同方法解析数码世界(2020年1期)2020-01-08海洋大探险红领巾·探索(2019年6期)2019-08-01N的最大值是多少？学生导报·东方少年(2019年28期)2019-01-17三阶行列式计算的新方法知识文库(2017年21期)2017-10-20加项行列式的计算技巧考试周刊(2016年89期)2016-12-01长尾鹊中国诗歌(2016年6期)2016-11-25

Tags：多样性综述需求

上一篇：党的二十大献礼（玉花锦羽灼烁缤纷，国画）
下一篇：中国化工品的出口竞争力分析