2. 深圳腾讯计算机系统有限公司, 北京 100080
2. Shenzhen Tencent Computer System Co. Ltd., Beijing 100080, China
随着互联网和web 2.0技术的飞速发展, 网络上信息资源迅猛增长, 进而导致“信息过载”的问题愈发严重.用户从海量的文本、视频、图像和商品等资源中找到符合自己个性化需求的信息变得十分困难.个性化推荐系统是解决上述问题的关键技术之一.与搜索引擎相比, 推荐系统能够通过对用户的历史行为数据的研究, 统计分析出用户的兴趣偏好, 从而引导用户发现自己的信息需求, 实现个性化推荐.因此, 这一技术已被广泛地应用于电子商务、社交网络和视频网站等方面.
传统的个性化推荐系统都是基于单一领域的, 即根据用户对某一领域的偏好特征, 为用户提供该领域的推荐服务.例如, YouTube网站依据用户观看视频的历史记录给用户推荐他可能感兴趣的视频; Last.fm网站根据用户对音乐所打的标签给用户推荐符合他兴趣的音乐.迄今为止, 应用最为广泛的单领域推荐技术是协同过滤, 其核心思想是给目标用户推荐与他兴趣偏好最为相似的用户喜欢的项目, 或者与他曾经喜欢过的项目最为相似的项目.然而, 随着用户规模和项目数量的急剧增长, 传统的协同过滤推荐算法的缺陷逐渐暴露出来, 特别是新用户、新项目和新系统的冷启动以及用户行为数据稀疏的问题, 这些问题致使协同过滤推荐性能降低, 妨碍算法的进一步推广.不难发现, web 2.0模式下的用户不仅仅是互联网信息的使用者, 更是信息的生产者.用户在不同的社交媒体和电子商务网站中直接或间接地表达出自己不同角度的兴趣偏好.研究表明, 来自于不同平台(社交媒体和电子商务网站等)的用户兴趣偏好或项目特征(属性、类别等)之间存在很强的关联性和依赖性[1].例如, 通常情况下, 喜欢阅读推理小说的用户更倾向于观看悬疑类电影, 而观看电影之后也会购买一些与电影相关的周边, 如CD、明星同款商品等.基于这一现象, 学术界和业界提出了跨领域推荐技术:从其它领域中获取有效的用户偏好或项目特征的信息来丰富目标领域中的数据, 精准地预测用户行为, 提供更加合理和个性化的推荐服务.例如, 给购买学习参考书的用户, 推荐相关视频教程、在线练习题等; 根据出行游客的旅游目的景点, 给他们推荐酒店、特色美食等.概括来说, 成熟领域积累了大量的用户行为数据, 通过领域间信息资源的共享和互补, 不仅可以有效地缓解用户访问量少的推荐系统所面临的数据稀疏和冷启动问题, 而且可以提高用户满意度、改善用户体验.但是, 不同领域数据的异构性、知识的独立性使得传统的单领域推荐算法无法直接应用于提供推荐服务.针对这一问题, 学术界和业界开展了大量的研究和实践工作, 提出了很多跨领域推荐算法的模型和框架.本文主要研究了跨领域推荐技术, 对其做了系统的分类, 并结合各自的特点进行了分析和总结.
本文结构安排如下:第1节概述跨领域推荐算法的相关概念、技术难点; 第2节对现有的跨领域推荐技术进行分类, 总结出各自的优点及不足; 第3节详尽地介绍跨领域推荐算法的性能分析方法; 最后1节对全文进行总结并对未来的研究热点做出展望.
1 跨领域推荐系统概述跨领域推荐旨在整合来自不同领域的用户偏好特征, 针对每个用户自身特点进行智能化感知, 精准满足用户个性化需求, 从而提高目标领域推荐结果的准确性和多样性.与传统的单领域推荐系统相似, 跨领域推荐系统也有3个重要的模块(如图 1所示):用户建模模块、推荐对象建模模块和推荐算法模块.两者区别在于给用户和待推荐对象建模时, 跨领域推荐利用的是融合多个辅助领域信息的数据而不仅仅是目标领域提供的数据; 而在进行推荐的时候, 它也可以根据提高准确性或多样性需求的不同, 来灵活地选定用户群体或待推荐对象[2].
![]() |
图 1 跨领域推荐系统流程 Fig.1 The process for cross-domain recommendation |
学术界提出了多种关于“域”的定义.例如, 文献[3]认为同一综合型网站上的图书和电影属于不同的领域; 文献[4]则将来自不同电影视频网站(MoveLens, MoviePilot, Netflix)的用户观看历史记录视为源自不同领域的用户行为数据.据我们所知, 学术界和业界至今没有给出一个关于“域”的统一定义.通过调研大量的相关研究工作[2, 5-7], 本文将“域”分为三类: “系统域”、“概念域”和“时间域”.
总体说来, 前两种关于“域”的划分方式更为常见.
1.2 跨领域推荐的任务本文用符号
跨领域推荐能够实施的一个关键性的假设是:用户的兴趣偏好或项目特征在领域之间存在一致性或相关性.这一假设也在一些研究工作[8-9]中得到佐证.跨领域推荐利用的正是领域间的一致性或相关性, 如用户、项目的交集, 用户兴趣、项目特征的相似程度, 潜在因子的相互关系等进行知识迁移, 从而弥补目标领域所面临的信息不足的问题, 改善推荐性能.同时跨领域推荐也是一个极具挑战性的研究领域, 其主要原因分析如下.
在实际应用中, 不同领域间用户的重叠信息(Overlapped Information)对领域间信息资源或知识的共享和迁移起着至关重要的作用, 同时也是在设计跨域推荐方案时首先应当考虑的问题.按照用户重叠程度的不同可将跨域推荐的场景分为3类:领域间用户完全重叠(Fully-overlap)、领域间用户部分重叠(Partially-overlap)以及领域间用户完全不重叠(Non-overlap).之所以这么划分, 是因为领域间信息资源或知识共享和迁移的方式会随着有无用户交集而有所不同.从图 2可以看出, 当领域间用户完全重叠时, 可将两个领域合并, 从而轻易地将跨域推荐问题转换为单领域推荐; 当领域间用户部分重叠时, 这部分共享用户便成为领域间信息共享和迁移的桥梁; 当领域间用户完全不重叠时, 就需要通过挖掘领域间隐藏的共同用户或其他关系进行迁移学习.当然, 领域间的项目也可能存在交集.但用户和项目在推荐系统所担当的角色是对等的.因此, 本文着重对领域间不同的用户重叠情况下的跨域推荐技术进行研究, 项目重叠情况下的推荐方案与其类似, 不做赘述.
![]() |
图 2 跨域推荐的3类场景 Fig.2 Cross-domain recommendation scenarios |
主流的跨域推荐算法有3类:基于协同过滤关系的跨域推荐、基于语义关系的跨域推荐以及基于深度学习的跨域推荐.其中, 协同过滤关系主要指用户或项目的近邻关系、隐语义模型等; 语义关系主要指项目属性、标签信息、语义网络关系和关联关系等[6].然而, 同一种方法在不同的跨域推荐场景下, 推荐性能不尽相同.往往需要针对不同的推荐场景而采取不同的方案.下面将依据不同的推荐场景来介绍跨域推荐技术.
2 领域间用户完全重叠的跨域推荐方法现实生活中, 越来越多的网站呈现出向综合型的门户网站转变的趋势, 其所提供的推荐对象囊括了多个不同的领域.例如, Amazon除了提供图书购买外, 还有服饰、电子器件的销售; 著名的社区网站---豆瓣, 以书影音起家, 现在还提供线下同城活动, 小组话题交流等多种服务.若从概念域角度来说, 书籍、电子器件和影音等便为不同领域中的项目, 而领域间的用户群体完全相同.此时, 一种最直观的想法是将不同领域的用户行为数据整合为一个整体, 即一个更大的“单领域”, 从而将跨域推荐问题转化成单领域推荐问题.
2.1 基于协同过滤关系的跨域推荐文献[10-11]均提出一种集中式的协同过滤模型.如图 3所示, 模型将来自不同领域的评分矩阵(
![]() |
图 3 集中式的协同过滤模型 Fig.3 Centralized collaborative filtering model |
基于矩阵合并的跨域推荐方案的缺陷在于忽视了领域间的差异.在某些情况下该方案并不能提高目标领域的推荐性能, 反而有可能引入“噪声”数据降低目标领域的预测精度.为了克服这一缺点, 文献[12]提出了一种基于联合矩阵分解的跨领域推荐算法.与传统的基于矩阵分解的单领域推荐算法相似, 均是通过最小化损失函数来获得两个特征矩阵:用户特征向量矩阵
$\begin{align} L(U, V^{(s)}, V^{(t)})=\alpha||R_s-UV^{(s){\mathrm T}}||^2_F+(1-\alpha) ||R_t-UV^{(t){\mathrm T}}||^2_F, \end{align}$ | (1) |
其中,
张量分解是近几年推荐系统的研究热点, 主要是通过在二维评分矩阵中加入一维或者多维信息, 如标签[15-16]、领域[17]等信息来获得更为全面的用户的偏好特征.在评分矩阵中, 加入领域信息, 构造一个用户-项目-领域(user-item-domain)的三阶向量(如图 4左图所示), 是一种较为新颖的用于解决领域间用户为共同维度的跨领域推荐问题的方法.若将该三阶张量按正面切片的形式表示可发现每个切片正好是每个领域的评分矩阵
![]() |
图 4 不规则的用户-项目-领域三阶张量转换为规则的张量 Fig.4 Slices of rating matrices for each domain are transformed into a cubical tensor |
文献[17]将基于PARAFAC2[20]的张量分解算法应用到跨域推荐中, 成功解决了上述问题.该跨域推荐模型首先引入
$\begin{align} L(U, V, C, P_k)\!=\!\dfrac{1}{2}\sum\limits^N_{d=1}||w_d(R_dP_d\!-\!U\Sigma _dV^{\mathrm T})|| ^2_F\!+\!\dfrac{\lambda_U}{2}||U||^2_F+\dfrac{\lambda_V}{2} ||V||^2_F+\dfrac{\lambda_C}{2}||C||^2_F, \end{align}$ | (2) |
其中,
在这一推荐场景下, 基于语义关系进行跨域推荐的研究相对较少, 主要为基于图模型的跨域推荐算法.语义关系主要指项目属性、标签信息、语义网络关系和关联关系等, 图模型中会将上述的相关信息转换为边和权重. 2015年, Jiang等人提出跨域推荐模型[23]:将不同的领域通过社交网络相互连接起来, 构成一个以社交网络为中心的星型结构的混合图(star-structured hybrid graph).对构建好的网络图采用HRW(Hybrid Random Walk)算法来预测用户与项目之间的关系.特别地, 如图 5所示, 除了考虑用户与各领域中项目的交互关系外(虚线表示), 每个领域中项目的语义关系(实线表示)也被用于知识的迁移.这是解决领域间数据异构问题的一个行之有效的方法.文献[24]提出利用标签体系解决异构问题, 成功实现了依据微博上的博文给用户推荐电影的跨域推荐服务.其核心在于, 以用户博文上的标签和电影标签之间的语义关系为桥梁(如图 6所示, 虚线表示用户-博文标签、电影-电影标签之间的关系, 实线表示语义关系), 将用户和电影关联起来, 组成一个多部图, 再基于图模型进行用户偏好预测.这类模型在解决数据稀疏、冷启动以及领域间数据异构方面很有优势.
![]() |
图 5 星型结构混合图 Fig.5 A Star-structured hybrid graph |
![]() |
图 6 跨领域多部图 Fig.6 A multi-partite graph across two domains |
隐私保护和商业竞争等原因使得跨域推荐算法的设计者难以获得不同领域中用户群体的重叠情况, 相应地就无法利用重叠的用户集作为领域间信息资源共享、迁移的桥梁.解决这一场景下的跨域推荐问题有两个途径: ① 采用用户匹配算法[25-27]挖掘出隐藏的重叠用户集, 将其转换为领域间用户有重叠的跨域推荐问题; ② 基于协同过滤或语义关系进行知识迁移.本节着重介绍途径二的相关技术, 途径一的相关算法可参照第2节和第4节的内容.
3.1 基于协同过滤关系的跨域推荐隐语义模型是隐含语义分析技术的一种, 也是推荐系统领域一个热门的研究话题.其核心思想是通过聚类或矩阵分解等方法将稀疏高维的用户-项目矩阵映射到一个低维的隐空间(Latent Space)中, 找出潜在的主题或类别来表示用户的偏好和项目的特征从而能够以紧凑、简略的特征向量来表征用户、项目, 即用户、项目的隐语义模型.那么, 在跨领域推荐情境中, 自然可以想到将源领域中用户、项目的隐语义模型作为迁移学习对象, 来对目标领域中的用户、项目特征向量进行补充和增强.然而, 用户、项目特征向量可以在领域间共享或融合的前提是用户、项目必须严格一致或存在很强的相似性.因此, 如何有效地挖掘出领域间潜在的一致性关系或用户间的相似程度, 成为设计这类算法的核心问题.
文献[28]提出一种融合标签的协同过滤的跨领域推荐算法.模型首先利用标签系统中丰富的、用户给项目所标注的标签信息, 计算出用户-用户的相似度矩阵
$\begin{align} L(U^{(S)}, V^{(S)}, U^{(T)}, V^{(T)})=&\dfrac{1}{2}\sum\nolimits_ {d\in\{s, t\}}\sum\nolimits ^{M_d}_{i=1} \sum\nolimits^{N_d}_{j=1}I^{R^d}_{ij}(R^{(d)}_{ij}-U_i^{(d){\mathrm T}}V_j^ {(d)})^2\notag\\ &+\dfrac{\alpha}{2}\sum\nolimits^{N_1}_{j=1}\sum\nolimits^{N_2}_{q=1} I^{S^{(V)}}_{jq}(S^{(V)} _{jq}-V_{j}^{(s){\mathrm T}} V_q^{(t)})^2\notag\\ &+\dfrac{\beta}{2}\sum\nolimits^{M_1}_{i=1}\sum\nolimits^{M_2}_ {p=1}I^{S^{(U)}}_{ip}(S^{(U)}_{ip} -U^{(s){\mathrm T}}_iU_p^{(t)})^2\notag\\ &+\dfrac{\lambda}{2}\sum\nolimits_{d\in\{s, t\}}(||U^{(d)}||^2+||V^{(d)}||^2). \end{align}$ | (3) |
其中,
除了利用用户打标签的行为挖掘领域间隐藏的关系外, Li等人在2010年提出一种密码本迁移模型(Codebook Transfer Model, CBT)[1].该模型从用户和项目两个角度对评分矩阵进行联合聚类, 发现来自不同领域的评分矩阵之间存在一个完全一致的用户-项目的聚级评分矩阵, 并将其形象地称之为“密码本”, 用于知识迁移.具体做法如下:首先通过正交非负三因式(Orthogonal nonnegative matrix tri-factorization, ONMTF)[30]模型对源领域评分矩阵
$\begin{align} B=[U^{\mathrm T}_sR_sV_s]\oslash [U^{\mathrm T}_s {\bf 11}^{\mathrm T}V_s], \end{align}$ | (4) |
求出“密码本”即矩阵
$\begin{align} L=||[R_t-U_{ t}^{\mathrm T}BV_{ t}]\circ I||^2_F. \end{align}$ | (5) |
训练出目标领域中的用户、项目特征向量矩阵
上述3种方法的不足在于抹平了领域间的差异.针对CBT模型, 文献[6]提出一种既考虑领域之间相同因素也考虑差异信息的跨域推荐算法对其进行改进.算法将源领域和目标领域潜在聚级评分矩阵划分为共有部分
$\begin{align} L=||[R_s-U_{\mathrm s}[B_0, B_s]V^{\mathrm T}_s]\circ I_s||^2_F+||[R_t-U_{\mathrm t}[B_0, B_t]V_t^{\mathrm T}]\circ I_t||^2_F. \end{align}$ | (6) |
通过不断地迭代更新, 求出最后的模型参数
Chuang等人[35]基于项目属性交集提出了一种用于提高推荐结果多样性的模型:将那些在项目属性上和用户历史购买的项目有交集的项目, 推荐给用户.但实际上不同领域中项目的高度异构性导致项目间共同属性很少甚至没有.
因此, 有一些工作借助于社交网络中的标签信息, 来挖掘领域间用户、项目隐藏的关系.其中一种方案是以Wikipedia[36]、WordNet[37]和情绪[38]分类体系为中间载体, 基于语义相似度、关联规则将不同领域中的标签映射到上述分类体系中, 构建由分类体系中的类别而构成的用户偏好特征, 从而获得更为精准的用户相似度信息.另外一种方案是利用LDA主题模型[39]对用户所打的标签信息进行建模[40]构建出一个不同领域共享的用户特征(user profile)主题分布空间, 再基于这一空间找出不同领域中偏好相近的用户, 实施跨域推荐.
另外, 还有一些工作利用外部知识库(Wikipedia, DBpedia)构造语义网络, 来解决领域间数据异构问题.文献[41]通过分析用户登录日志获取用户信息(User profile)和待推荐对象的文本信息(Recommender context), 并将这两部分信息与Wikipedia的页面建立对应关系.再利用Wikipedia页面间的链接信息(Wikipedia hyperlinks), 构建语义关系网络.最终基于马尔科夫模型获得用户到达每个待推荐对象的概率, 产生推荐结果.文献[42-43]通过类似的方法构建语义网络, 实现了音乐和名胜古迹的跨域推荐.此外, Benjamin Heitmann等人[44]利用由DBpedia构建的知识图谱来连接不同的领域, 设计出一种即使在目标领域没有用户行为数据也能提供推荐服务的跨域推荐算法SemStim.
4 领域间用户部分重叠的跨域推荐方法文献[45]中提到不同领域中的用户集合完全重叠和完全不重叠是两种比较极端的情况, 现实生活中领域间的用户集合更多的是存在部分重叠.关于这一点, 其实不难理解.因为现在很多网站都会提供其他账号登录的入口, 从这一角度出发, 就能够找到不同领域中的同一用户.此外文中通过实验证明了重叠的这一小部分用户其实在每个领域中都和超过80%的项目都有过交互行为.利用这部分信息作为领域间信息共享和迁移的桥梁是可靠且有效的.
4.1 基于协同过滤关系的跨域推荐Berkovsky等人[11]提出一种启发式跨领域推荐算法:首先利用源领域中的用户评分矩阵计算出用户的
Jiang等人[45]提出一种半监督的基于联合矩阵分解的迁移学习方法, 该模型认为在源领域中兴趣偏好相似的用户在目标领域中的兴趣偏好也应当相似.最终矩阵分解的最小化目标函数为:
$\begin{align} L=&\sum\nolimits_{ij}W^{(s)}_{i, j}(R^{(s)}_{i, j}- U_{i}^{(s){\mathrm T}}V_j^{(s)})^2+ \lambda\sum\nolimits_{i, j}W^{(t)}_{i, j}(R^{(t)}_{i, j}-U_i^{(t){\mathrm T}}V_j^{ ({t})})^2\notag\\ &+ \sum\nolimits_{i, j}W^{(s, t)}_{i_1, j_1}W^{(s, t)}_{i_2, j_2}(A^{(s)}_{i_1, i_2} -A^{(t)}_{j_1, j_2})^2. \end{align}$ | (7) |
其中,
$\begin{align} A^{(s)}_{i_1, i_2}=U^{(s){\mathrm T}}_{i_1}U_{i_2}^{(s)}, A^{({t})}_{j_1, j_2}=V_{j_1}^{(t){\mathrm T}}V_{j_2}^{(t)}. \end{align}$ | (8) |
上述的几种方法对于领域间的用户集合的交集大小十分敏感.交集越大, 对目标领域推荐性能的改善越大; 反之, 交集越小, 对目标领域推荐性能的提升越不明显.然而, 实际应用中, 能够直接被观测到的领域间的用户交集是很小的, 大部分的用户关系被隐藏起来.为了充分利用领域间潜藏的用户、项目关系, 一些工作[48-49]基于共同的用户将两个领域连接成一个连通的图, 采用随机游走算法挖掘和利用领域间潜藏的关系进行迁移学习, 并取得了很好的推荐效果.
4.2 基于深度学习的跨域推荐迄今为止, 深度学习在跨域推荐系统中的应用不是很广泛.通常是被用于模型训练的某一过程.例如, 用神经网络模型自动的找出最优的领域权重因子[17], 减少人工设置权重参数的代价; 或者基于语言模型训练用户、项目特征向量[50]:将用户和项目的交互历史记录视为语言模型中的一个句子, 项目为语言模型的单词.利用word2vec工具训练出源领域和目标领域中用户特征向量, 并以领域间重叠的用户为桥梁, 通过训练一个知识转移矩阵, 将源领域中的用户特征信息迁移进目标领域中.
5 各种跨域推荐技术的总结和对比前面介绍了各种跨域推荐技术, 针对不同的推荐场景需要采用不同的用户行为预测模型.不同的跨域推荐模型各自的优缺点不尽相同, 具体的比较如表 1所示.概括来说, 基于协同过滤关系的跨域推荐算法在3种推荐场景下, 都能取得较高的推荐质量.尤其是将用户、项目的隐语义特征向量作为共享和迁移对象的方案, 框架灵活, 效果显著.基于语义关系的跨域推荐算法, 是解决领域间数据异构问题的上策.而基于深度学习的跨域推荐模型相对较少, 现处于初步研究阶段, 还有很多值得探索的方向, 存在很大的进步空间.
![]() |
表 1 跨域推荐各模型的优点和缺点 Tab.1 Advantages and disadvantages of different methods in cross-domain recommendation |
Network Embedding技术是数据挖掘和机器学习领域中一项很重要的工作.其核心思想是将大规模的网络降维到低维空间表示, 即用低维空间中的向量来表示网络中每个节点的特征, 如与其它节点的相互关系、在网络中的重要程度等.从而能够基于每一个节点的特征向量来更高效、更精确地完成诸如分类(classification)、连接预测(link prediction)以及推荐(recommendation)等任务.近年来, Network Embedding领域中涌现出大量基于深度学习的模型, 并在解决上述3种任务上取得了很好的效果.譬如, 基于随机游走和神经网络来学习网络非线性结构的DeepWalk模型[51]和Node2vec模型[52]; 譬如, 基于节点的first-order proximity和second-order proximity获取网络局部结构和全局结构的SDNE模型[53]和LINE模型[54], 甚至有基于节点的k-step proximity的GraRep模型[55]; 譬如, 融合标签[56]和领域专家知识给出的节点间的相似度[57], 对DeepWalk结果进行修正的.其实, Network Embedding技术与推荐系统的中的隐语义模型本质上是相同的, 都是以特征向量来表征实体(节点、用户和项目)特征. 3种跨域推荐场景下, 都能够轻松地构造出一个连接两个领域的网络图.因此, 我们认为如何有效地将Network Embedding领域中基于深度学习的技术应用于跨域推荐是个值得研究方向.
6 跨领域推荐算法的评测与分析本节介绍评价和分析跨领域推荐算法性能的方法.主要从实验方法、评测指标、数据集以及影响因素分析4个方面来阐述.
6.1 性能评测指标与方法与传统的单领域推荐相似, 评测跨领域推荐算法性能的指标有:准确度、覆盖度、多样性、新颖度、惊喜度和用户满意度等[58].从表 2中可以看出, 对于跨域推荐算法性能评价集中在准确度这一指标上, 没有相关工作从覆盖率、多样性以及与用户体验相关的指标来分析跨域推荐算法的性能.获得上述指标的实验方法主要有3种[59]:离线实验(offline experiment)、在线实验(online experiment)和用户调查(user study).
![]() |
表 2 跨领域推荐算法性能评测指标 Tab.2 Summary of metrics used for the evaluation of cross-domain recommendation |
离线实验是将处理好的数据集按照一定规则划分为训练数据集和测试数据集.并在训练数据集上训练用户兴趣模型, 在测试数据集上进行预测.整个实验过程都是在预先准备的数据集上完成, 不需要真实用户参加, 能够快速测试大量不同的算法.但离线实验无法获得很多商业上关注的指标, 如转化率、点击率, 且其指标和商业指标存在一定的差距.因此, 离线实验通常被用来批量验证多个推荐模型的性能优劣.对于离线实验来说, 最重要的就是模拟出真实的在线推荐场景.但现有的公开数据集中, 没有适用于跨域推荐的数据集.究其原因是无法获取不同公开数据集间用户重叠的情况.为了模拟出真实的跨域推荐场景, 通常是将某一公共数据集根据需求划分成一个个子集.当然, 对于模拟领域间用户不存在交集的推荐场景, 就不会有这一问题.
由于离线测试的指标和实际的商业指标存在差距, 所以如果要准确地评测一个算法, 最好的方法是直接上线进行测试.但在对用户满意度没有把握的情况下, 直接上线测试有一定的风险性.为了降低风险, 企业会在上线测试之前做用户调查.即安排一些用户在测试系统上行完成一些任务或回答一些问题, 并据此分析推荐系统的性能.这样就能在降低在线实验风险的同时发现体现用户感受的指标.但招募被测试者代价高.
最具代表性的在线实验的AB测试, 通过一定的策略将用户随机分成几组, 并对不同组的用户采用不同的算法, 然后通过统计不同的测评指标比较不同的算法.其优点是能够公平的获得不同算法包括商业指标在内的实际在线性能指标, 但周期长.
6.2 影响因素分析跨领域推荐算法的性能主要受3方面的因素影响:源领域的信息密集程度、目标领域的信息密集程度以及领域间的相关性.因此, 在分析跨域推荐算法的性能的影响因素时, 往往会从这3个方面着手.
源领域的信息密集性一定程度上影响了被共享或迁移进目标领域的用户偏好信息及项目特征信息的准确性.若源领域本身所包含的信息不足以训练出准确的用户、项目模型, 那便会成为训练目标领域推荐模型的噪声信息, 起到适得其反的作用.但是仅有少量的工作对这一因素进行详尽的分析.文献[8, 13, 32-33, 60]通过改变的源领域评分数据集的大小, 观测这一因素对模型性能的影响; 文献[34]通过改变组成源领域中领域的数量, 分析源领域数据信息量对推荐性能的影响.
然而, 也有一些工作对于目标领域信息密集性的进行了系统的分析.例如, 设定不同的大小的评分数据矩阵 [1, 8, 10-11, 17, 32-33], 设定不同大小用户项目标签数量[28, 60]来分析目标领域信息密集程度对跨域推荐性能的影响.
相对而言, 大部分跨领域推荐算法的研究工作, 集中在领域间相关性对推荐性能的影响上.而领域间相关性可以从领域间用户交集、项目交集以及用户、项目的属性交集等方面来体现, 交集越大, 相关性越高.文献[3, 45-46]通过改变领域间用户交集的大小来观测性能变化; 文献[3]研究领域间项目的重合程度对于推荐性能的影响; 文献[28]从标签重合角度对这一因素进行分析.此外, 还有一些工作[9, 46-47]通过设置不同的源领域和目标领域, 来观测领域间的相关性对目标领域推荐性能的影响.
7 总结和展望目前, 推荐的应用的场景越来越多, 如Yahoo的个性化广告显示, Google的网页排名, OK Cupid的在线约会等.显而易见, 推荐系统已经成为计算广告、信息检索和社交网络分析等众多领域的核心技术之一.而近5年, 国内的很多互联网公司先后成立了独立研发团队来研究跨领域推荐技术在工业上的运用.如百度的“跨领域推荐”的搜索技术, 腾讯的基于腾讯云的搜索引擎等.本文对跨领域推荐算法进行了系统地研究和分析, 概述了跨领域推荐算法的相关概念、技术难点; 对现有的跨领域推荐技术的进行了分类, 总结出各自的优点及不足; 最后对跨领域推荐算法的性能分析方法进行了详尽的介绍.
随着互联网、云计算、人工智能等领域的发展, 跨领域推荐算法也面临了一些新的研究问题, 这些问题也是未来的研究热点.
[1] | LI B, YANG Q, XUE X. Can movies and books collaborate? Cross-domain collaborative filtering for sparsity reduction.[C]//Proceedings of the International Joint Conference on Artificial Intelligence.USA:DBLP, 2009:2052-2057. |
[2] | CANTADOR I, FERNáNDEZ-TOBíAS I, BERKOVSKY S, et al. Cross-Domain Recommender Systems[M]//Recommender Systems Handbook. US:Springer, 2015:919-959. |
[3] | ZHAO L, XIANG E W, XIANG E W, et al. Active transfer learning for cross-system recommendation[C]//Twenty-Seventh AAAI Conference on Artificial Intelligence. USA:AAAI Press, 2013:1205-1211. |
[4] | PAN W, XIANG E W, YANG Q. Transfer learning in collaborative filtering with uncertain ratings[C]//TwentySixth AAAI Conference on Artificial Intelligence. USA:AAAI Press, 2012:662-668. |
[5] | LI B. Cross-domain collaborative filtering:A brief survey[C]//IEEE, International Conference on TOOLS with Artificial Intelligence.[S.l.]:IEEE Computer Society, 2011:1085-1086. |
[6] | 罗浩. 基于跨域信息推荐的算法研究[D]. 北京: 北京邮电大学, 2014. http://cdmd.cnki.com.cn/Article/CDMD-10013-1015524720.htm |
[7] | FERNÁNDEZ-TOB ÍAS I, CANTADOR I, KAMINSKAS M, et al. Cross-domain recommender systems:A survey of the State of the Art[C]//Proc 2nd Spanish Conf Inf Retrieval.[S.l.]:[S.n.], 2012:187-198. |
[8] | LI B, YANG Q, XUE X. Transfer learning for collaborative filtering via a rating-matrix generative model[C]//International Conference on Machine Learning, ICML 2009. Canada:DBLP, 2009:617-624. |
[9] | WINOTO P, TANG T. If you like the Devil Wears Prada the book, will you also enjoy the Dvil Wears Prada the movie? A study of cross-domain recommendations[J]. New Generation Computing, 2008, 26(3): 209-225. DOI:10.1007/s00354-008-0041-0 |
[10] | BERKOVSKY S, KUFLIK T, RICCI F. Mediation of user models for enhanced personalization in recommender systems[J]. User Modeling and User-Adapted Interaction, 2008, 18(3): 245-286. DOI:10.1007/s11257-007-9042-9 |
[11] | BERKOVSKY S, KUFLIK T, RICCI F. Cross-domain mediation in collaborative filtering[C]//User Modeling 2007, International Conference. Greece:DBLP, 2007:355-359. |
[12] | SINGH, AJIT P, GORDON, et al. Relational learning via collective matrix factorization[J]. Relational Learning via Collective Matrix Factorization, 2008: 650-658. |
[13] | PAN W, YANG Q. Transfer learning in heterogeneous collaborative filtering domains[J]. Artificial Intelligence, 2013, 197(4): 39-55. |
[14] | XIN X, LIU Z, LIN C Y, et al. Cross-domain collaborative filtering with review text[C]//International Conference on Artificial Intelligence. USA:AAAI Press, 2015:1827-1833. |
[15] | WEI C, HSU W, LEE M L. A unified framework for recommendations based on quaternary semantic analysis[C]//International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM, 2011:1023-1032. |
[16] | ARORA A, TANEJA V, PARASHAR S, et al. Cross-domain based event recommendation using tensor factorization[J]. Open Computer Science, 2016, 6(1): 32-37. |
[17] | HU L, CAO J, XU G, et al. Personalized recommendation via cross-domain triadic factorization[J]. Proc 22nd Int World Wide Web Conf, 2014: 595-606. |
[18] | ZHOU G, HE Z, ZHANG Y, et al. Canonical polyadic decomposition:From 3-way to N-way[C]//Eighth International Conference on Computational Intelligence and Security.[S.l.]:IEEE, 2012:391-395. |
[19] | SCHMITZ S K, HASSELBACH P P, EBISCH B, et al. Application of parallel factor analysis (PARAFAC) to electrophysiological data[J]. Front Neuroinform, 2014(8): 84 |
[20] | KIERS H A L. An alternating least squares algorithm for PARAFAC2 and three-way DEDICOM[J]. Computational Statistics & Data Analysis, 1993, 16(1): 103-118. |
[21] | SONG T, PENG Z, WANG S, et al. Review-based cross-domain recommendation through joint tensor factorization[C]//Database Systems for Advanced Applications.[S.l.]:DASFAA, 2017:525-540. |
[22] | LI H, LIN R, HONG R, et al. Generative models for mining latent aspects and their ratings from short reviews[C]//2015 IEEE International Conference on Data Mining. USA:IEEE, 2015:241-250. |
[23] | JIANG M, CUI P, CHEN X, et al. Social recommendation with cross-domain transferable knowledge[J]. IEEE Transactions on Knowledge & Data Engineering, 2015, 27(11): 3084-3097. |
[24] | YANG D, HE J, QIN H, et al. A graph-based recommendation across heterogeneous domains[J]. 2016:1075-1080. |
[25] | ZHANG J, YU P S. Multiple anonymized social networks alignment[C]//IEEE International Conference on Data Mining.[S.l.]:IEEE Computer Society, 2015:599-608. |
[26] | KOUTRA D, TONG H, LUBENSKY D. BIG-ALIGN:Fast bipartite graph alignment[C]//IEEE International Conference on Data Mining.[S.l.]:IEEE, 2013:389-398. |
[27] | LI C Y, LIN S D. Matching Users and Items Across Domains to Improve the Recommendation Quality[M]. New York: ACM, 2014: 801-810. |
[28] | SHI Y, LARSON M, HANJALIC A. Tags as bridges between domains:Improving recommendation with taginduced cross-domain collaborative filtering[C]//User Modeling, Adaption and Personalization, International Conference. USA:DBLP, 2011:305-316. |
[29] | SALAKHUTDINOV R, MNIH A. Probabilistic matrix factorization[C]//International Conference on Neural Information Processing Systems. USA:Curran Associates, 2007:1257-1264. |
[30] | DING C, LI T, PENG W, et al. Orthogonal nonnegative matrix t-factorizations for clustering[J]. Proc 12th ACM SIGKDD, 2006: 126-135. |
[31] | CHEN W, HSU W, LEE M L. Making recommendations from multiple domains[C]//ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. USA:ACM, 2013:892-900. |
[32] | REN S, GAO S, LIAO J, et al. Improving cross-domain recommendation through probabilistic cluster-level latent factor model[C]//Twenty-Ninth AAAI Conference on Artificial Intelligence. USA:AAAI Press, 2015:4200-4201. |
[33] | GAO S, LUO H, CHEN D, et al. Cross-domain recommendation via cluster-level latent factor model[C]//Proceedings, Part Ⅱ, of the European Conference on Machine Learning and Knowledge Discovery in Databases. New York:Springer-Verlag, 2013:161-176. |
[34] | MORENO O, SHAPIRA B, ROKACH L, et al. TALMUD:transfer learning for multiple domains[C]//ACM International Conference on Information and Knowledge Management. New York:ACM, 2012:425-434. |
[35] | CHUNG R, SUNDARAM D, SRINIVASAN A. Integrated personal recommender systems[C]//International Conference on Electronic Commerce:the Wireless World of Electronic Commerce. USA:DBLP, 2007:65-74. |
[36] | SZOMSZOR M, ALANI H, CANTADOR I, et al. Semantic Modelling of User Interests Based on CrossFolksonomy Analysis[M]. Germany: Springer Berlin Heidelberg, 2008: 632-648. |
[37] | ABEL F, HERDER E, HOUBEN G J, et al. Cross-system user modeling and personalization on the social web[J]. User Modeling and User-Adapted Interaction, 2013, 23(2-3): 169-209. DOI:10.1007/s11257-012-9131-2 |
[38] | FERNÁNDEZ-TOBíAS I, CANTADOR I, PLAZA L. An emotion dimensional model based on social tags:Crossing folksonomies and enhancing recommendations[J]. Lecture Notes in Business Information Processing, 2013, 152: 88-100. DOI:10.1007/978-3-642-39878-0 |
[39] | BLEI D M, NG A Y, JORDAN M I. Latent dirichlet allocation[M]. J Mach Learn Res, 2003: 993-1022. |
[40] | KUMAR A, KUMAR N, HUSSAIN M, et al. Semantic clustering-based cross-domain recommendation[C]//Computational Intelligence and Data Mining.[S.l.]:IEEE, 2014:137-141. |
[41] | LOIZOU A. How to recommend music to film buffs:Enabling the provision of recommendations from multiple domains[J]. University of Southampton, 2009 |
[42] | KAMINSKAS M, RICCI F. A generic semantic-based framework for cross-domain recommendation[C]//International Workshop on Information Heterogeneity and Fusion in Recommender Systems. New York:ACM, 2011:25-32. |
[43] | KAMINSKAS M, FERNÁNDEZ-TOB ÍAS I, CANTADOR I, et al. Ontology-Based Identification of Music for Places[M]//Information and Communication Technologies in Tourism. Germany:Springer Berlin Heidelberg, 2013:436-447. |
[44] | HEITMANN B, HAYES C. SemStim at the LOD-RecSys 2014 Challenge[M]//Semantic Web Evaluation Challenge. Germany:Springer International Publishing, 2014:170-175. |
[45] | JIANG M, CUI P, YUAN N J, et al. Little is much:bridging cross-platform behaviors through overlapped crowds[C]//Thirtieth AAAI Conference on Artificial Intelligence. USA:AAAI Press, 2016:13-19. |
[46] | SHAPIRA B, ROKACH L, FREILIKHMAN S. Facebook single and cross domain data for recommendation systems[J]. User Modeling and User-Adapted Interaction, 2013, 23(2/3): 211-247. |
[47] | TIROSHI A, KUFLIK T. Domain Ranking for Cross Domain Collaborative Filtering[M]//User Modeling, Adaptation, and Personalization. Germany:Springer Berlin Heidelberg, 2012:328-333. |
[48] | NAKATSUJI M, FUJIWARA Y, TANAKA A, et al. Recommendations over domain specific user graphs[C]//European Conference on Artificial Intelligence. USA:DBLP, 2010:607-612. |
[49] | TIROSHI A, BERKOVSKY S, KAAFAR M A, et al. Cross social networks interests predictions based ongraph features[C]//ACM Conference on Recommender Systems. New York:ACM, 2013:319-322. |
[50] | KRISHNAMURTHY B, PURI N, GOEL R. Learning vector-space representations of items for recommendations using word embedding models[J]. Procedia Computer Science, 2016, 80: 2205-2210. DOI:10.1016/j.procs.2016.05.380 |
[51] | PEROZZI B, ALRFOU R, SKIENA S. Deepwalk:Online learning of social representations[C]//The 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, New York:ACM, 2014:701-710. |
[52] | GROVER A, LESKOVEC J. node2vec:Scalable feature learning for networks[C]//ACM SIGKDD International Conference. New York:ACM, 2016:855-864. |
[53] | WANG D, CUI P, ZHU W. Structural deep network embedding[C]//ACM SIGKDD International Conference. New York:ACM, 2016:1225-1234. |
[54] | TANG J, QU M, WANG M, et al. LINE:Large-scale information network embedding[C]//Proceedings of the 24th International Conference on World Wide Web.[S.l.]:International World Wide Web Conference Committee, 2015:1067-1077. |
[55] | CAO S, LU W, XU Q. GraRep:Learning graph representations with global structural information[C]//Proceedings of the 24th ACM International Conference on Information and Knowledge Management. New York:ACM, 2015:891-900. |
[56] | LI C, WANG S, YANG D, et al. PPNE:Property Preserving Network Embedding[C]//Database Systems for Advanced Applications, 22nd International Conference.[S.l.]:DASFAA, 2017:163-179. |
[57] | LI C, LI Z, WANG S, et al. Semi-supervised network embedding[C]//Database Systems for Advanced Applications, 22nd International Conference.[S.l.]:DASFAA, 2017:131-147. |
[58] | 项亮. 推荐系统实践[M]. 北京: 人民邮电出版社, 2012. |
[59] | SHANI G, GUNAWARDANA A. Evaluating Recommendation Systems[M]//Recommender Systems Handbook, 2011:257-297. |
[60] | SAHEBI S, BRUSILOVSKY P. Cross-Domain Collaborative Recommendation in a Cold-Start Context: The Impact of User Profile Size on the Quality of Recommendation, 2013: 289-295. |