您好,欢迎来到华佗小知识。
搜索
您的当前位置:首页基于协同过滤的推荐系统算法研究

基于协同过滤的推荐系统算法研究

来源:华佗小知识
基于协同过滤的推荐系统算法研究 刘景昊 华中科技大学文华学院湖北武汉430074 【摘要】在网络购物日益风靡的今天,怎样提供优质的个性化服务是当今电子商务系统的核心内容,而协同过滤推荐则是当今发展最成熟且最成 功的推荐系统。本文将全方位介绍协同过滤推荐的内容、研究成果以及协同过滤算法中出现的问题,并提出协同过滤算法进一步发展的方向。 【关键词】协同过滤推荐系统发展方向 中图分类号:TP301.6文献标识码:A文章编号:1009—4067(2013)06—157一O1 1、引言 随着网络技术的发展,人们正处于一个信息爆炸的时代。协同推荐 系统(或协同过滤系统)尝试基于其他用户的过往使用情况来预测某个 且 ・歹表示在向量 与歹之间的所有点所对应的产品。还有其他的 处理方法就是通过度量用户群之间的平均方差值来计算相似度。不同的推 荐系统有不同的方法来提升在用户相似度计算以及评级估算的有效陛。一 产品对于某个特定的用户的效用。大部分通俗的做法,都是某个产品 对于某个用户C的效用U(c , )的评价标准都是基于产品 对 其他一些“类似”用户C的用户C 的效用u(cj, ),如在一个电影推 荐程序中,为了给用户C推荐电影,协同推荐系统首先尝试找出用户C 的同类群,也就是其他有类似欣赏风格的用户,然后,把只有最相近于 用户c的同类群的电影才会被推荐。 被认为最早的推荐系统是Grundy系统 。接下来的Tapestry系统依 靠每名用户的用户手册辨认志趣相投用户。Group Lens ,Video Recommender ’和Ringo 是最早使用协同过滤算法来进行自动预测 的,其它协同系统包括Amazon.tom的书籍推荐,帮助人们在万维网上 搜索相关信息的Phoaks以及推荐笑话的Jester。 2、算法介绍 协同过滤算法可以分为两大类:以记忆行为为基础与以模型为基 础。基于记忆行为的算法 ,其 本质上是基于用户先前相关条目的完 整集合作一个关联度的预测。对于用户c已经产品 的未知关联度数 值 , 是其他用户对于同一样产品 的关联度的总和。 ,c=aggr, , (1) 。 c EC 表示集合N是对于关联性产品 与用户c有最大相似性的用户 群。下面是一些计算公式的例子: ∞ -古∑ c ,C ^∑一 Ⅵ. , (2) 【c】 ‘+ ∑ ( ) ( lr 乘数k在这里是提供一个常数项,通常是用公式:k=l/∑  ̄sim(c,c’) 表示。而对于用户c的平均关联度,在(10c)中是定义为: =(1 I)∑ whereS。=( ∈ ≠ ).(3) 在这种情况中是用与平均值的相差量的权重总和来代替那些完全 不变的评级。另一种克服使用不同评级量表的方法是:调整基于优先偏 好的过滤,也就是专注于推荐用户相关优先来替代绝对等级值。 3、相似度计算 在协同推荐系统中,有很多方法被用来计算用户之间的相似度。在 协同推荐系统中,S 通常作为是计算用户 的“近邻”的中间结果, 以及用一种直接的方式来进行计算,例如作为计算集合 和集合 的 交叉数据。然而,对于某种计算方法,如把graph—theoretic(图论)用 于协同过滤可以在无需计算所有Y用户的 的情况得到关于 的近 邻值。在基于相关性的方法中,Pearson相关性的有效程度通常被用来 衡量他们之间的相似度 : ∑(‘. 一 )( ,,一弓) ira( ¨:—: ’…: :: ::一(4) .Y ‘ /∑(‘ 一 ) ∑(¨  一弓) 在基于余弦值计算的方法中,用户群 与 被看作是在m维空间 中的两个向量。而对于这两个向量的相似度,就可以通过计算它们之间 的斜率的余弦值来得到: ∑‘. 咖 卜 置刃 彦 个很普遍的策略就是预先(因为网络群体通常不会在短时间内发生剧烈改 变)计算所有用户的总体相似度sim(x,Y)(包括计算 ),然后再分别重 新计算每个用户的相似度。因此,无论用户何时对系统发出请求,它的评 级都能通过实时按需计算而有效的得到。一种不同的方法被采用,目的是 来改善已经存在的协同过滤算法的性能,在这个方法中用户组评级的输入 是被精心挑选的,使用的技术包括排除噪音、冗余度还有就是利用了评级 数据的稀疏陛。此外,在其中的最新发展中,提出了一种协同过滤的概率 方法,即把基于记忆与基于模型的技术结合起来的方法。 4、存在问题 1新用户问题。这是和基于内容的推荐系统共同存在的问题。为了 做精确的推荐,系统首先必须从用户给出的评级了解用户的偏好。几种 技术已经被提出来了去解决这个问题。其中的大部分都使用混合推荐方 法即把基于内容和协同的技术结合起来。另一种方法被描述,为了决定 给新用户推荐最好的项目而探讨了各种不同的技术。这些技术使用基于 项目流行度、项目信息熵、用户个性化的策略,并且组合了上述方法。 2新项目问题。新项目被频繁地增加到推荐系统中。协作系统单纯 地依靠用户的偏好去做推荐。因此,直到新的项目被大量的用户评级后 推荐系统才能推荐它。这个问题也能通过使用混合推荐方法被解决。 3稀疏性。在任何推荐系统中,已经获得的评级数目通常相比于需 要预测的评级数目是很小的。从较小数量的事例中获得有效的等级预测 是很重要的。协同推荐系统的成功还要依赖足够数量用户的可得性。一 种克服评级稀疏性问题的方法就是使用用户文件信息去计算用户的相 似度。也就是说,二个用户可以被认为相似,不仅只是当他们把电影评 定成了相同的等级时,还有就是当他们属于相同的人群结构段时也可以 被认为相似。这种传统的协同过滤拓展有时被称为“人口过滤”。另一 种方法也利用了已经在中提过的用户之间的相似度,这里稀疏性问题通 过运用关联检索框架和相关的激活扩算算法来解决,目的是通过他们过 去的交易和反馈来探索消费者中的可传递的协会。一个不同的处理稀疏 评级矩阵的方法被用在中,这里一个降维技术一奇异值分解被用来降低 稀疏评级矩阵的维数。 5、总结与展望 本文介绍了协同过滤推荐算法的主要思想及算法需要解决的主要 问题,总结了近期本领域内的研究进展。我们从以下几方面对算法的发 展方向进行研究:考虑在保证推荐准确性的同时增加推荐的多样性;使 特殊喜好的用户得到推荐需要考虑用户对系统的实时反馈,更好的利用 反馈数据强化推荐算法;考虑时间,空间,任务等因素,来更好的完成 推荐。 参考文献 [1]E.Rich, “User Modeling via Stereotypes,”Cognitive Science,VO1.3,no.4,PP.329—354,1979. [2】J.A.Konstan,B.N.Mi 1 let,D.Ma1tz,J.L.Herlocker,L.R.Gordon, and J.Ried1.“GroupLens:Applying Collaboratire Filtering to Usenet News,”Comm.ACivl,vo1.40,no.3,PP.77—87,1997. [33w.Hi11,L.Stead,M.Rosenstein,and G.Furnas,“Recormending and Evaluating Choices in a Vi rtuaI Community of Use,”Proc.Conf.Human Factors in Computing Systems,1995. 作者简介 刘景昊(1 991-),男,内蒙集宁人,华中科技大学文华学院通信工 程专业,研究方向:现代通信网络. 2013・06 中国电子商务..157 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo0.cn 版权所有 湘ICP备2023017654号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务