大学堂论文网致力于各类论文代写、论文发表、论文修改、论文查重等论文服务!客服QQ:82274534

客服热线:14795812138
当前位置:主页 > 论文范文 > 电子商务 >

面向电子商务的协同过滤推荐系统研究与设计

来源:www.daxuelw.org  发布时间:2017-06-21  
摘 要:本文探讨了面向电子商务的协同过滤推荐系统的原型及基本架构,通过研究推荐方法、过滤算法及相似度计算设计;利用基于用户行为的关联和相关度技术,设计了一个面向电子商务的协同过滤系统。最后过讨论了一些面向电子商务的协同过滤推荐系统可能的存在的问题。
  关键词:电子商务 协同过滤 推荐系统
  中图分类号:TP393 文献标识码:A 文章编号:1007-9416(2011)03-0028-03
  
  1、引言
  随着电子商务的蓬勃发展,人们在享受由此带来的巨大便利的同时,也面临着从传统购物方式向网络虚拟购物方式转变的挑战。[1]面对众多Web商家和海量的商品,用户很难从中发现自己感兴趣的商品。个性化推荐系统正是在这样一个背景下产生的,它在电子商务中扮演着导购员的角色。个性化推荐系统的作用可以概括为:(1)将电子商务网站的浏览者转变为购买者;(2)提高电子商务网站的交叉销售能力;(3)提高客户对电子商务网站的忠诚度。正因如此,几乎所有大型的电子商务网站,如:Amazon、eBay、NetFlix和淘宝网等,都不约而同的推出了自己的推荐系统,并从中获益。
  协同过滤推荐是迄今为止最成功的个性化推荐技术,被应用到很多领域中,协同过滤最突出的优点是其决策基础是“人”而不是“内容”。关于协同过滤技术的第一个研究报告在1994年出版[3],从那以后,对协同过滤的研究和商业运用开始出现。但协同过滤推荐技术还有很多问题需要克服,目前也出现了一些新的发展趋势,本文主要针对面向电子商务网站的协同过滤推荐系统的研究和设计展开讨论。
  2、协同过滤推荐系统的基本架构
  2.1 协同过滤推荐系统原型
  协同过滤推荐(Collaborative Filtering Recommend)是基于一组喜好相同的用户进行推荐。它是基于这样的一种假设:为一用户找到他真正感兴趣的内容的最好方法是首先找到与此用户有相似喜好的其他用户,然后将他们所喜好的内容推荐给用户。[2]这与现实生活中的“口碑传播(word-of-mouth)”颇为类似。
  协同过滤推荐系统的实现通过将用户的个人喜好与特定的参考特征进行比较,并试图预测用户对一些未评分项目的喜好程度。这里的个人喜好与特定参考特征来源于对用户行为的处理和分析。在电子商务环境中,用户行为可以是购买某一商品或者是浏览某一商品页面。例如,当你在网上买衣服时,基于协同过滤的推荐会根据你的购买记录或是浏览记录,分析出你的穿衣喜好,并找到与你喜好(或品味)相似的一些用户,将他们购买或浏览的衣服推荐给你。
  基于上面的描述和分析,可将协同过滤推荐系统的原型设计如下,见图1。协同过滤推荐系统分为三层,分别为表现层、业务层和数据层。业务层主要包括用户的行为记录模块、业务逻辑处理模块和推荐引擎。
  其中用户行为记录模块主要负责用户行为的模式发现和分析。包括页面访问分析和事务识别等。[3]推荐系统的核心是Recommender,我们称之为推荐引擎,它由推荐算法和推荐界面组成,Recommender扮演着虚拟导购员的角色。而数据层需要存储用户行为、用户的评分和交易业务数据等。
  2.2 协同过滤算法及分析
  2.2.1 协同过滤的原理
  协同过滤通过将用户的行为和其他用户的行为进行比较,找到最相似的邻居,并根据与之最相似邻居的兴趣或偏好预测出该用户的兴趣或偏好,以帮助其进行决策。图2显示了协同过滤工作原理[9]。其中,User1、User2和User3都对项目A、B、C表现出兴趣,他们都购买了A、B和C。因此,可以将D和E推荐给User1,因为User1的邻居User2和User3都很喜欢D和E。
  2.2.2 协同过滤的分类和步骤
  协同过滤技术可以分为三类:(1)基于用户(User-based)的协同过滤;(2)基于项目(Item-based)的协同过滤;(3)基于模型(Model-based)的协同过滤。
  基于用户的协同过滤首先计算目标用户和其他用户之间的相似度,并从相似用户来预测到目标用户的评分矩阵。
  基于用户的协同过滤分为三个步骤:(1)收集可以代表用户感兴趣的信息。传统的系统一般使用打分的方式,例如:淘宝购物中的“买家评价”就属于这种评分方式,这通常被称为“显示评分”;(2)最近邻搜索。协同过滤的出发点是与你兴趣相同的一组用户,术语叫做“最近邻”。最近邻搜索的核心是计算两个用户的相似度。图3演示了协同过滤中邻居的一种形成过程[10];(3)生成推荐结果。最常见的推荐结果有两种,Top-N推荐和关联推荐。
  基于项目的协同过滤基于这样的假设:能够引起用户兴趣的项,必定与之前评分高的项相似。[9]与基于用户的协同过滤类似,基于项目的协同过滤也分为三个步骤:(1)得到User-Item的评分数据;(2)对Item进行相似度计算,即针对Item做最近邻搜索;③生成推荐结果。
  2.2.3 相似度计算和分析
  在协同过滤中,相似度是通过计算用户之间或项目之间的相关性分析得到的。用户和项目的相似度有三种计算方法:(1)皮尔森相关系数(Pearson Correlation Coefficient);(2)余弦相似性(Cosine-based Similarity);(3)调整余弦相似性(Adjusted Cosine Similarity)。
  皮尔逊相关系数:一种度量两个变量间相关程度的方法。它是一个介于1和 -1之间的值,其中,1 表示变量完全正相关,0 表示无关,-1 表示完全负相关:
  
  公式1:Pearson Correlation Coefficient
  余弦相似性:通过计算两个空间向量之间的夹角余弦来定义相似度。
  
  公式2:Cosine-based Similarity
  调整余弦相似性:在余弦相似性度量方法中没有考虑不同用户的评分尺度问题,调整余弦相似性度量方法通过减去用户对项目的平均评分来改善上述缺陷。
  公式3:Adjusted Cosine Similarity
  其中,U是对项目i、j共同评分的用户集合,是用户u对项目i的评分,是用户u对项目j的评分,是项目i的平均得分,是项目j的平均得分。
  3、协同过滤推荐中的关联和相关度分析
  3.1 协同过滤推荐中的关联性
  通过搜索最近邻集合,我们就可以对目标用户的兴趣进行预测,并随之产生推荐结果。其中关联规则推荐就是一种重要形式。
  一个关联规则(Association Rule)是一个如下形式的蕴涵关系:[2]
  其中是一个关联事务集合,sup为关联规则的支持度,conf为关联规则的置信度。

TAG标签:

联系方式

客服QQ:82274534
客服QQ:84468591
热线客服 :15012858052