首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 19 毫秒
1.
《微型机与应用》2016,(17):17-19
协同过滤推荐算法是推荐系统研究的热点,近年来,在亚马逊、淘宝等商业系统中获得应用。在实际应用过程中,协同过滤推荐面临数据稀疏和准确性低的问题。作为推荐基础的用户-产品(项目)矩阵通常非常稀疏(存在大量缺失数据),从而导致推荐结果不准确。文章试图在缺失数据情况下提高协同过滤推荐的准确性,聚焦以下两个方面:(1)用户相似度、产品(项目)相似度计算;(2)缺失数据预测。首先,用增强的皮尔森相关系数算法,通过增加参数,对相似度进行修正,提高用户、产品(项目)相似度计算的准确率。接着,提出一种同时考虑了用户和产品(项目)特征的缺失数据预测算法。算法中,对用户和产品(项目)分别设置相似度阈值,只有当用户或产品(项目)相似度达到阈值时,才进行缺失数据预测。预测过程中,同时使用用户和产品(项目)相似度信息,以提高准确度。在模型基础上,用淘宝移动客户端的数据集进行了验证,实验结果表明所提算法比其他推荐算法要优异,对数据稀疏性的鲁棒性要高。  相似文献   

2.
一种基于Rough集理论的数据过滤方法   总被引:11,自引:1,他引:10  
Routh集理论是一种处理不确定模糊知识的重要工具,在对Rough集理论进行深入研究的基础上,提出了一种基于Rough集理论的这滤算法。该处 工硒思想是基于P-确定的等价类的合并,算法直观,计算简便,理论和实验表明,该算法能够减低信息系统中信息的粒度,在保持规则近似质量不变的前提下,有效地提高规则的统计意义和预测强度。  相似文献   

3.
基于数据属性描述的数据过滤方法   总被引:1,自引:0,他引:1  
本文研究了已有的各种基于Web的信息系统数据过滤方法,评价了它们的优缺点和适用范围,并实现了一种基于数据属性描述的数据过滤新方法。通过合理配置数据过滤程序,提高数据过滤的效率。该数据过滤方法实现了数据过滤的灵活定制和软件复用,减少了开发人员的重复工作。  相似文献   

4.
一种改进的虚假数据过滤方法   总被引:1,自引:0,他引:1       下载免费PDF全文
祝青  郭赛球 《计算机工程》2012,38(5):158-160
传统的虚假数据过滤方法存在无法均衡节点开销和过滤概率低下问题。为此,提出一种改进的虚假数据过滤方法。依据网络中节点能量的不均衡性构造成簇,通过节点的负载计算和密钥分发实现虚假数据过滤。仿真实验结果表明,该方法能均衡网络中节点的开销,提高虚假数据过滤概率。  相似文献   

5.
一种有效的垃圾邮件过滤新方法   总被引:3,自引:0,他引:3  
林琛  李弼程 《计算机应用》2006,26(8):1980-1982
受到信息粒度原理的启发,给出了一种有效的垃圾邮件过滤新方法。该方法训练过程是将训练样本集合中合法邮件类和垃圾邮件类拆分成四个小类,得到四个小类的类中心向量,从粒度原理角度来看,就是采用更细的粒度来描述训练样本的先验知识。过滤过程则将新进来的邮件分别与四个小类的类中心向量进行相似度比较,最终来判定所属类别。在公共垃圾邮件语料库上测试新方法,同时与目前过滤性能较高的KNN方法进行比较,结果显示新方法具有过滤精度高,过滤速度快等优点。  相似文献   

6.
由于传统基于均方差的协同过滤算法(MSD)计算相似性时仅考虑评分向量间均方差值,导致其推荐性能不理想,针对这个问题,提出融合评分向量间余弦值和均方差值的改进均方差协同过滤算法(Improved MSD, IMSD)。通过在2个Movielens数据集上进行实验表明,IMSD算法较MSD算法的推荐准确度有所提高。更为重要的是,将IMSD算法进行推广应用,也能够取得较好的效果。本文将其应用于改进另外2种算法,即JAC_MSD和AC_MSD算法,并提出了2种相应的JAC_IMSD和AC_IMSD算法,发现算法的推荐准确度都有所提高。在所研究的几种算法中,AC_IMSD算法推荐准确度最优。  相似文献   

7.
蔡雄峰  艾丽华  丁丁 《软件》2015,(3):41-47
协同过滤算法是推荐系统中最古老的算法之一,同时也是当今推荐系统中使用最广泛的一种算法。但是在简单,效率高的同时,协同过滤算法还存在数据稀疏性,冷启动等一些问题.本文针对其数据稀疏性的问题,提出了一种根据兴趣度预测用户未评分项目的方法。最后通过基于Netflix数据集的实验结果表明,该方法能够更好的处理稀疏矩阵,能缓解数据稀疏问题,从而提高了协同过滤算法的准确性。  相似文献   

8.
傅鹤岗  彭晋 《计算机工程》2011,37(3):70-71,74
针对传统协同过滤算法普遍存在的稀疏性和扩展性问题,在传统协同过滤算法的基础上提出一种基于模范用户的协同过滤算法。通过对用户空间的聚类,自动选取模范用户聚类的最优粒度,利用模范用户产生推荐。实验结果表明,与传统协同过滤算法和其他基于聚类策略的算法相比,该算法在明显提高推荐效率的同时对推荐精度和稳定性都有所改进。  相似文献   

9.
网络技术的发展使得Web环境下的信息系统迅速增加。传统开发模式中,系统数据过滤代码不能复用、处理效率低,并且开发工作量大,影响系统开发效率。本文提出了新的数据过滤方法,把数据过滤程序与系统功能页面分离,将过滤程序文件布置到服务器端。要过滤的数据由数据过滤函数一次性进行数据过滤并反馈数据过滤结果以及提示信息。该数据过滤方法实现了信息系统数据过滤的灵活定制和软件复用,减少了开发人员的重复工作。  相似文献   

10.
针对传统协同过滤算法中评分数据稀疏性及所造成推荐质量不高的问题,提出一种巴氏系数(Bhattacharyya Coefficient)改进相似度的协同过滤算法。在基于近邻协同过滤算法基础上,首先利用Jaccard相似性来计算用户间的全局相似性;其次使用巴氏系数获得评分分布的整体规律,并结合Pearson相关系数来计算其局部相似性;最后融合全局相似性和局部相似性得到最终的相似度矩阵。实验结果表明,该算法在稀疏数据集上获得更好的推荐结果,有效地缓解了评分数据稀疏性问题,提高了推荐的准确度。  相似文献   

11.
刘团 《福建电脑》2014,(2):91-94
目前,协同过滤算法在电子商务中得到了广泛的应用。伴随着网络上客户和产品的数量剧增,推荐系统的推荐效率成为了推荐系统在电子商务中应用的一大挑战。因此,提高协同过滤算法的效率变得越来越重要。本文开发了一种基于Hadoop的协同过滤推荐算法,实现了用MapReduce分布式计算框架来提高推荐算法的效率,同时也扩大算法的可扩展性。实验表明:基于Hadoop集群的推荐算法在推荐系统的可伸缩性和效率方面都有极大的优化。  相似文献   

12.
RFID在实时识别、定位、跟踪以及物理对象监控等方面有着广泛的应用前景.为了实现上述应用的目标,RFID数据必须经过采集、过滤等处理过程.采集的原始RFID数据包括噪音数据和冗余数据,只有将这些噪音数据和冗余数据过滤后,才能应用;另外,保证正确的RFID标签数据采集顺序,对于一些应用也非常关键.针对这些问题,提出了基本噪音过滤算法和基于hashtable的有序噪音过滤算法,以及基本冗余过滤算法和基于hashtable的冗余过滤算法,并通过仿真实验验证了该方法的有效性.  相似文献   

13.
一种改进的协同过滤推荐算法   总被引:6,自引:0,他引:6  
王茜  王均波 《计算机科学》2010,37(6):226-228243
传统的协同过滤算法在寻找最近邻居集合时没有考虑时间因素的影响,仅从用户或者项目单方面出发计算用户或者项目的相似性以产生推荐结果,也忽略了用户特征对推荐的影响.针对上述问题,引入时间遗忘函数、黏度函数、用户特征向量,对协同过滤算法寻找用户的最近邻居集合过程进行了改进,体现了时间效应、用户偏好程度和用户特征.采用MovieLens数据集进行了一系列对比实验,结果表明,改进后的算法能够明显提高推荐的准确度.  相似文献   

14.
一种基于粗集的协同过滤算法   总被引:5,自引:0,他引:5  
针对协同过滤中的数据稀疏问题,提出了一种基于粗集的协同过滤算法.首先通过自动填补空缺评分降低数据稀疏性;然后采用分类近似质量计算用户闻的相似性形成最近邻居,产生推荐预测.实验结果表明,该算法有效地解决了数据稀疏问题,提高了推荐的质量.  相似文献   

15.
随着电子商务网站的快速发展,数据特征和现实需求均发生了较大变化.以大规模、多源性、异构性为主要特征的数据发挥着更加重要的作用.然而,电子商务系统中数据所具有的特性使得大多数协同过滤方法较难直接用于物品推荐.如何整合多源异构数据来实现数据的价值最大化是当前推荐系统亟待解决的问题.针对这一问题,首先分析了多源异构数据中各类数据的特点,并根据各自特点为其设计了不同的建模方式.其次,提出一种新颖的推荐模型用于评分预测任务,它通过融合多关系数据和视觉信息来缓解数据稀疏问题.最后,设计了一种高效的算法MSRA(multi-source heterogeneous information based recommendation algorithm)用于求解所提模型的参数.在多个亚马逊数据集上的实验结果表明:1)面向多源异构数据的推荐算法其性能明显优于当前主流协同过滤算法; 2)该算法不仅可以有效缓解物品的冷启动问题,而且能够更好地预测不同类型物品的实际评分.  相似文献   

16.
黄涛  黄仁  张坤 《计算机科学》2016,43(Z6):400-403
协同过滤推荐算法是电子商务推荐系统中应用最成功的推荐技术之一,而影响协同过滤推荐算法准确率的关键因素是用户相似性度量方法。针对传统相似性度量方法没有考虑共同评分项数量对推荐质量的影响,将用户之间的共同评分项数量作为相似性计算的一个重要指标,从而得到一种改进的相似性度量方法。但这仍然不能解决数据稀疏带来的推荐质量下降的问题,鉴于此,在上述改进的基础上,提出了利用复杂网络中的结构相似性来度量用户之间相似性的方法,使计算结果更具实际意义和准确性。实验表明,通过这些改进能够有效避免传统方法带来的弊端,提高系统的推荐质量。  相似文献   

17.
推荐系统在电子商务中应用广泛,协同过滤是推荐系统中应用最为成功的推荐技术之一。随着电子商务系统数据不断增加,用户-项目评分矩阵稀疏性问题日趋明显,成为推荐系统的瓶颈。本文提出基于LDA的协同过滤改进算法,提升稀疏评分矩阵下的推荐质量。首先,根据用户与项目评分矩阵,建立LDA模型,得到用户-项目概率矩阵,作为协同过滤的原始数据;然后根据属性对项目聚类,对用户-项目概率矩阵进行裁剪;最后,考虑上下文信息,在传统协同过滤相似度计算基础上,通过引入时间因子函数改进相似度计算公式。在Movie Lens数据集上的实验结果表明,本文提出模型的MAE指标优于传统协同过滤算法。  相似文献   

18.
协同过滤算法是个性化推荐中应用最成功的技术之一,计算用户间的相似性是协同过滤算法的关键。而传统的相似性度量方法在数据稀疏和小用户交集时性能严重下降,因此本文提出了一种基于改进信息熵的相似性度量方法(NWDE),充分考虑了数据稀疏环境的特点,在计算用户间的相似性时综合考虑了用户间的交集大小以及评分差异的大小,使其得分更加真实。实验结果表明,在数据稀疏和小用户交集的情况下,该算法的推荐精度比传统方案取得了显著的改善。  相似文献   

19.
采用索引技术,对输入的XML文档建立一个双索引结构来改进YFilter算法,优化XML文档过滤性能。藉助索引结构,该算法超前搜索元素结点在文档中的结构信息,预先排除不能保证得到任何匹配结果的元素结点,以避免大量不必要的查询处理。实验结果显示,当输入的XML文档较大时,该算法有较好的过滤性能。  相似文献   

20.
本文分析了JMS发布/订阅模式下传统的消息过滤机制,针对其不能快速处理大量相同或相似消息的缺陷,提出了一种改进的消息过滤算法。通过对所有订阅条件进行预处理来优化匹配结果,在此过程中并对相同或相似订阅条件属性进行处理,从而提高消息匹配效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号