首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
本文先将原始Web日志进行预处理,即时Web日志进行数据清洗,用户识别,会话识别和格式转换等.再用蚁群聚类算法对预处理后的日志进行聚类分析,提取具有代表性的用户访问模式,最后用协同过滤推荐技术向网站访问者进行推荐,提供个性化服务,从而实现网站的个性化推荐.  相似文献   

2.
基于用户访问树的Web日志挖掘数据预处理   总被引:1,自引:0,他引:1  
刘加伶  范军 《计算机科学》2009,36(9):154-156
在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果.提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以在缺乏网站拓扑结构的情况下准确地对Web日志进行预处理.  相似文献   

3.
Web日志挖掘是将数据挖掘技术应用到Web服务器的日志中,发现Web用户的行为模式,以便进一步改善网站结构或为用户提供个性化的服务。文中探讨了Web日志挖掘中的用户识别算法,提出了一种多重约束条件的用户识别算法。  相似文献   

4.
介绍Web日志挖掘的预处理过程,其中包括数据清理、站点拓扑识别、用户识别、会话识别、页面过滤和路径补充。针对无引用域记录日志的路径补充问题,提出并实现一种基于网站拓扑图的路径补充算法。讨论一种综合多重评价因素的用户相似度计算方法,并将其应用于Web用户聚类操作。使用Davies-Bouldin指标衡量聚类的效果并给出实验结果。  相似文献   

5.
数据预处理在Web日志挖掘过程中起着至关重要的作用。本文详细分析了数据预处理的过程,并对用户识别提出了改进策略,最后实现了一个Web日志挖掘预处理模型(WLMPM)。  相似文献   

6.
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础和实施有效挖掘算法的前提,在Web日志挖掘中起着重要的作用,也是工作量较大的一部分。数据预处理的基本技术,包括数据清理、数据集成和转换、数据归约等。本文介绍了数据预处理中涉及到的数据清理、用户识别、会话识别、路径补充、事务识别等过程,并提出了一种路径补充算法。  相似文献   

7.
研究基于访问日志挖掘的高校综合信息门户页面推荐。从高校综合信息门户服务器日志中获取用户日志数据,对日志数据中的“脏”数据进行预处理,通过改进的K-means聚类算法将用户浏览兴趣度数据集划分为多个具有相近兴趣度的用户集合,凭此为用户提供个性化的页面推荐。实验结果表明,在高校综合信息门户页面推荐方面具有不错的效果。  相似文献   

8.
提出了一种基于服务器日志挖掘的电力业务系统功能推荐服务,首先从电力业务系统服务器日志中获取用户日志数据,然后对含有"脏"数据的用户日志数据进行预处理,以适应数据挖掘与处理;接着由待处理的数据计算用户访问兴趣度,并基于改进的K均值聚类算法将用户访问兴趣度数据集划分为多个具有相近兴趣度的用户集合,最终为用户提供功能个性化推荐服务.实验结果证明该方法在实现电力业务系统信息推荐方面具有较好的效果.  相似文献   

9.
Web日志挖掘的数据预处理研究   总被引:7,自引:0,他引:7  
分析了Web日志挖掘的数据预处理过程,提出了基于日志引用页的用户识别算法,并对其性能进行分析,最后给出了应用实例。  相似文献   

10.
在web日志挖掘中,数据预处理技术是各项工作的基础,此项内容将直接影响到后面的各个阶段,因此,也就显得至关重要.在已有的预处理方法基础上,选用了一种建立用户访问树的方法对用户进行识别,并且可以在缺乏网站拓扑结构的情况下对日志进行处理.提出了一种改进的事务处理方法,这可以在不额外增加步骤的基础上,能直接去除无用的事务,从而减少预处理结果对数据挖掘的影响,使得到的事务能更好地应用到模式分析当中,大大增强了后期挖掘的正确性.  相似文献   

11.
推荐技术在各个领域得到了广泛的应用,其中协同过滤推荐算法显得尤为突出。从基本概念、工作流程以及评估指标等方面介绍了传统的协同过滤推荐算法,对此类算法存在的数据稀疏性、冷启动、扩展性问题进行了分析,并分类详细归纳了这些问题的研究现状和解决方案;最后提出了协同过滤推荐算法在融合大数据技术、社会网络分析技术以及关键用户分析技术三方面的研究热点。  相似文献   

12.
开源软件生态系统的快速发展,为软件开发提供了一种新的模式,对开源软件推荐系统的研究已经成为当前一个重要的研究领域。已有的软件工程推荐系统大都利用协同过滤、机器学习以及开发者-项目属性匹配的方法进行推荐,而利用网络结构和网络分析技术进行推荐的研究相对较少。以软件生态系统GNOME为研究对象,构建开发者-项目二分网络,利用二分网络链路预测技术,采用一种基于内部边的方法对开发者进行项目推荐,并与协同过滤方法进行了对比。实验结果表明基于内部边的推荐方法比协同过滤方法更好。  相似文献   

13.
结合音乐这一特定的推荐对象,针对传统单一的推荐算法不能有效解决音乐推荐中的准确度问题,提出一种协同过滤技术和标签相结合的音乐推荐算法。该算法先通过协同过滤技术确定相似用户,再通过相似用户对某一歌手的标签评分预测另一用户对该歌手的偏好程度,从而选择更符合用户喜好的音乐进行推荐,以此提升个性化推荐效率,为优化音乐推荐系统提供参考方法。  相似文献   

14.
协同过滤算法是目前在电商系统中应用最广的推荐技术.为了缓解传统基于用户的协同过滤算法在冷启动、推荐准确性和数据稀疏性方面的缺点,本文提出基于用户特征的协同过滤推荐算法.此算法利用注册信息提取属性特征,并对已有的评分信息提取兴趣特征和信任度,综合以上各特征融合特征相似性进一步产生推荐.实验结果表明,与传统的基于用户的协同过滤算法做对比,基于用户特征的协同过滤算法对推荐的精度有大幅的提高.  相似文献   

15.
协同过滤算法近年来在电子商务推荐系统中得到了广泛的应用,但该算法也存在数据稀疏性和缺乏个性化等问题,这些问题影响了推荐算法的效率和准确性。主要针对以上问题,提出引入Web日志分析的协同过滤算法,将用户对商品的隐性兴趣转化为显性兴趣,同时利用用户聚类等相关技术,不仅解决数据稀疏的问题也提高推荐的准确性。  相似文献   

16.
传统的协同过滤推荐算法中仅仅根据评分矩阵进行推荐,由于矩阵的稀疏性,存在推荐质量不高的问题.本文提出了一种结合项目属性相似性的混合推荐算法,该算法通过计算项目之间属性的相似性,并且与基于项目的协同过滤算法中的相似性动态结合,通过加权因子的变化控制两种相似性的比重来改善协同过滤中的稀疏性问题,并且将综合预测评分和基于用户的协同过滤预测评分相结合来提高推荐质量,最终根据综合评分来进行推荐.通过实验数据实验证明,该算法解决了协同过滤算法的矩阵稀疏性问题.  相似文献   

17.
当今是一个数据爆炸时期,促进信息过滤技术发展,个性化推荐系统作为其中一种重要的应用方式,已经成为很多网站一种个性化信息服务方式,但传统的协同过滤算法存在扩展性和稀疏性的问题。提出一种基于项目聚类、项目语义相似度和奇异值分解的混合推荐模型,来应对传统的协同过滤推荐系统面临的算法的伸缩性问题、数据稀疏性问题和推荐的精准度问题,进行推荐。结果表明,与传统的算法相比,使用该改进算法能显著地提高推荐系统的推荐质量。  相似文献   

18.
沈磊  周一民  李舟军 《计算机工程》2010,36(20):206-208
提出一种改进协同过滤推荐的方法。该方法根据心理学中的态度行为关系理论建立用户浏览购买模型,通过分析用户浏览信息,预测用户对项的评分,根据预测的评分,运用协同过滤推荐算法为用户做出推荐。实验验证了用户浏览购买模型的有效性。与传统协同过滤方法进行对比的结果表明,该方法可以有效地改进协同过滤算法的推荐结果。  相似文献   

19.
传统的选修课系统存在结构性的不足和缺憾,为了避免高校学生盲目的选择选修课程,本文利用改进的协同过滤算法对高校学生进行个性化的选课推荐.本文首先介绍了两种推荐算法,并着重介绍基于协同过滤的推荐算法,并分析了两种算法的优缺点,最后针对协同过滤算法的数据稀疏性问题,提出了一种改进的协同过滤算法,即在协同过滤中加入基于内容的因素来解决这个问题.这种改进的协同过滤算法避免了传统协同过滤算法中存在的数据稀疏问题,以学生为本推荐适合学生的课程,满足学生学习的个性化要求.  相似文献   

20.
张付志  张启凤 《计算机工程》2009,35(21):258-260,
为了提高新用户服务的预测准确率,提出一种融合多系统用户信息的协同过滤算法。该算法通过将多个系统的用户信息融合到低维流形中为用户寻找邻居和推荐项目,并介绍流形学习算法在推荐服务中的应用过程。通过对比实验,结果表明该算法比传统协同过滤算法能更有效、准确地为新用户提供推荐。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号