首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 750 毫秒
1.
提出了一个结合Web文本挖掘的分布式Web使用挖掘模型DWLMST,以及基于该模型的局部浏览兴趣迁移模式更新算法LITP和全局浏览兴趣迁移模式更新算法GITP。利用页面聚类来表示用户兴趣。通过将用户事务中的页面替代为相应的聚类号来得到用户浏览兴趣序列。从用户浏览兴趣序列中分析得到用户浏览兴趣迁移模式。算法较好地解决了Web访问信息的异地存储、实时增长等因素给模式分析过程带来的困难,同时也提高了用户浏览兴趣表示的准确性。  相似文献   

2.
实现Web页面的智能个性化检索   总被引:8,自引:1,他引:8  
给出了对Web页面进行智能个性化检索的系统结构和实现原理,采用Agent技术和用户手工调整相结合的方法确定用户检索的个性化模式,通过K-modes算法聚类学习用户反馈信息,产生新的个性化模式。更精确地满足用户的个性化检索需求,降低了检索结果的重复率,在一定程度上提高了检索的精度和效率。  相似文献   

3.
为降低传统FCM算法的计算复杂性,提高Web用户聚类的效果,文中提出了一种改进的基于特征属性的Web用户模糊聚类算法。首先通过用户访问页面的次数和时间建立Web用户兴趣度矩阵,并根据商品的特征属性值将Web用户兴趣度矩阵映射为用户对特征属性的偏好矩阵,从而有效降低数据稀疏性;然后以此为数据集,对传统的FCM算法进行了改进,将聚类中心分为活动和稳定两种,忽略稳定聚类中的距离计算以降低计算复杂性。最后通过仿真实验证实了新算法的有效性和可行性。  相似文献   

4.
用户对Web网站访问兴趣可以通过页面的浏览顺序表现出来,Web站点的访问日志记录了用户访问页面的详细信息.介绍Web站点访问日志挖掘的相关知识,并定义新的兴趣度,相似度和聚类中心,提出了一种基于用户访问兴趣的路径聚类算法,最后通过实验来验证这种算法的有效性.  相似文献   

5.
为降低传统 FCM 算法的计算复杂性,提高 Web 用户聚类的效果,文中提出了一种改进的基于特征属性的 Web 用户模糊聚类算法.首先通过用户访问页面的次数和时间建立 Web 用户兴趣度矩阵,并根据商品的特征属性值将 Web 用户兴趣度矩阵映射为用户对特征属性的偏好矩阵,从而有效降低数据稀疏性;然后以此为数据集,对传统的 FCM 算法进行了改进,将聚类中心分为活动和稳定两种,忽略稳定聚类中的距离计算以降低计算复杂性.最后通过仿真实验证实了新算法的有效性和可行性.  相似文献   

6.
服务于定向信息推荐的模糊聚类协同推荐算法   总被引:1,自引:0,他引:1  
面对金融领域信息量扣用户数量的不断增加,现有的金融信息推荐算法不能很好地满足金融用户的信息需求,推荐结果的及时性和准确性有待进一步提高。在分析现有协同推荐算法的基础上,本文提出了金融信息模糊聚类协同推荐算法,将模糊聚类和协同推荐算法相结合,以用户一项目评价矩阵为研究基础,对有相似信息需求兴趣的用户进行模糊聚类,用户组群的兴趣爱好代表并预测个人的兴趣爱好,能为用户提供和发现新的信息资源,很好地满足金融用户信息需求的多兴趣性和时效性。最后对提出的算法进行实验,实验结果表明了算法具有良好的推荐效果。  相似文献   

7.
基于模糊概念图的文档聚类及其在Web中的应用   总被引:12,自引:0,他引:12  
陈宁  陈安  周龙骧  贾维嘉  罗三定 《软件学报》2002,13(8):1598-1605
随着World Wide Web上数据量的日益庞大,现有的搜索引擎已经不能满足用户日益增长的需求.利用数据挖掘技术,提高搜索效率,实现了查询的用户化.首先提出了模糊概念图的模型来描述词语间的关系,然后在聚类过程中引入概念知识,提出了基于模糊概念图的文档聚类算法,通过分析用户的浏览行为发现兴趣模式.在上述技术的基础上,给出了一种用户化的智能搜索系统的实现策略,通过分析概念间的关系和用户的兴趣模式,评价超链/文档和查询的相关程度,从而帮助用户得到更准确的信息.  相似文献   

8.
基于Internet的智能个性化检索   总被引:2,自引:0,他引:2  
本文给出了Web页面进行智能个性化检索的系统结构和实现原理,采用Agent技术和用户手工调整相结合的方法确定用户检索的个性化模式,通过K-modes算法聚类学习用户反馈信息,产生新的个性化模式,更精确地满足用户的个性化检索需求,降低了检索结果的重复率,在一定程度上提高了检索的精度和效率。  相似文献   

9.
集成Web使用挖掘和内容挖掘的用户浏览兴趣迁移挖掘算法   总被引:2,自引:0,他引:2  
提出了一种集成Web使用挖掘和内容挖掘的用户浏览兴趣迁移模式的模型和算法。介绍了Web页面及其聚类。通过替代用户事务中的页面为相应聚类的方法得到用户浏览兴趣序列。从用户浏览兴趣序列中得到用户浏览兴趣迁移模式。该模型对于网络管理者理解用户的行为特征和安排Web站点结构有较大的意义。  相似文献   

10.
个性化Web推荐服务研究   总被引:13,自引:1,他引:12  
本文主要论述了个性化Web推荐构成,提出了基于Web挖掘的个性化推荐服务研究中的用户聚类、Web页面聚类、n元预测模型及页面加权算法。利用这些算法得到的个性化信息可以准确把握用户兴趣模式并为用户提供“一对一”的具备自适应性的智能个性化服务。  相似文献   

11.
基于Web挖掘与相关反馈的多层次用户兴趣挖掘算法   总被引:1,自引:0,他引:1  
针对现有用户兴趣挖掘算法单一的缺点,提出了基于Web挖掘与相关反馈的多层次用户兴趣挖掘算法,在充分挖掘Web内容的同时,又将用户对网页的相关性反馈引入到算法中,实现显式提交信息与自动隐式学习相结合。实验证明该算法能较好地描述用户的兴趣类型及兴趣度,为实现个性化信息检索奠定了基础。  相似文献   

12.
在Web数据挖掘研究领域中,Web日志挖掘是Web数据研究领域中一个最重要的应用方面。本文对Web日志挖掘作了系统的研究。包括对服务器上日志结构的分析和对数据预处理过程的描述。文中着重讨论了用户模糊聚类的算法,并用实例证明了模糊聚类在web用户聚类应用中的可行性。在此基础上还提出了一个Web站点的个性化服务模型,通过对Web服务器中日志的挖掘,发现具有相似访问兴趣的用户群,进而为用户作个性化的推荐。  相似文献   

13.
在Web数据挖掘研究领域中,Web日志挖掘是Web数据研究领域中一个最重要的应用方面。本文对Web日志挖掘作了系统的研究,包括对服务器上日志结构的分析和对数据预处理过程的描述。文中着重讨论了用户模糊聚类的算法,并用实例证明了模糊聚类在Web用户聚类应用中的可行性。在此基础上还提出了一个Web站点的个性化服务模型,通过对Web服务器中日志的挖掘,发现具有相似访问兴趣的用户群,进而为用户作个性化的推荐。  相似文献   

14.
The degree of personalization that a Web site offers in presenting its services to users is an important attribute contributing to the site's popularity. Web server access logs contain substantial data about user access patterns. One way to solve this problem is to group users on the basis of their Web interests and then organize the site's structure according to the needs of different groups. Two main difficulties inhibit this approach: the essentially infinite diversity of user interests and the change in these interests with time. We have developed a clustering algorithm that groups users according to their Web access patterns. The algorithm is based on the ART1 version of adaptive resonance theory. In our ART1-based algorithm, a prototype vector represents each user cluster by generalizing the URLs most frequently accessed by all cluster members. We have compared our algorithm's performance with the traditional k-means clustering algorithm. Results showed that the ART1-based technique performed better in terms of intracluster distances. We also applied the technique in a prefetching scheme that predicts future user requests.  相似文献   

15.
点击流数据是分析互联网用户心理倾向的关键,互联网用户的聚类可以通过分析点击流数据实现. 本文提出了一种基于向量的相似度计算方法,将点击流数据转化为向量数据. 通过对向量的计算来得出聚类的结果. 算法克服了传统的聚类算法的一些缺点,更能符合研究人员研究Web点击流数据时关于个性化聚类的要求.  相似文献   

16.
对 Web 页面和用户的聚类算法提出了一种CAFM聚类算法.在该算法中,把模糊多重集的概念引入到模糊聚类算法中,将反映用户浏览行为的页面点击次数、停留时间、用户偏好等因素用模糊多重集来综合刻画用户访问站点的兴趣度,再以此来建立模糊多重相似矩阵直接进行聚类.通过实例说明了算法的具体计算过程和可行性.  相似文献   

17.
针对快速发现用户适合度较高的Web服务问题,提出了一种基于用户情境聚类的Web服务发现方法.将聚类与倒排索引技术融入Web服务发现算法,利用BIRCH聚类思想进行用户情境聚类,有效地缩小了Web服务的查找范围,而倒排索引技术则能够快速定位服务,进一步优化了Web服务发现的时间.结合实例和实验,并与其他Web服务发现方法进行比较,结果表明了该方法的服务发现结果和时间效率均优于其他方法.  相似文献   

18.
传统的可伸缩性聚类算法可扩展性不强、处理孤立点的能力较弱。人工鱼群算法是一种基于动物行为的寻求全局最优算法,将人工鱼群算法应用于Web用户聚类,模仿鱼群的觅食、聚群、追尾和随机行为来构造人工鱼,通过鱼群每个个体的局部最优,来找到全局最优值,从而对Web访问用户进行合理聚类。实际运行结果验证了算法的有效性。  相似文献   

19.
面向结构相似的网页聚类是网络数据挖掘的一项重要技术。传统的网页聚类没有给出网页簇中心的表示方式,在计算点簇间和簇簇间相似度时需要计算多个点对的相似度,这种聚类算法一般比使用簇中心的聚类算法慢,难以满足大规模快速增量聚类的需求。针对此问题,该文提出一种快速增量网页聚类方法FPC(Fast Page Clustering)。在该方法中,先提出一种新的计算网页相似度的方法,其计算速度是简单树匹配算法的500倍;给出一种网页簇中心的表示方式,在此基础上使用Kmeans算法的一个变种MKmeans(Merge-Kmeans)进行聚类,在聚类算法层面上提高效率;使用局部敏感哈希技术,从数量庞大的网页类集中快速找出最相似的类,在增量合并层面上提高效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号