首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 71 毫秒
1.
Web日志挖掘是Web数据挖掘领域中的一个重要研究方向,是通过对Web日志记录的挖掘发现用户访问Web页面的浏览模式用以改进Web站点的性能和组织结构。在介绍Web日志挖掘的原理和技术的基础上对Web日志挖掘中的聚类技术进行了分析研究,并重点讨论了有关模糊聚类算法的原理及计算过程,对这一算法进行了改进后的优化和应用,最后用实例对算法加以验证。  相似文献   

2.
Web用户聚类算法   总被引:2,自引:0,他引:2  
Web用户聚类是将具有相似访问特性的用户归在一起,在电子商务的市场分割和为用户提供个性化服务中,能发挥巨大作用。文章提出基于用户访问路径以及节点高度的相似性评价函数,建立相似矩阵,并提出相似矩阵结构分解算法对此相似矩阵进行变换生成对角矩阵或下三角矩阵,该矩阵中的每一个子对角阵即对应一个用户类,矩阵的左下角对应各用户类之间的关系。  相似文献   

3.
模糊聚类的最大树算法在Web页面分类中的应用   总被引:5,自引:0,他引:5  
通过Web日志中记录的客户对Web页面的访问情况建立Web页面的用户访问矩阵,在此基础上构造模糊相似矩阵,根据模糊相似矩阵由最大树算法进行聚类。分析和算例表明,通过模糊相似矩阵进行聚类避免了构造模糊等价矩阵的大计算量,具有简单、快捷,适合处理高维数据的特点。  相似文献   

4.
在Web数据挖掘研究领域中,Web日志挖掘是Web数据研究领域中一个最重要的应用方面。本文对Web日志挖掘作了系统的研究。包括对服务器上日志结构的分析和对数据预处理过程的描述。文中着重讨论了用户模糊聚类的算法,并用实例证明了模糊聚类在web用户聚类应用中的可行性。在此基础上还提出了一个Web站点的个性化服务模型,通过对Web服务器中日志的挖掘,发现具有相似访问兴趣的用户群,进而为用户作个性化的推荐。  相似文献   

5.
基于模糊聚类的Web日志挖掘   总被引:10,自引:0,他引:10  
李桂英  李吉桂 《计算机科学》2004,31(12):130-131
本文使用模糊聚类的方法对Web日志进行数据挖掘,实现用户聚类和页面聚类,并设计与实现了一个基于模糊聚类的Web日志挖掘系统。  相似文献   

6.
Web页面和客户群体的模糊聚类算法   总被引:17,自引:0,他引:17  
web日志挖掘在电子商务和个性化web等方面有着广泛的应用.文章介绍了一种web页面和客户群体的模糊聚类算法.在该算法中,首先根据客户对Web站点的浏览情况分别建立Web页面和客户的模糊集,在此基础上根据Max—Min模糊相似性度量规则构造相应的模糊相似矩阵,然后根据模糊相似矩阵直接进行聚类.实验结果表明该算法是有效的.  相似文献   

7.
在Web数据挖掘研究领域中,Web日志挖掘是Web数据研究领域中一个最重要的应用方面。本文对Web日志挖掘作了系统的研究,包括对服务器上日志结构的分析和对数据预处理过程的描述。文中着重讨论了用户模糊聚类的算法,并用实例证明了模糊聚类在Web用户聚类应用中的可行性。在此基础上还提出了一个Web站点的个性化服务模型,通过对Web服务器中日志的挖掘,发现具有相似访问兴趣的用户群,进而为用户作个性化的推荐。  相似文献   

8.
通过对Web日志的聚类分析,可以发现用户的群体特征,甚至可以预测用户将来的访问模式,进而为不同的用户群提供个性化服务。针对现有方法的一般缺陷,包括特征选择单一无法充分体现用户兴趣偏好和传统Hierarchical算法在用户聚类时存在的收敛效率低、易受用户访问多样性影响的问题,提出了基于多重特征的双层用户聚类方法。该方法采用多重特征对用户相似性进行度量,并在此基础上进行双层聚类。首先采用基于密度的DBSCAN算法来排除用户会话中的离群对象和发现不规则簇,然后再采用自底向上的Hierarchical方法对第一层的聚类结果进行聚类。实验结果表明,本文方法具有良好的稳定性和聚类效果。  相似文献   

9.
基于用户浏览行为聚类Web用户   总被引:3,自引:0,他引:3  
本文结合Web用户浏览行为的特点,提出了一种新的路径相似度的计算方法,在计算相似度时不仅把用户的浏览模式仅作为一种序列模式来考虑,还充分考虑了用户在网上浏览的时间因素.然后,把粗糙度的概念引入Leader聚类算法中,提出粗糙Leader聚类算法.最后,使用标准数据集进行了试验,证明基于此种相似度计算方法,应用粗糙Leader算法聚类Web用户的有效性.  相似文献   

10.
基于Web日志的信息挖掘具有重要的意义,比如识别兴趣相似的客户群体有利于实现推荐和个性化服务。采用了多元线性回归分析用户浏览行为,直接对兴趣相似矩阵进行λ截聚类,最后通过计算项与类的连接强度来调整聚类结果。实验结果证明了该算法具有较高的准确率和良好的扩展性。  相似文献   

11.
应用模糊聚类最大树算法对教学质量评估指标进行聚类以确定关键评估指标集,使用模糊相似关系挖掘出大量数据中教学质量评估指标与评估等级之间的规则,并以本校数据实例为对象建立教学质量评估模糊数据挖掘验证了该方法的有效性。  相似文献   

12.
一种Web用户行为聚类算法   总被引:13,自引:0,他引:13  
提出了一种新的路径相似度系数计算方法,并使之与雅可比相似系数结合,用于计算用户访问行为的相似度,在此基础之上又提出了一种分析web用户行为的聚类算法(FCC)。通过挖掘Web日志,找出具有相似行为的web用户,由于FCC聚类算法过滤了小于指定阚值的相似度系数,大大缩小了数据规模,很好地解决了其他聚类算法(如层次聚类)在高堆空间聚类时的“堆数灾难”问题,最后的实验结果很好。  相似文献   

13.
该文使用模糊聚类的方法对Web日志进行数据挖掘,给出了模糊聚类分析在数据挖掘中应用的主要步骤,最后用实例证明了Web模糊聚类的可行性。  相似文献   

14.
王勇  张伟  陈军 《计算机工程与设计》2007,28(6):1484-1485,F0003
在Web挖掘研究中,传统硬聚类技术常被用来分析网站浏览者对网页的浏览偏好.然而该方法只能将每一用户浏览路径归类到单一群组中,即事先假设每一浏览路径只包含单一种用户偏好,却忽略了同一用户浏览路径可能包含多个网页偏好.针对这种情况,提出用模糊聚类技术取代传统的硬聚类技术以弥补不足,使聚类结果更符合实际浏览情况.  相似文献   

15.
针对现有Web资源访问模式缺乏针对性、信息冗余、缺乏语义等缺点,提出一种区别于传统Web结构的新的目录概念--语义目录,对目录的生成方法提出了解决方案.利用类Apriori算法对用户日志进行挖掘得到频繁页面规则集.本体Agent对规则集进行提取,得到的本体元和用户模式分别存储于本体知识库和频繁路径序列模式树(FRSP-tree)中,并且在FRSP-tree树结点中加入指向本体元的指针,使遍历FRSP-tree树生存的目录具有语义性和针对性.  相似文献   

16.
针对目前供电企业信息化厂商质量评价的不完善性,以供电企业信息化厂商运行评价与分析为平台,就如何将数据挖掘技术与供电企业信息化厂商质量评价相结合的问题进行研究。通过对供电企业信息化厂商运行评价指标数据的有效挖掘,利用最大最小法建立相似矩阵,用传递闭包法作聚类分析,为供电企业信息化厂商质量评价结果分类提供模型和方法的支撑。实验结果表明该模型操作简便、有效,能更加客观真实地反映供电企业信息化厂商质量水平。  相似文献   

17.
针对现有直觉模糊聚类方法大都未考虑属性(指标)权重,计算过于复杂且计算结果为实数的问题,提出一种基于新直觉模糊相似度的聚类方法,计算结果为直觉模糊数,运用直觉模糊熵得到属性权重,构造了一种考虑属性权重的直觉模糊相似度公式,得到直觉模糊相似矩阵,设计了风险参数,决策者根据自己风险偏好选择风险参数进行聚类.最后通过算例验证了所提出方法的可行性和合理性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号