共查询到18条相似文献,搜索用时 125 毫秒
1.
Web日志中有趣关联规则的发现 总被引:16,自引:0,他引:16
关联规则挖掘是Web用法挖掘的一个重要研究课题。目前的Web日志关联规则挖掘算法忽略了用户对规则是否感兴趣这一重要问题。对Web日志关联规则挖掘算法进行了研究,结合网络拓扑结构,提出了Web拓扑概率模型和有趣关联规则(IAR)算法。利用Web拓扑概率模型对关联规则进行有趣度评价,得出有趣度高的规则,用于改善网络性能。实验显示了IAR算法如何提高规则的利用率和有效地改善网络拓扑,它可以成功地应用到Web用法挖掘中。 相似文献
2.
3.
Web序列模式挖掘是Web数据挖掘重要研究内容之一。在WAP算法的基础上提出了一种改进算法,该算法在Web序列模式挖掘过程中不需要反复生成条件树,从而提高了算法的运行效率。实验表明,该算法在运行时间上相对于WAP算法具有明显的优势。 相似文献
4.
一种基于Web日志文件的信息挖掘方法 总被引:19,自引:1,他引:19
数据预处理和日志挖掘算法是Web日志挖掘中的关键技术。文中根据Web访问模式的用户特征,提出了一种基于Web日志文件的信息挖掘系统的体系结构。在此基础上,分析了其数据挖掘过程和信息挖掘算法。 相似文献
5.
介绍了Web使用挖掘的常用技术。针对Web服务器日志产生数据库的特点,在Web挖掘过程中使用二进制挖掘算法产生关联规则;通过二进制挖掘算法的实例,说明在Web使用挖掘中运用二进制挖掘算法能够提高挖掘效率。 相似文献
6.
7.
8.
9.
基于Web日志挖掘的个性化服务站点 总被引:2,自引:1,他引:2
介绍个性化站点的概念,并对Web日志挖掘系统体系结构进行分析。其后将关联规则挖掘技术应用到日志事务会话中,在对日志数据的特性分析的基础上提出类Apriori挖掘算法。对类Apriori挖掘算法得到的频繁项集如何有效提取关联规则提出了最有效的方法。在实际应用中探讨了如何从多个匹配的关联规则中选择合适的匹配规则。 相似文献
10.
序列模式挖掘能够发现隐含在Web日志中的用户的访问规律,可以被用来在Web预取模型中预测即将访问的Web对象。目前大多数序列模式挖掘是基于Apriori的宽度优先算法。提出了基于位图深度优先挖掘算法,采用基于字典树数据结构的深度优先策略,同时采用位图保存和计算各序列的支持度,能够较迅速地挖掘出频繁序列。将该序列模式挖掘算法应用于Web预取模型中,在预取缓存一体化的条件下实验表明具有较好的性能。 相似文献
11.
Web使用挖掘是近年来Web数据挖掘中的研究热点。针对传统遗传算法在提取关联规则问题时常采用固定染色体交叉概率和染色体变异概率,容易出现早熟、收敛速度较慢的问题,提出了改进的遗传算法,并在关联规则的提取中增加了用户页面兴趣度这一阈值,成功地运用到某商业网站服务器日志挖掘。实验证明,这种改进的遗传算法能够有效避免早熟收敛现象,是一种有效的方法。 相似文献
12.
一种Web访问序列挖掘算法在网站设计中的应用研究 总被引:1,自引:0,他引:1
对Web访问序列的数据挖掘有助于提高Web的访问质量,但序列是数据挖掘中一个比较困难的问题,经典序列算法普遍存在时间和存储空间开销过大的缺憾。本文提出了一种基于马尔可夫链的Web访问序列挖掘算法,可以通过较少的计算量发现请求网页的相关性。我们已将其用于某培训中心网站的设计,取得了良好的效果。 相似文献
13.
基于分布式的Web log挖掘模型 总被引:1,自引:0,他引:1
本文提出了一种基于分布式web log挖掘模型,并针对该模型设计了一种有效的基于分布式的挖掘算法。该算法首先在各分布式服务器上进行关联规则挖掘,然后将各个服务器上的挖掘结果合成。这有利于减轻网络频繁的通讯负担,体现并行计算、异步挖掘、异构数据挖掘的优点。 相似文献
14.
在对Web数据挖掘技术和电子商务推荐系统进行研究生的基础上,设计和提出了一种基于Web数据挖掘的电子商务推荐系统.该系统根据电子商务网站的基本特征,设计了用户当前兴趣表示方法和推荐算法,由于结合了Web使用挖掘和Web内容挖掘为顾客提供个性化推荐服务,从而较大提高了系统的推荐精确度,在实际应用中取得了较好的推荐效果. 相似文献
15.
为了有效地从电子政务网站的Web日志中挖掘民众关注的热点信息, 提出基于区域—频道访问度的民意热点信息挖掘算法——PHIMA算法。该算法在分析目前Web日志挖掘算法存在的问题的基础上, 利用提出的区域—频道访问度概念设计Web访问矩阵, 并基于该矩阵结合区域—频道访问度和灰关联分析法提出。实验表明算法能有效地挖掘民意热点信息, 可用于电子政务网站站点优化、个性化服务和为决策者提供决策支持等。 相似文献
16.
基于Chameleon算法的用户聚类的设计与实现 总被引:6,自引:0,他引:6
用户聚类是Web挖掘的重要部分,而Chameleon算法是一种通用的聚类算法。文中把Chameleon算法应用于Web挖掘,设计了Web用户的聚类,采用J2EE体系架构实现了这一算法,并在此基础上做了改进,实验结果表明,该算法取得了良好的效果。 相似文献
17.
基于马尔可夫链的Web访问序列挖掘算法 总被引:2,自引:0,他引:2
Web问序列的数据挖掘有助于提高Web的访问质量,但序列是数据挖掘中一个比较困难的问题,经典序列算法普遍存在时间和存储空间开销过大的缺陷。提出了一种基于马尔可夫链的Web访问序列挖掘算法,可以通过较少的计算量发现请求网页的相关性。并将其用于某培训中心网站的设计,取得了良好的效果。 相似文献