首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
关联规则是Web挖掘中一个重要的研究领域。为了挖掘出隐藏在数据间的相互关系,将关联规则的概念引入到Web挖掘系统中,把用户的访问路径以关联规则的形式表现出来。基于Apriori算法的思想,给出了适合Web挖掘用户访问的新Apriori算法规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。  相似文献   

2.
关联规则挖掘是数据挖掘技术的一个重要分支,其中Apriori算法是最经典和最有影响力的算法。本文在讨论和分析了关联规则挖掘的基本概念后,提出了一种减少扫描数据库次数的改进算法。改进后的算法分析证明,它可以有效地提高数据挖掘的性能。  相似文献   

3.
Web挖掘是使用数据挖掘技术在www数据中发现潜在的、有用的模式或信息.关联规则是Web挖掘的一个重要研究领域.根据关联规则挖掘的要求与特点,结合遗传算法,提出一个有效的Web关联规则挖掘方法.实验结果表明,该算法在Web挖掘中具有一定的优势.  相似文献   

4.
对关联规则挖掘Apriori算法的进一步改进   总被引:4,自引:0,他引:4  
本文对关联规则挖掘问题进行了介绍。并在分析研究了关联规则挖掘Apriori算法厦其若干改进算法的基础上,对Apriori算法做了进一步地改进,提出了RIAprlori算法。改进后的算法采用事务压缩的方法时事务集进行了更大幅度的压缩。减小了不必要的开销,从而提高了挖掘速度。  相似文献   

5.
互联网作为一个国家教育事业的基础设施,是人们获取知识的一个重要途径。传统网络服务系统功能简单,服务单一,网络利用率不足。文章改进关联规则Apriori算法并应用于网络数据处理中,提高数据利用率。  相似文献   

6.
关联规则挖掘是数据挖掘研究领域中的一个重要的方法,旨在挖掘事务数据库中有趣的模式。阐述了Web日志挖掘和关联规则的基本内容,分析了经典Apriori算法的不足之处,提出了改进的算法。另外,利用论坛Web日志数据进行了对比实验,实验结果表明改进后的算法性能有较大提高。将改进后的算法应用于网络论坛的日志挖掘,找出用户的个性化访问模式,从而提高论坛的服务质量。  相似文献   

7.
提出评价入侵检测系统的五个指标,给出了有效性和效率两个参数.然后重点探讨了模糊关联规则在网络入侵检测中的应用,对传统的支持度和置信度概念根据网络入侵检测的特点进行了改进,给出了算法的具体步骤.通过一个实例,与经典的Apriori算法进行对比分析,实验结果表明,用模糊关联规对海量网络日志数据库进行挖掘是一种可行的方法.  相似文献   

8.
Apriori算法是挖掘关联规则频繁项集的经典算法,但需要对数据库进行多次扫描,在交易量较大的情况下,严重地影响了算法效率。本文将改进的遗传算法应用于求解频繁项集,解决了这一问题。实验表明,该算法具有一定的推广价值。  相似文献   

9.
随着数据挖掘技术的成熟,其中关联规则在大规模数据中的应用成为了目前的热点.为了提高在大规模数据下进行数据挖掘的效率,在MapReduce中通过引入归并函数Fusion来提高执行剪枝任务的效率并进行了优化研究,提出了一种基于云理论的关联规则Apriori算法,详细论述了实现的过程以及关键技术.通过实验表明,该方法取得了良好的实验效果,克服了Apriori算法耗时多、识别率低下等问题,是实现在大规模数据进行数据挖掘的实用工具.  相似文献   

10.
一种改进的加权关联规则挖掘算法   总被引:1,自引:1,他引:0  
基于经典Apriori算法的加权关联规则挖掘算法New-Apriori存在3个问题,需要多次扫描数据库,权值定义不合理和权值的引入导致Apriori基本性质不再成立。为了解决这些问题,采用将矩阵和加权关联规则算法相结合的方法,该改进算法具有只需要扫描一次数据库,权值的定义既考虑到了权重大的项目,也没有忽略频繁出现而权重小的项目,并引入K-项支持期望作为减枝的依据的特点。  相似文献   

11.
遗传算法在Web关联挖掘中的应用研究   总被引:2,自引:1,他引:2  
关联规则是描述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。文章提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。  相似文献   

12.
基于加权关联规则的入侵检测研究   总被引:1,自引:0,他引:1  
提出了采用加权关联规则技术的网络入侵检测系统的结构,将加权关联规则算法应用于入侵模式的挖掘中,在一定程度上提高了入侵检测的检测率,同时使误报率大大降低。  相似文献   

13.
通过分析电子商务网站的 Web 服务器日志提取网络消费者的商品浏览行为信息,利用消费者的浏览频率、浏览时间、链接路径数及路径深度估计商品对网络消费者当前浏览期间偏好的影响权重.结合双向关联规则理论和 Apriori 算法挖掘具有相互依赖关系的商品,找出网络消费者的商品偏好浏览路径,根据消费者当前的浏览行为发现其可能感兴趣的商品,并进一步计算消费者对商品的偏好程度.最后利用自主开发的旅游电子商务网站的Web 日志数据进行仿真实验,挖掘网络消费者的旅游偏好.实验结果表明,在相同的实验条件下,与基于关联规则的偏好挖掘方法相比,基于双向关联规则的偏好挖掘方法的推荐精度增加,推荐覆盖率扩大.  相似文献   

14.
提出了一种基于关联规则二进制数组密集树的数据挖掘算法——BSC-tree算法,该算法将传统的交易数据库简化成二进制序列;其次在此基础上构造出BSC-trees,作为数据挖掘的准备条件,并由此求出BSC-trees的所有路径码,进而通过BSC-trees路径码间的逻辑与运算,他一次只需扫描整个数据库就能够快速地求出所有的关联规则。并将该算法用于交通事故历史数据的挖掘,他能够提取隐含在交通事故中未知的有用信息,为分析交通事故中各种诱因提供辅助性的决策。试验结果表明该算法优于其他算法。  相似文献   

15.
随着信息化建设和应用进程的加快,超市的数据库中积聚了大量的销售信息,本文介绍了数据挖掘中的关联规则在超市数据分析中的应用,帮助企业的决策者根据发展形势的变化及历史数据做出正确的决策。  相似文献   

16.
一种基于云计算的关联规则Apriori算法   总被引:1,自引:0,他引:1  
张圣 《通信技术》2011,44(6):141-143
关联规则是数据挖掘的重要方法之一,它基于支持度和置信度等对规则进行选择,以生成有用的规则。传统的关联规则算法需要读取数据库计算频繁集,开销巨大。随着云计算的发展,MapReduce编程架构已经成为云计算中的重要技术,针对Apriori算法的不足,设计了一种算法将云计算MapReduce框架进行了适当改进,并在此基础上编写了Apriori算法,以解决Apriori算法扩展性差的弱点。实验表明:该算法能有效提高Apriori算法的性能。  相似文献   

17.
针对传统Apriori算法的不足之处,提出两种Apriori改进算法,分别基于构造辅助表和项集求交集策略。改进算法大幅度减少扫描数据库的次数,缩减对不必要事务的扫描时间,显著提高频繁项集的生成效率,从而使算法达到更高的运算效率。实验结果表明,两种改进算法都是有效的关联规则挖掘方法,且比Apriori算法性能更优,亦为关联规则挖掘研究提供了一些科学可行的新思路。  相似文献   

18.
基于关联规则的网络行为分析   总被引:1,自引:0,他引:1  
网络用户访问网站的过程中,产生了大量的用户浏览网页的相关记录,隐含着用户在上网过程中的行为习惯。但其中潜在的用户信息难以发现。因此,急需有效的方法提取这些数据中的信息,数据挖掘应用而生。其中,关联规则技术是应用广泛的技术之一。文中利用Apriori算法对Web结构数据进行关联规则挖掘,所得到的规则反映出页面之间的链接关系。分析挖掘结果可得到用户访问的行为规律,为相关网站的安全性和优化改进提供有效的决策依据。  相似文献   

19.
关联规则挖掘是数据挖掘和知识发现中一门重要技术,但基于支持度-置信度框架的关联规则挖掘存在一些问题。文章引入了双向关联规则的概念,实现了基于遗传算法的双向关联规则挖掘算法。实验证明,它能弥补传统关联规则挖掘算法的不足。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号