首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
Web日志挖掘是Web数据挖掘的一个重要研究领域。Web日志挖掘通过发现Web日志中用户的访问规律和模式,可以提取出其中潜在的规律和信息,人们对这个领域的研究也日益重视。然而,传统的基于关联规则的Web日志挖掘算法都是基于所有关联规则的。这种方式往往挖掘产生大量的候选规则,而且存在大量冗余的规则。提出了一种新的无冗余的Web日志挖掘算法,该算法通过引入频繁闭项集合最小关联规则的概念,从而解决了以往基于所有关联规则挖掘算法中出现的上述问题。  相似文献   

2.
根据Web日志挖掘的特点,介绍了Web数据挖掘的分类和过程.将关联规则应用到日志挖掘算法中,并利用云理论对关联规则算法进行优化,使之更能符合人的思维方式.  相似文献   

3.
为了对云计算平台中日志审计数据进行安全分析,提出一种采用改进的关联规则的日志信息挖掘方法,以便有效识别事故类型或者预防可能出现的各种恶意入侵。该方法采用典型的关联规则Apriori算法对比挖掘系统日志和用户行为模式的异常信息,并通过删除稀疏矩阵集合中的弱相关项目集和可调节最小置信度的策略,对Apriori算法进行轻量化改进。在多次迭代运算得到最大项目集后运用于日志审计。仿真实验结果表明,改进的Apriori算法可以有效减少对数据库的扫描次数,提高挖掘效率,具有一定的推广价值。  相似文献   

4.
Web挖掘是使用数据挖掘技术在www数据中发现潜在的、有用的模式或信息.关联规则是Web挖掘的一个重要研究领域.根据关联规则挖掘的要求与特点,结合遗传算法,提出一个有效的Web关联规则挖掘方法.实验结果表明,该算法在Web挖掘中具有一定的优势.  相似文献   

5.
刘庆华  姜桦 《通信技术》2008,41(5):108-110
通过Web挖掘分析用户需求,利用关联规则实现Web个性化,向用户提供个性化服务已经成为当今Web技术的研究热点.文中根据网络教学系统的个性化需求,针对Web个性化推荐算法及其改进算法中存在的问题,提出一种结合网站结构和内容挖掘的个性化关联规则的推荐算法.离线生成频繁访问路径聚集图,在线结合网站结构,动态地向用户进行在线推荐.并对改进后的算法进行仿真测试,实验表明改进算法可以更加节约存储空间,提高推荐准确率和覆盖率.  相似文献   

6.
在Web网络中承载着不同的协议和网络信道,由此产生危险信息,给网络信息空间带来安全威胁,通过对危险Web信息的准确挖掘,可净化网络空间,确保网络安全。传统方法采用模糊关联规则算法进行危险Web信息分类挖掘,在干扰背景下,模糊聚类过容易受到干扰,导致很难建立有效的关联规则,挖掘效率较低。提出一种基于改进关联规则的危险Web信息挖掘技术。在建立关联规则前,引入Takens定理进行危险Web信息数据的相空间重构,构建Web网络的危险信息挖掘的信道模型,并对危险Web信息的信息流多源进程进行分类设计。设计自适应IIR级联滤波算法进行数据干扰滤波,运用以上方法对规则关联过程进行改进,实现危险Web信息的准确挖掘。仿真实验进行了性能验证,结果表明,采用该算法进行危险Web数据挖掘,去干扰性能较好,精度较高。  相似文献   

7.
遗传算法在Web关联挖掘中的应用研究   总被引:2,自引:1,他引:2  
关联规则是描述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。文章提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。  相似文献   

8.
关联规则是捕述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。本文提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能。弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。  相似文献   

9.
提出了一个快速有效的增量更新挖掘多层关联规则算法MLARU,其基本思想是通过数据库和Web日志构建概念层次树,采用区间支持度的方法表示交叉层次的项集支持度,并采用根据层次树剪枝和增量更新的方法来挖掘多层关联规则。实验结果表明,该算法的效率得到了很好的改善,能在线为用户动态提供多层次个性化推荐。  相似文献   

10.
针对传统关联规则可视化挖掘方法不利于处理多值属性数据、缺乏展现数据间的频繁模式和关联模式以及效率低下等问题,提出了基于KAF因子和CHF因子的Apriori改进算法进行多值属性关联规则挖掘,实现了一种新的基于概念格的多值属性关联规则可视化方法.运用概念格理论对多值属性数据进行了重新定义和分类,建立了较为完整的挖掘过程参数调整策略,方便用户选择关键属性值进行规则挖掘分析,提高了算法运行速度和挖掘效率.以概念格结构将多值数据组织起来,实现了对频繁项集的可视化展示,以及关联规则的多模式可视化展示.实验结果表明,改进后的挖掘算法具有更好的性能,所提出的可视化形式和已有成果相比具有良好的展现效果.  相似文献   

11.
数据挖掘是关联规则中一个重要的研究方向.对关联规则的数据挖掘和遗传算法进行概述,阐述关联规则数据挖掘的意义,提出一种采用改进型遗传算法的关联规则的提取算法,并从编码方法、适应度函数的构造和变异、选择、交叉算子设计方面进行讨论和分析,最后结合一个具体实例进行应用.实验证明这种算法是有效的.  相似文献   

12.
提出评价入侵检测系统的五个指标,给出了有效性和效率两个参数.然后重点探讨了模糊关联规则在网络入侵检测中的应用,对传统的支持度和置信度概念根据网络入侵检测的特点进行了改进,给出了算法的具体步骤.通过一个实例,与经典的Apriori算法进行对比分析,实验结果表明,用模糊关联规对海量网络日志数据库进行挖掘是一种可行的方法.  相似文献   

13.
关联规则挖掘技术目前被广泛应用于入侵检测系统中。关联规则挖掘算法之一的FP-growth算法在处理数值量的输入时需要二值化,使得准确率不高;而Fuzzy Apriori算法需要重复扫描数据库,效率较低。针对此问题,改进现有的FP-growth算法,提出模糊化FP-growth算法,从而提取模糊关联规则,用于N类异常数据的分类入侵检测。在KDDCup'99数据集上评估,结果表明对于数值量的输入,该方法应用于入侵检测准确率高于FP-growth算法,学习效率高于Fuzzy Apriori算法。  相似文献   

14.
针对传统气象数据质量控制算法存在的不足,首先提出将Apriori关联规则挖掘算法用于气象数据中,通过Apriori算法挖掘出关联规则;其次分析了Apriori算法存在的不足,提出了一种改进的MC_Apriori算法,通过真实数据仿真表明,新算法在时间性能上更加优越;最后,在原数据的基础上植入部分错误数据,通过与规则库中的关联规则进行规则匹配,找出错误数据率达到93.3%。  相似文献   

15.
刘波  潘久辉 《电子学报》2007,35(8):1612-1616
关联规则挖掘是数据挖掘领域中重要的研究分支,频繁项集或频繁谓词集的计算是其中的关键问题.本文针对包括多值属性的关系数据库,以多维关联规则挖掘为目标,研究频繁谓词集的计算方法,提出了MPG算法及IMPG增量算法.MPG算法通过构建频繁模式图MP-graph,按照深度优先搜索方法,动态挖掘频繁谓词集,只需扫描数据库一次.此外,该方法至多增加一次数据库扫描,就能扩展为IMPG算法,进行增量关联规则挖掘.文章分析了算法时间和空间性能,用实验说明了算法的有效性.  相似文献   

16.
关联规则分析作为数据挖掘的主要手段之一,在发现海量事务数据中隐含的有价值信息方面具有重要的作用。该文针对Apriori 算法的固有缺陷,提出了AWP (Apriori With Prejudging) 算法。该算法在Apriori 算法连接、剪枝的基础上,添加了预判筛选的步骤,使用先验概率对候选频繁k项集集合进行缩减优化,并且引入阻尼因子和补偿因子对预判筛选产生的误差进行修正,简化了挖掘频繁项集的操作过程。实验证明AWP算法能够有效减少扫描数据库的次数,降低算法的运行时间。  相似文献   

17.
Association rule mining is an active data mining research area. However, most ARM algorithms cater to a centralized environment. In contrast to previous ARM algorithms, we have developed a distributed algorithm, called optimized distributed association mining, for geographically distributed data sets. ODAM generates support counts of candidate itemsets quicker than the other DARM algorithms and reduces the size of average transactions, data sets, and message exchanges.  相似文献   

18.
王圆春  肖东  林云 《电波科学学报》2022,37(5):802-809+836
为更合理利用频谱资源以及更好地评估各类电磁环境,本文提出一种基于关联规则挖掘的频谱数据挖掘方案.该方案首先基于一般挖掘流程获取频谱数据中的有用信息,包括异常信息、底噪信息、占用度信息和预定时间功率信息等;再将频谱信息作为关联分析对象,通过构建关联库,构建模糊集,基于模糊关联规则挖掘算法对频谱信息进行系统性的分析.本文对传统的算子选择策略加以改进,使用大尺度参数改进模糊隶属函数.通过实测数据集的验证分析,实验结果表明,频谱信息的强关联规则能反映各种信息之间隐含的关联性以及各种信息出现的频次;基于频谱信息的关联规则挖掘能有效地简化频谱挖掘工作,通过各种信息的关联性可以通过分析一部分频谱信息而得到另外的频谱信息.频谱信息的关联规则可以用于进行电磁无线电环境的评估,选择合适的频谱信息该方案可以应用于各类电磁环境的评估.  相似文献   

19.
Existing association rule recommendation technologies were focus on extraction efficiency of association rule in data mining.However,it lacked consideration of recommendation balance between popular and unusual data and efficient processing.In order to improve the quality and efficiency of personalized recommendation and balance the recommendation weight of cold and hot data,the problem of mining frequent itemset based on association rule was revaluated and analyzed,a new evaluation metric called recommendation RecNon and a notion of k-pre association rule were defined,and the pruning strategy based on k-pre frequent itemset was designed.Moreover,an association rule mining algorithm based on the idea was proposed,which optimized the Apriori algorithm and was suitable for different evaluation criteria,reduced the time complexity of mining frequent itemset.The theoretic analysis and experiment results on the algorithm show that the method improved the efficiency of data mining and has higher RecNon,F-measure and precision of recommendation,and efficiently balance the recommendation weight of cold data and popular one.  相似文献   

20.
关联规则现在已成为数据挖掘领域中非常重要的研究课题,用于发现隐藏在大型数据集中的令人感兴趣的联系。Apriori算法作为第一个关联规则挖掘算法,开创性地使用了基于支持度的剪枝技术,系统地控制了候选项集的指数增长。但是,Apriori算法仍然存在着频繁扫描数据库和产生大量候选项集的缺点。鉴于此,提出了用一个整型或整型数组来代替一项事务集和一项候选项集,通过数据压缩,可以一次性将海量数据载入内存,减少了磁盘I/O负载,并通过位运算与计算海明距离达到计算支持度的目的,同时使用了若干优化方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号