共查询到20条相似文献,搜索用时 76 毫秒
1.
CR:一种逆向的关联规则挖掘算法 总被引:4,自引:0,他引:4
引入与交易相关的有关概念,对传统关联规则挖掘的概念进行了扩展,并基于交易提出了一种关联规则挖掘算法,该算法从较长的交易入手,试图找出长的频繁项集,再确定它们的子项集,从而避免了组合爆炸问题。该算法对原数据库进行1次扫描,对压缩数据库进行了2次扫描,较Apriori算法减少了扫描次数,提高了挖掘效率。 相似文献
2.
利用人工鱼群算法对信息系统的数量型属性进行离散化,然后用RST进行分类规则挖掘,再将AFSA与RST相结合,提出了一种基于AFSA与Rsr分类规则挖掘新算法,该算法不仅有效地解决了利用粗糙集进行分类规则挖掘时数量型属性的离散化问题,而且可挖掘出所要解决问题的一般分类规则.实验表明该算法是有效和正确的. 相似文献
3.
在软件演进中,软件缺陷不可避免,且严重影响软件系统的发展。因此,缺陷修复在软件工程领域占据重要位置,为了降低缺陷修复成本,软件缺陷定位应运而生。但现有的缺陷定位方法因为缺少成熟且庞大的数据测试基准而不被业界广泛认可,并且缺乏从关联缺陷角度出发来优化。与此同时,丰富历史缺陷数据,以及缺陷链接行为都为软件维护提供指导。但鲜有工作从历史关联缺陷数据的角度研究缺陷定位方法提升的途径。因此,文章构建缺陷数据集,提供一个数据测试基准,挖掘历史缺陷数据链接行为上潜在的缺陷关联模式,从关联缺陷角度出发,研究缺陷定位方法的提升途径。 相似文献
4.
随着信息技术和数据库技术的飞速发展,从大量的数据中获取有用的信息和知识变得越来越重要。模糊关联规则挖掘是数据挖掘中针对数量型属性关联规则发现的一种有效方法。提出了一种基于矩阵的模糊关联规则挖掘算法,并将其应用于网络安全事件关联分析中,通过对DARPA标准数据集的分析,得出了预期数量的关联规则,并成功验证了某些攻击场景,该模糊关联规则挖掘算法取得了较好的实验结果。 相似文献
5.
针对渐进式关联规则挖掘问题提出了一个有效的处理算法,即IDM—A算法。它能根据数据库的动态变化,高效地进行关联规则的更新。通过知识数据库的维护,最多只需要扫描原始数据库一次,就能得到所需的频繁项目集,能有效地降低更新关联规则所需的时间成本。 相似文献
6.
当前关联规则挖掘主要着眼于正关联规则,如A→B的关联规则的挖掘,这种单一的只对正关联规则的挖掘方式存在严重的弊端,他掩盖了数据之间存在的隐含负关联规则,进而无法得出一些正关联规则中某些项目间相互制约的负关联关系。在关联规则概念和性质的基础上提出了基于频繁模式树的拓展式的正、负项目的关联规则挖掘算法,通过对数据库的遍历形成前缀链表,不仅挖掘包含所有正项目的关联规则,而且还能够挖掘出所有包含负项目的关联规则,不会造成负关联规则的淹没。并对算法的效率和可行性进行分析,该算法在描述关联规则项目间的相互独立程度上比已有的单一挖掘负项目的关联规则算法更具优势。 相似文献
7.
Web挖掘是使用数据挖掘技术在www数据中发现潜在的、有用的模式或信息.关联规则是Web挖掘的一个重要研究领域.根据关联规则挖掘的要求与特点,结合遗传算法,提出一个有效的Web关联规则挖掘方法.实验结果表明,该算法在Web挖掘中具有一定的优势. 相似文献
8.
一种改进的加权关联规则挖掘算法 总被引:1,自引:1,他引:0
基于经典Apriori算法的加权关联规则挖掘算法New-Apriori存在3个问题,需要多次扫描数据库,权值定义不合理和权值的引入导致Apriori基本性质不再成立。为了解决这些问题,采用将矩阵和加权关联规则算法相结合的方法,该改进算法具有只需要扫描一次数据库,权值的定义既考虑到了权重大的项目,也没有忽略频繁出现而权重小的项目,并引入K-项支持期望作为减枝的依据的特点。 相似文献
9.
10.
11.
12.
频繁项集挖掘是关联规则挖掘中至关重要的一步。对于稠密数据集的频繁项集挖掘,传统的挖掘算法往往产生大量无用的中间结果,造成内存利用率的极大浪费,尤其是在支持度较低的情况下。Diffsets算法通过引入"差集"的概念,在一定程度上解决了挖掘过程中产生的大量中间结果与内存容量之间的矛盾。改进型Diffsets算法是在原算法的基础上,在差集运算过程中根据差集中所包含的事务标识个数进行递减排序,进一步减少了挖掘过程中产生的中间结果数量。分析与实例表明,改进后的算法在执行过程中将占用更少的内存空间,加快了算法的收敛速度。 相似文献
13.
刘莹 《信息技术与信息化》2012,(3):62-64
本文介绍了软件质量平台中关联规则挖掘的应用,利用关联规则挖掘的原理,将其运用到软件开发过程中,依据大量的客观数据来支持关联规律,提高规律的可信度。根据规模、配置申请、风险问题、错误缺陷、小组士气、任务进度六种属性来测量关联规则。 相似文献
14.
介绍了关联规则数据挖掘概念和可拓学思想。探讨了把可拓学理论用于关系数据库上关联规则挖掘。通过对关系数据库上多值属性进行布尔数值转换,利用关联规则挖掘算法在关系数据库对关联规则进行挖掘.再用可拓学相关性和蕴含性思想,对所获得的关联规则进行拓展,获得更多更有价值的关联规则。 相似文献
15.
随着信息化建设和应用进程的加快,超市的数据库中积聚了大量的销售信息,本文介绍了数据挖掘中的关联规则在超市数据分析中的应用,帮助企业的决策者根据发展形势的变化及历史数据做出正确的决策。 相似文献
16.
关联规则挖掘是数据挖掘研究的一个重要分支,其目的是为了发现大量数据中项目集之间感兴趣的相关性信息。经过十余年的发展,关联规则挖掘已经成为数据挖掘技术中较为成熟并很重要的一种方法,涉及到多种关联规则挖掘算法。文章重点介绍Apriori算法和FP—tree算法的基本思想、实现流程及其优缺点。 相似文献
17.
提出了一种有效的增量式关联规则挖掘算法IAR,算法的特点在于:提出并采用了基于候选项集个数上阶的选择扫描数据库的机制,可有效减少数据库的扫描次数;算法是一种通用的增量式算法,提出了最小支持度和数据库均改变时,增量式挖掘中的重要性质,从而可充分利用上一次挖掘的结果,有效减少候选项集的数目.并且提出了基于组合数学和项集等价类理论的计算候选项集个数的上阶的方法.通过大量的数据实验,表明算法的效率比已有的算法有了很大提高. 相似文献
18.
PHP脚本语言是一种当前比较流行的服务端脚本语言,多用来开发Web应用程序。文中介绍了一种针对PHP的静态缺陷分析方法,能有效检测出PHP中常见安全缺陷,如SQL注入、XSS等,文中给出了对当前比较流行的几个开源PHP工程的检测结果,其中大部分缺陷是可以远程利用的。 相似文献
19.
目的:用关联分析的方法研究药物治疗肝硬化的效果,探讨其用药的相关性,为临床用药提供参考,同时也为药品审计提供依据。方法:利用某"三甲"医院肝硬化药物治疗的数据,按照药物效果分类,统计其使用频次,用聚类的方法找出使用频次较高药物进行汇总,选用关联规则挖掘中的Apriori算法进行分析。结果:数据分析矩阵和Apriori算法建模所得出的结果一致。结论:通过数据挖掘的方法发现药物治疗肝硬化的效果和规律,分析结果可以作为进一步调整合理用药范围的依据。 相似文献
20.
基于加权关联规则的入侵检测研究 总被引:1,自引:0,他引:1
提出了采用加权关联规则技术的网络入侵检测系统的结构,将加权关联规则算法应用于入侵模式的挖掘中,在一定程度上提高了入侵检测的检测率,同时使误报率大大降低。 相似文献