共查询到20条相似文献,搜索用时 78 毫秒
1.
2.
关联规则的挖掘是一个重要的数据挖掘问题.目前的算法主要是研究支持-信任框架理论的关联规则挖掘,基于支持-信任理论的关联规则挖掘布尔型描述的数据已经比较成熟,但是现实的数据库中有许多数值属性的数据,从这些数据中挖掘潜在的规则,经典的关联规则方法(Apriori)就显得力不从心了.这里介绍将数值数据映射到二维空间,利用基于密度分布函数的聚类分析方法将数值属性区间分段,并在此基础上挖掘容易理解并且具有概括性和有效的数值属性关联规则. 相似文献
3.
基于数值属性的关联规则挖掘算法 总被引:7,自引:0,他引:7
关联规则的挖掘是一个重要的数据挖掘问题。目前的算法主要是研究支持—信任框架理论的关联规则挖掘,基于支持—信任理论的关联规则挖掘布尔型描述的数据已经比较成熟,但是现实的数据库中有许多数值属性的数据,从这些数据中挖掘潜在的规则,经典的关联规则方法(Apriori)就显得力不从心了。这里介绍将数值数据映射到二维空间,利用基于密度分布函数的聚类分析方法将数值属性区间分段,并在此基础上挖掘容易理解并且具有概括性和有效的数值属性关联规则。 相似文献
4.
5.
对区间值属性数据集进行挖掘,可以有效分析出数据之间的关系。针对现有数据挖掘方法未对大规模数据进行聚类,导致挖掘过程占据内存大,挖掘精度低的问题,提出了一种新的区间值属性数据集挖掘算法。对问题定义、数据准备、数据提取、模式预测和数据聚类等模块进行详细分析,完成区间值属性数据聚类。根据聚类结果,将区间值属性数据分成多个数据集,挑选出能够支持最小支持度的项目集,将这些项目集作为频繁项集,进而提取出数据集之间的关联规则,将关联规则融入数据计算步骤,完成数据挖掘。为验证算法效果,进行仿真,结果表明,相较于传统挖掘算法,所提挖掘算法占用容量更小,挖掘精度更高。 相似文献
6.
7.
8.
提出了一种基于聚类的挖掘关联规则Apriori改进算法,该算法只需扫描一次事务数据库,直接按事务项数生成聚类表,每次只需扫描部分聚类表就可生成频繁项集,减少了扫描数据库的次数和计算成本,从而有效提高挖掘关联规则的效率。 相似文献
9.
10.
11.
摘要:数据网格是在计算网格的基础上发展起来的网格技术,具有资源共享、协同工作、虚拟组织以及对分布式数据库群进行处理和分析的特点,在知识发现领域具有重要的研究价值。因此,本文提出了一种基于数据网格进行知识关联规则挖掘的方法。该方法采用数据网格树对动态数据网格进行全局控制和管理,采用挖掘作业命令的形式触发域挖掘作业,采用素数存储的方法进行了关联规则挖掘。通过仿真实验表明该挖掘方法在数据库群和数据网格关联规则挖掘方面具有优势。 相似文献
12.
针对规则随着时间变化的特点,在分析原有定义和对支持度向量(SV)和置信度向量分类的基础上,提出了动态关联规则趋势度的挖掘方法。首先,利用趋势度阈值消除无价值的规则,减小候选项集;其次,产生动态关联规则的趋势度元规则,找出具有价值的规则,提高挖掘质量;最后,通过对具有增减和周期趋势的事物数据库分析,证明了所提方法的有效性。 相似文献
13.
《国际计算机数学杂志》2012,89(11):2233-2245
A data mining algorithm, such as Apriori, discovers a huge number of association rules (ARs) and therefore efficiently ranking all these rules is an important issue. This paper suggests a data envelopment analysis (DEA) method for ranking the discovered ARs using a maximum discrimination between the interestingness criteria defined for all ARs. It is shown that the proposed DEA model has a unique optimal solution which can be computed efficiently when the maximum discrimination between the criteria, the difference between DEA weights, is considered. The contribution of this study can be explained as follows: First, we show that using the conventional DEA model for ranking ARs may produce an invalid result because the weights corresponding to interestingness criteria would not discriminate between the criteria. This is investigated for a dataset consisting of 46 ARs with four criteria, namely support, confidence, itemset value and cross-selling. The paper also introduces the maximum discrimination between the weights of the criteria and obtains the optimal solution of the corresponding DEA model efficiently without the need of solving the related mathematical models. On the other hand, this model concludes less number of useful rule(s). A comparative analysis is then used to show the advantage of the proposed DEA method. 相似文献
14.
张群慧 《网络安全技术与应用》2013,(9):83-84
随着网络技术的广泛应用,网络系统的安全变得至关重要。入侵检测是保护网络系统安全的关键技术和重要手段,但现行的入侵检测达不到实际应用的需求。关联规则挖掘可以从海量数据中发现正常和异常的行为模式,有效地检测入侵。因此,研究关联规则的数据挖掘对于提高入侵检测的准确性和时效性具有非常重要的意义。 相似文献
15.
本文提出一种融合改进遗传算法和关联规则的数据挖掘方法。首先将遗传算法交叉算子和变异算子进行自适应改进,使其在迭代过程中能够根据函数适应度值自适应调节。然后将改进后的自适应遗传算法融入到关联规则中,充分利用遗传算法良好的全局搜索能力,提高处理海量数据关联规则的挖掘效率。为了避免无用规则,减少不相关性的存在,在此基础上融入亲密度以提高关联规则的可靠性。在Hadoop大数据平台上通过分析交通数据验证优化后的算法,与传统方法相比,该方法提高了算法的收敛速度和鲁棒性。 相似文献
16.
17.
针对分布式数据挖掘需要节点间进行大量数据交换的缺点,根据张春生,宋琳琳提出的关联规则局部性原理,不进行数据交换,通过节点挖掘,直接得到局部性全局关联规则,通过各节点间规则的合并,直接得到非局部全局关联规则,该算法简单易行,不需要节点间的数据交换,提高了数据挖掘效率,不仅挖掘出其他分布式数据挖掘算法挖掘出的全局关联规则,还能够发现其他算法不能发现的局部全局规则. 相似文献
18.
In this paper,ARM iner,a data mining tool based on association rules,is introduced.Beginning with the system architecture,the characteristics and functions are discussed in details,including data transfer,concept hierarchy generalization,mining rules with negative items and the re-development of the system.An example of the tool‘s application is also shown.Finally,Some issues for future research are presented. 相似文献
19.
针对不确定性数据中模糊关联规则的挖掘问题,提出一种基于群搜索优化(GSO)算法优化隶属度函数(MF)的模糊关联规则挖掘方法。首先,将不确定性数据通过三元语言表示模型进行表示;然后,给定一个初始MF,并以最大化模糊项集支持度和语义可解释性作为适应度函数,通过GSO算法的优化学习获得最佳MF;最后,根据获得的最佳MF,利用改进型的FFP-growth算法来从不确定数据中挖掘模糊关联规则。实验结果表明,该方法能够根据数据集自适应优化MF,以此实现从不确定数据中有效地挖掘关联规则。 相似文献
20.
一种含负项目的一般化关联规则挖掘算法 总被引:3,自引:0,他引:3
传统的关联规则是形如A→B反映正项目之间关联关系的蕴涵式,它无法反映出数据之间隐藏的负关联关系.在表达式中引入负项目,将这种传统的关联规则扩展成包含正、负项目的一般化关联规则.介绍了一般化关联规则的概念及其相关性质定理,并加以证明,提出了一种基于频繁模式树的挖掘混合正、负项目的一般化关联规则的MGPNFP算法,对其性能进行了分析,并比较了MGPNFP算法比现有的挖掘含负项目关联规则的算法所具有的优势. 相似文献