首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 843 毫秒
1.
《信息技术》2017,(5):110-116
以模糊集成联机分析处理(On-Line Analytical Processing,OLAP)为基础对关联规则挖掘算法进行改进,该算法为多维联机研究提供一种关联规则计算架构。基于模糊数据立方体的知识发现,为用户提供灵活的多维数据层次抽象模式。在多维数据集的多维属性处理中,引入模糊数据立方体作为问题措施补充,并利用不同层次的模糊关联规则构造模糊数据立方体,然后利用权重和多层次的概念构建模糊加权多层次关联规则。最后,通过对所提算法在合成数据集以及2000年中国人口普查的数据仿真测试,验证了基于OLAP的挖掘方法要比离散关联规则挖掘方法、单独支持阈值关联规则及最小挖掘项集关联规则三种对比算法,在最小支持度、置信度、权重均值等指标上,性能更加优异。  相似文献   

2.
对于模糊关联规则挖掘算法存在的不足,首先为了软化数量型属性论域的划分边界,借用了FCM算法将数量型属性离散化,并把数据集划分成若干个模糊集等级;然后,对模糊置信度进行定义时,把经典关联规则中的置信度的定义经过扩展后直接运用到模糊集上,不免会带来一些逻辑推理上的问题,采取了蕴涵度代替模糊置信度的方法,引入模糊蕴涵算子,经过进一步推理论证,证明了蕴涵度能够用模糊支持度来代替。提出了一种基于模糊聚类和蕴涵度的模糊关联规则挖掘算法,并通过实验证明了算法的有效性。  相似文献   

3.
DF关联规则及其挖掘算法的研究   总被引:1,自引:1,他引:0  
针对动态模糊关联数据,运用DFS和DFL的理论提出了动态模糊关联规则的定义,并在此基础上进一步给出了面向动态模糊关联数据的一种数据挖掘算法;最后通过实例分析,表明该算法能够有效发现数据间的动态模糊关联模式.  相似文献   

4.
在Web网络中承载着不同的协议和网络信道,由此产生危险信息,给网络信息空间带来安全威胁,通过对危险Web信息的准确挖掘,可净化网络空间,确保网络安全。传统方法采用模糊关联规则算法进行危险Web信息分类挖掘,在干扰背景下,模糊聚类过容易受到干扰,导致很难建立有效的关联规则,挖掘效率较低。提出一种基于改进关联规则的危险Web信息挖掘技术。在建立关联规则前,引入Takens定理进行危险Web信息数据的相空间重构,构建Web网络的危险信息挖掘的信道模型,并对危险Web信息的信息流多源进程进行分类设计。设计自适应IIR级联滤波算法进行数据干扰滤波,运用以上方法对规则关联过程进行改进,实现危险Web信息的准确挖掘。仿真实验进行了性能验证,结果表明,采用该算法进行危险Web数据挖掘,去干扰性能较好,精度较高。  相似文献   

5.
基于矩阵的模糊关联规则挖掘算法及其应用研究   总被引:1,自引:0,他引:1  
针对布尔型关联规则不能表达挖掘对象中模糊信息的关联性,给出了一系列有关模糊关联规则的定义,并提出了一种基于矩阵结构的模糊关联规则数据挖掘算法(FARMBM).该算法通过构造矩阵结构来压缩存储模糊模式候选集和频繁集,有效节约了存储模糊模式候选集和模糊模式频繁集内存花销,只需扫描数据库两遍,且可以有效减少系统的I/O开销.这里把FARMBM运用到入侵检测的仿真实验中,实验结果表明,该算法是有效的.  相似文献   

6.
遗传算法在Web关联挖掘中的应用研究   总被引:3,自引:1,他引:2  
关联规则是描述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。文章提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。  相似文献   

7.
针对传统关联规则挖掘中可能会忽略具有时间因素的关联规则的问题,提出了一种具有时间约束的改进时态关联规则算法.该算法通过计算模式平均支持度、数据集平均支持度、模式集中度等参数来判断Apriori算法所得到的模式是否在某一时间区域数据集上具有较高支持度,再对该数据集进行进一步挖掘,以找到更精确的和时间相关的模式,从而得到单个或不同时间区间上的关联规则以及跨时间区间和跨事务的关联规则.通过实验分析,该算法是可行的,并在实际应用中有一定的意义.  相似文献   

8.
关联分析研究的进展   总被引:1,自引:1,他引:0  
关联规则的发现是数据挖掘的一个重要方面,由于信息数据的急剧增长,面对浩如烟海的海量数据,为把这些数据转换成被人类充分利用的有价值信息,对关联规则挖掘算法进行研究就显得异常重要。总结了当今各种关联规则挖掘算法并对其加以分类,阐述了各类关联规则算法的特点,列举算法之间的差异,在时间和空间上进行比较,并且在此基础上对关联规则挖掘的未来趋势进行了分析和展望。  相似文献   

9.
网络数据通常以爆炸式的聚集形式出现,导致曾提出的关联规则挖掘方法挖掘性能不好。基于上述原因,提出一种关联规则中基于模糊遗传算法的挖掘方法,此方法通过构建挖掘模型,将关联规则与模糊遗传算法融合在一起,进而给出待挖掘数据的适应度函数,并使用阈值对其进行限制。模糊遗传算法将对适应度函数进行交叉分配和编译分配,以改进方法的隶属度线性状态,获取更为有效的挖掘结果。实验结果表明,改进后的方法挖掘稳定性较强,挖掘精度较高,且挖掘时间较少。  相似文献   

10.
郑海东  王凯丽 《电子工程师》2011,37(4):36-37,41
关联规则挖掘是数据挖掘研究的一个重要分支,其目的是为了发现大量数据中项目集之间感兴趣的相关性信息。经过十余年的发展,关联规则挖掘已经成为数据挖掘技术中较为成熟并很重要的一种方法,涉及到多种关联规则挖掘算法。文章重点介绍Apriori算法和FP—tree算法的基本思想、实现流程及其优缺点。  相似文献   

11.
多维关联规则是数据挖掘中的一个重要研究方向,由此提出了一种高效的多维关联规则挖掘算法,该方法通过引入MDPI-tree(多维谓词索引树)结构,有效地将数据立方体技术和频繁项集挖掘算法FP-Growth结合起来,能用于挖掘维间和混合维关联规则.最后将此算法应用于移动通信交叉销售模型,通过实验验证算法的有效性和实用性.  相似文献   

12.
数据挖掘是关联规则中一个重要的研究方向.对关联规则的数据挖掘和遗传算法进行概述,阐述关联规则数据挖掘的意义,提出一种采用改进型遗传算法的关联规则的提取算法,并从编码方法、适应度函数的构造和变异、选择、交叉算子设计方面进行讨论和分析,最后结合一个具体实例进行应用.实验证明这种算法是有效的.  相似文献   

13.
针对传统关联规则可视化挖掘方法不利于处理多值属性数据、缺乏展现数据间的频繁模式和关联模式以及效率低下等问题,提出了基于KAF因子和CHF因子的Apriori改进算法进行多值属性关联规则挖掘,实现了一种新的基于概念格的多值属性关联规则可视化方法.运用概念格理论对多值属性数据进行了重新定义和分类,建立了较为完整的挖掘过程参数调整策略,方便用户选择关键属性值进行规则挖掘分析,提高了算法运行速度和挖掘效率.以概念格结构将多值数据组织起来,实现了对频繁项集的可视化展示,以及关联规则的多模式可视化展示.实验结果表明,改进后的挖掘算法具有更好的性能,所提出的可视化形式和已有成果相比具有良好的展现效果.  相似文献   

14.
李存进  孙红 《电子科技》2019,32(12):58-63
针对传统的关联规则在大数据环境下数据挖掘过程中效率低的问题,文中融入了遗传算法,并且对传统的遗传算法进行优化以便更好地适用于关联规则的挖掘。针对传统的自适应遗传算法,对其交叉算子和变异算子进行自适应优化,在此基础上加入兴趣度用来剔除一些没有实际效果的规则。实验结果表明在关联规则提取方面,结合云计算技术和所改进的算法可以优化其挖掘效率,并克服适应性和可用性等方面的缺陷,不仅加快了算法的收敛速度,也提高了解的质量。  相似文献   

15.
关联规则在电子商务推荐系统中的应用   总被引:1,自引:0,他引:1  
王江伟  郭民 《现代电子技术》2011,34(19):179-182
以数据挖掘中的关联规则为基础,深入研究了基于关联规则的个性化推荐技术在电子商务中的应用,提出了电子商务推荐系统的体系结构,并对系统涉及到的关键技术进行了详细的描述.系统采用FP-Growth算法进行关联规则的挖掘,紧紧结合了数据库技术的优势,对当前电子商务系统中大量复杂的数据具有很好的适应性.  相似文献   

16.
基于数据挖掘的电网故障关联性分析与研究   总被引:1,自引:1,他引:0  
将数据挖掘技术中的关联规则应用到电网故障分析中,从故障数据中发现分类属性与决策属性间的频繁模式、相关性或因果关系,以便从宏观上把握电网故障元素间的关联特性.讨论了关联规则应用于电网故障分析的体系结构及实现的具体步骤,重点对电网故障关联性分析中的频繁项挖掘算法进行了研究,对传统的Apriori算法进行了改进,提出了一种高效的基于数组的类频繁项集挖掘算法.  相似文献   

17.
At present, most of the association rules algorithms are based on the Boolean attribute and single-level association rules mining. But data of the real world has various types, the multi-level and quantitative attributes are got more and more attention. And the most important step is to mine frequent sets. In this paper, we propose an algorithm that is called fuzzy multiple-level association (FMA) rules to mine frequent sets. It is based on the improved Eclat algorithm that is different to many researchers’ proposed algorithms that used the Apriori algorithm. We analyze quantitative data’s frequent sets by using the fuzzy theory, dividing the hierarchy of concept and softening the boundary of attributes’ values and frequency. In this paper, we use the vertical-style data and the improved Eclat algorithm to describe the proposed method, we use this algorithm to analyze the data of Beijing logistics route. Experiments show that the algorithm has a good performance, it has better effectiveness and high efficiency.  相似文献   

18.
时态约束下的数据挖掘问题及算法   总被引:6,自引:0,他引:6       下载免费PDF全文
毛国君  刘椿年 《电子学报》2003,31(11):1690-1694
对于一个大型数据库而言,为了提高挖掘效率,必须考虑减少数据库的扫描次数,同时使内存需求量保持在一个适当的水平上.把时态约束应用到事务数据库的挖掘中,可以获得更好的效率.本文首先利用时态区间代数操作实现原始数据库的过滤和挖掘时态区间的合并;然后在定义项目序列集操作的基础上,提出一个称为TISS-DM的发现频繁项目序列集的高效算法;最后讨论了这个算法的效率.  相似文献   

19.
As data mining more and more popular applied in computer system, the quality assurance test of its software would be get more and more attention. However, because of the existence of the ‘oracle’ problem, the traditional test method is not ease fit for the application program in the field of the data mining. In this paper, based on metamorphic testing, a software testing method is proposed in the field of the data mining, makes an association rules algorithm as the specific case, and constructs the metamorphic relation on the algorithm. Experiences show that the method can achieve the testing target and is feasible to apply to other domain.  相似文献   

20.
关联规则挖掘是数据挖掘和知识发现中一门重要技术,但基于支持度-置信度框架的关联规则挖掘存在一些问题。文章引入了双向关联规则的概念,实现了基于遗传算法的双向关联规则挖掘算法。实验证明,它能弥补传统关联规则挖掘算法的不足。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号