首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 97 毫秒
1.
文中研究一种如何有效挖掘含有未知数值属性的多属性数据关联规则方法。对FPL算法进行了改进,扫描一次数据库,就可以找出所有频繁项集,且当最小支持度变动时,不需重新构建FPL,能快速找出所有频繁项集。  相似文献   

2.
很多数据挖掘和机器学习方法仅仅依赖于离散值的属性,这样必须离散连续的属性.文中提出一种基于信息熵理论的数据离散化方法(IED),利用信息熵的思想衡量离散区间是否类似,同时考虑离散区间大小对离散化结果的影响,该方法综合考虑了离散区间与类之间的独立性.实验结果表明,IED显著地提高了Na ve-bayes分类学习精度.  相似文献   

3.
由于电力大数据背景下电网设备监测数据具有体量大、种类多、产生速度快、精度高等特点,传统的连续属性离散化方法已经无法满足高效处理的要求。为了对电网设备监测大数据进行有效的数据预处理,本研究利用Map Reduce框架对基于似然比假设检验的连续属性离散化方法进行了并行化改进。最后,在Hadoop平台上对变电设备监测数据进行属性离散化,实验结果证明改进后的离散化方法可靠有效,适合当前电力大数据背景下的数据预处理。  相似文献   

4.
谢静  张健沛  杨静  张冰 《通信学报》2015,36(4):97-104
提出一种面向近邻泄露的数值型敏感属性隐私保护方法,该方法首先在保护准标识符属性和数值型敏感属性内在关系的前提下,将数值型敏感属性进行离散化划分;然后,提出一种面向近邻泄露的隐私保护原则——(k, ε)- proximity;最后,设计了最大邻域优先算法MNF(maximal neighborhood first)来实现该原则。实验结果表明,提出的方法能在有效保护数值型敏感信息不泄露的同时保持较高的数据效用,并且保护了数据间的关系。  相似文献   

5.
提出了一种标准粗糙集约简时连续属性离散化的新方法.采用标准粗糙集进行属性约简时,要求属性为离散的,而大多数情况下属性是连续的,因此需要进行离散化处理.首先介绍了原有的信息熵算法并指出其局限性;其次,对多类别信息熵进行扩充,将距离因素引入到该信息熵的计算中;最后给出了扩展信息熵计算的两个基本准则,利用证据理论完成信度的上聚焦.仿真显示了该方法的有效性.  相似文献   

6.
为解决经典粗糙集理论在处理决策表离散化时规则数多、准确率低的问题,文中提出基于贪心算法和属性值分布率相结合的二次离散化方法.与目前很多离散方法不考虑决策相容性相比,该方法能够最大限度地保留系统的有用信息.通过实验验证了该方法的有效性.  相似文献   

7.
连续数据离散化能够提高数据挖掘算法的分类能力.文中提出一种基于统计指标的连续属性离散化方法,凭借相关系数衡量类与属性间的关联度,获取最优区间列表.引入变精度粗糙集模型,有效地控制数据由离散化导致的信息丢失.该方法在声纳传感器数据识别以及其它领域上进行了应用.实验结果表明,该方法在J48决策树上有很好的分类能力.  相似文献   

8.
赵晓霞 《现代电子技术》2007,30(22):197-199
粗糙集理论中,属性的离散化是预处理中的关键问题。基于新聚类学习算法提出了一种新的属性离散化方法,并将该方法用于车牌字符识别中。首先根据车牌字符的特征建立决策表,给出了基于新聚类学习算法对决策表属性值进行离散化的算法。然后应用粗糙集理论对离散后的决策表属性进行约简,由约简后的属性构造神经网络识别器。字符识别的结果分析表明基于新聚类学习方法的离散化算法对于车牌字符属性较为适用。  相似文献   

9.
关联规则是Web挖掘中一个重要的研究领域。为了挖掘出隐藏在数据间的相互关系,将关联规则的概念引入到Web挖掘系统中,把用户的访问路径以关联规则的形式表现出来。基于Apriori算法的思想,给出了适合Web挖掘用户访问的新Apriori算法规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。  相似文献   

10.
本文提出了改进关联挖掘算法的数据挖掘方式.在自然连接产生候选集以前,先进行一个修剪过程,减少参加连接的项集数量,进而减小生成的候选项集规模,减少了循环迭代次数和运行时间,同时在连接判断步骤中减少多余的判断次数,避免传统方法的弊端.仿真实验证明,这种改进算法能够大幅提高数据的查询速度,取得很好的效果.  相似文献   

11.
提出了一个快速有效的增量更新挖掘多层关联规则算法MLARU,其基本思想是通过数据库和Web日志构建概念层次树,采用区间支持度的方法表示交叉层次的项集支持度,并采用根据层次树剪枝和增量更新的方法来挖掘多层关联规则。实验结果表明,该算法的效率得到了很好的改善,能在线为用户动态提供多层次个性化推荐。  相似文献   

12.
关心  王新 《信息技术》2007,(10):100-103
通过对入侵检测和数据挖掘技术的研究,分析了数据挖掘技术在入侵检测系统中的应用。针对入侵检测领域特点,对经典关联、聚类算法进行了改进和优化。对k-means算法的改进解决了聚类算法固有的无法预知最佳聚类个数和分类过细的问题。  相似文献   

13.
孤立点检测是数据挖掘的重要研究方向之一,目标是发现数据集中不具备数据一般特性的数据对象.通过挖掘数据属性间内在的数量关联规则,标记产生的弱关联规则中置信度小于阈值的极小概率事件为孤立点,提出了一种基于数量关联的离群点检测算法.实例表明,算法能够有效检测数据集中的孤立点,具有应用价值.  相似文献   

14.
基于关联规则的电子病历挖掘算法研究与应用   总被引:5,自引:0,他引:5  
采用了一种改进的关联规则快速挖掘算法——FG算法,该算法不需要查找频繁项集.可直接求出所有的无冗余的关联规则。基于电子病历系统历史数据,建立数据仓库,进行了FG关联规则挖掘算法的实验。结果表明该算法优于其他算法,能提取隐含在电子病历系统中未知的有用的信息,为医疗诊断能提供辅助性的决策。  相似文献   

15.
一个保护私有信息的布尔关联规则挖掘算法   总被引:23,自引:2,他引:23  
本文基于随机响应技术,提出了一种在保护隐私的关联规则挖掘中对数据进行伪装的方法;设计了在伪装的数据集上进行挖掘的算法;分析了算法的效率.实验结果表明,该算法在伪装的数据集上挖掘出的规则与原始规则相比,相对误差不超过2%,并给出了使得相对误差最小时相关参数的取值.  相似文献   

16.
关联规则挖掘与分类规则挖掘的区别和联系   总被引:1,自引:0,他引:1  
彭慧伶  刘发升 《电子工程师》2006,32(7):52-54,79
关联规则挖掘与分类规则挖掘是数据挖掘领域中的重要技术。文中首先简要介绍了关联规则挖掘和分类规则挖掘的基本知识,主要从挖掘目的、发现规则算法的方法及算法的设计思想等几个方面进行比较,最后介绍了它们之间的联系。  相似文献   

17.
将数据挖掘技术中的关联规则应用到电网故障分析中,从故障数据中发现分类属性与决策属性间的频繁模式、相关性或因果关系,以便从宏观上把握电网故障元素间的关联特性.讨论了关联规则应用于电网故障分析的体系结构及实现的具体步骤,重点对电网故障关联性分析中的频繁项挖掘算法进行了研究,对传统的Apriori算法进行了改进,提出了一种高效的基于数组的类频繁项集挖掘算法.  相似文献   

18.
航空电子设备的复杂度、综合化程度越来越高,对故障的检测、故障的定位要求越来越高,基于关联规则的数据挖掘应用到产品故障的诊断中,通过多个故障现象推断出具体的故障点,提高了产品故障诊断的准确性,时效性.为产品故障的预测及故障的解决提供了决策的依据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号