共查询到18条相似文献,搜索用时 97 毫秒
1.
文中研究一种如何有效挖掘含有未知数值属性的多属性数据关联规则方法。对FPL算法进行了改进,扫描一次数据库,就可以找出所有频繁项集,且当最小支持度变动时,不需重新构建FPL,能快速找出所有频繁项集。 相似文献
2.
很多数据挖掘和机器学习方法仅仅依赖于离散值的属性,这样必须离散连续的属性.文中提出一种基于信息熵理论的数据离散化方法(IED),利用信息熵的思想衡量离散区间是否类似,同时考虑离散区间大小对离散化结果的影响,该方法综合考虑了离散区间与类之间的独立性.实验结果表明,IED显著地提高了Na ve-bayes分类学习精度. 相似文献
3.
由于电力大数据背景下电网设备监测数据具有体量大、种类多、产生速度快、精度高等特点,传统的连续属性离散化方法已经无法满足高效处理的要求。为了对电网设备监测大数据进行有效的数据预处理,本研究利用Map Reduce框架对基于似然比假设检验的连续属性离散化方法进行了并行化改进。最后,在Hadoop平台上对变电设备监测数据进行属性离散化,实验结果证明改进后的离散化方法可靠有效,适合当前电力大数据背景下的数据预处理。 相似文献
4.
5.
6.
为解决经典粗糙集理论在处理决策表离散化时规则数多、准确率低的问题,文中提出基于贪心算法和属性值分布率相结合的二次离散化方法.与目前很多离散方法不考虑决策相容性相比,该方法能够最大限度地保留系统的有用信息.通过实验验证了该方法的有效性. 相似文献
7.
陈浩 《微电子学与计算机》2011,28(11):106-109
连续数据离散化能够提高数据挖掘算法的分类能力.文中提出一种基于统计指标的连续属性离散化方法,凭借相关系数衡量类与属性间的关联度,获取最优区间列表.引入变精度粗糙集模型,有效地控制数据由离散化导致的信息丢失.该方法在声纳传感器数据识别以及其它领域上进行了应用.实验结果表明,该方法在J48决策树上有很好的分类能力. 相似文献
8.
粗糙集理论中,属性的离散化是预处理中的关键问题。基于新聚类学习算法提出了一种新的属性离散化方法,并将该方法用于车牌字符识别中。首先根据车牌字符的特征建立决策表,给出了基于新聚类学习算法对决策表属性值进行离散化的算法。然后应用粗糙集理论对离散后的决策表属性进行约简,由约简后的属性构造神经网络识别器。字符识别的结果分析表明基于新聚类学习方法的离散化算法对于车牌字符属性较为适用。 相似文献
9.
关联规则是Web挖掘中一个重要的研究领域。为了挖掘出隐藏在数据间的相互关系,将关联规则的概念引入到Web挖掘系统中,把用户的访问路径以关联规则的形式表现出来。基于Apriori算法的思想,给出了适合Web挖掘用户访问的新Apriori算法规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。 相似文献
10.
本文提出了改进关联挖掘算法的数据挖掘方式.在自然连接产生候选集以前,先进行一个修剪过程,减少参加连接的项集数量,进而减小生成的候选项集规模,减少了循环迭代次数和运行时间,同时在连接判断步骤中减少多余的判断次数,避免传统方法的弊端.仿真实验证明,这种改进算法能够大幅提高数据的查询速度,取得很好的效果. 相似文献
11.
提出了一个快速有效的增量更新挖掘多层关联规则算法MLARU,其基本思想是通过数据库和Web日志构建概念层次树,采用区间支持度的方法表示交叉层次的项集支持度,并采用根据层次树剪枝和增量更新的方法来挖掘多层关联规则。实验结果表明,该算法的效率得到了很好的改善,能在线为用户动态提供多层次个性化推荐。 相似文献
12.
通过对入侵检测和数据挖掘技术的研究,分析了数据挖掘技术在入侵检测系统中的应用。针对入侵检测领域特点,对经典关联、聚类算法进行了改进和优化。对k-means算法的改进解决了聚类算法固有的无法预知最佳聚类个数和分类过细的问题。 相似文献
13.
孤立点检测是数据挖掘的重要研究方向之一,目标是发现数据集中不具备数据一般特性的数据对象.通过挖掘数据属性间内在的数量关联规则,标记产生的弱关联规则中置信度小于阈值的极小概率事件为孤立点,提出了一种基于数量关联的离群点检测算法.实例表明,算法能够有效检测数据集中的孤立点,具有应用价值. 相似文献
14.
基于关联规则的电子病历挖掘算法研究与应用 总被引:5,自引:0,他引:5
采用了一种改进的关联规则快速挖掘算法——FG算法,该算法不需要查找频繁项集.可直接求出所有的无冗余的关联规则。基于电子病历系统历史数据,建立数据仓库,进行了FG关联规则挖掘算法的实验。结果表明该算法优于其他算法,能提取隐含在电子病历系统中未知的有用的信息,为医疗诊断能提供辅助性的决策。 相似文献
15.
16.
关联规则挖掘与分类规则挖掘的区别和联系 总被引:1,自引:0,他引:1
关联规则挖掘与分类规则挖掘是数据挖掘领域中的重要技术。文中首先简要介绍了关联规则挖掘和分类规则挖掘的基本知识,主要从挖掘目的、发现规则算法的方法及算法的设计思想等几个方面进行比较,最后介绍了它们之间的联系。 相似文献
17.
将数据挖掘技术中的关联规则应用到电网故障分析中,从故障数据中发现分类属性与决策属性间的频繁模式、相关性或因果关系,以便从宏观上把握电网故障元素间的关联特性.讨论了关联规则应用于电网故障分析的体系结构及实现的具体步骤,重点对电网故障关联性分析中的频繁项挖掘算法进行了研究,对传统的Apriori算法进行了改进,提出了一种高效的基于数组的类频繁项集挖掘算法. 相似文献