共查询到20条相似文献,搜索用时 265 毫秒
1.
粗糙集理论中,属性的离散化是预处理中的关键问题。基于新聚类学习算法提出了一种新的属性离散化方法,并将该方法用于车牌字符识别中。首先根据车牌字符的特征建立决策表,给出了基于新聚类学习算法对决策表属性值进行离散化的算法。然后应用粗糙集理论对离散后的决策表属性进行约简,由约简后的属性构造神经网络识别器。字符识别的结果分析表明基于新聚类学习方法的离散化算法对于车牌字符属性较为适用。 相似文献
2.
3.
连续属性离散化是粗糙集理论的重要研究内容之一。将差别矩阵应用到连续属性离散化中,充分利用差别矩阵的优点,提出一种基于差别矩阵的粗糙集连续属性离散化算法。为使差别矩阵适应离散化应用中的需要,给出了粗糙集连续属性离散化中差别矩阵的定义。基于该差别矩阵,以候选断点在差别矩阵中的出现频率和断点重要性为启发式信息,对差别矩阵进行化简,直到该差别矩阵为空,即得到所求结果断点,以实现对决策表的离散化,并通过实例证明了该算法的高效性。 相似文献
4.
5.
陈浩 《微电子学与计算机》2011,28(11):106-109
连续数据离散化能够提高数据挖掘算法的分类能力.文中提出一种基于统计指标的连续属性离散化方法,凭借相关系数衡量类与属性间的关联度,获取最优区间列表.引入变精度粗糙集模型,有效地控制数据由离散化导致的信息丢失.该方法在声纳传感器数据识别以及其它领域上进行了应用.实验结果表明,该方法在J48决策树上有很好的分类能力. 相似文献
6.
遗传算法在决策系统离散化中的应用 总被引:9,自引:0,他引:9
离散化在粗糙集的实际应用中有重要的意义,它使得粗糙集有更广泛的应用范围,粗糙集中的离散化要求在保持原来决策系统的不可分辩关系情况下,用尽量少的断点进行离散化,文章针对该问题提出了一种遗传算法,将最小断点集作为优化目标,同时兼顾一致性的要求,最后对实例进行了求解,证明该算法是有效的。 相似文献
7.
为解决经典粗糙集理论在处理决策表离散化时规则数多、准确率低的问题,文中提出基于贪心算法和属性值分布率相结合的二次离散化方法.与目前很多离散方法不考虑决策相容性相比,该方法能够最大限度地保留系统的有用信息.通过实验验证了该方法的有效性. 相似文献
8.
9.
10.
11.
12.
13.
粗糙集理论中一种连续属性离散化算法 总被引:4,自引:3,他引:4
连续属性离散化一直是机器学习领域中亟待解决的关键问题之一。提出一种基于断点重要性的离散化算法。首先给出粗糙集理论的几个基本概念:决策表、不可分辨关系、信息熵和条件熵,然后对离散化问题进行介绍,给出断点分类的条件熵定义,在此基础上给出了断点选择的粗糙集连续属性离散化算法。仿真结果表明,算法的综合性能优越于文献报道的同类算法。 相似文献
14.
15.
16.
粗糙集理论是一种处理不确定和不完全数据的强有力数学工具,其主要思想是在保持分类能力不变的前提下,通过数据约简得出问题的决策或分类规则.目前,粗糙集理论已成功地应用于机器学习、决策分析、过程控制、数据挖掘等领域,是当前人工智能领域研究热点之一.现介绍了粗糙集理论及其应用的国内外研究现状,总结了主要研究方法,最后指出了粗糙集理论及其应用所面临的主要问题. 相似文献
17.
18.
由于电力大数据背景下电网设备监测数据具有体量大、种类多、产生速度快、精度高等特点,传统的连续属性离散化方法已经无法满足高效处理的要求。为了对电网设备监测大数据进行有效的数据预处理,本研究利用Map Reduce框架对基于似然比假设检验的连续属性离散化方法进行了并行化改进。最后,在Hadoop平台上对变电设备监测数据进行属性离散化,实验结果证明改进后的离散化方法可靠有效,适合当前电力大数据背景下的数据预处理。 相似文献
19.
20.
针对油浸式变压器故障诊断中信息伴随着随机性、复杂性和不确定性的特点,为了获得更高的诊断率,提出了粗糙集和贝叶斯网络组合诊断模型。在处理不确定性问题方面贝叶斯网络能力很强,粗糙集对离散后的条件属性约简去除冗余信息得到最简决策表后作为贝叶斯网络分类模型的输入,降低了网络结构的复杂性和减少了获取故障属性的难度。对搜集到的数据进行对比测试表明其诊断效果要比单独使用粗糙集或贝叶斯网络分类器的方法更优。最后采用具体的变压器故障实例来测试该方法的可行性。 相似文献