首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
赵晓霞 《现代电子技术》2007,30(22):197-199
粗糙集理论中,属性的离散化是预处理中的关键问题。基于新聚类学习算法提出了一种新的属性离散化方法,并将该方法用于车牌字符识别中。首先根据车牌字符的特征建立决策表,给出了基于新聚类学习算法对决策表属性值进行离散化的算法。然后应用粗糙集理论对离散后的决策表属性进行约简,由约简后的属性构造神经网络识别器。字符识别的结果分析表明基于新聚类学习方法的离散化算法对于车牌字符属性较为适用。  相似文献   

2.
文中主要研究了粗糙集理论在空间数据分类中的应用。在空间数据分类的同时考虑了数据的空间属性和非空间属性,并提出了一种新的基于Rough集理论的决策表离散化算法。由于空间数据对象的属性受其附近的其他空间对象的影响,所以在进行基于空间数据库的数据分类时应该考虑到这种影响。文中首先对空间数据进行预处理,在其属性表中添加空间属性信息,然后使用粗糙集理论处理扩展后的属性表,对其进行数值型数据的离散化、属性表的属性约简和值约简等操作,最终生成分类规则。  相似文献   

3.
连续属性离散化是粗糙集理论的重要研究内容之一。将差别矩阵应用到连续属性离散化中,充分利用差别矩阵的优点,提出一种基于差别矩阵的粗糙集连续属性离散化算法。为使差别矩阵适应离散化应用中的需要,给出了粗糙集连续属性离散化中差别矩阵的定义。基于该差别矩阵,以候选断点在差别矩阵中的出现频率和断点重要性为启发式信息,对差别矩阵进行化简,直到该差别矩阵为空,即得到所求结果断点,以实现对决策表的离散化,并通过实例证明了该算法的高效性。  相似文献   

4.
相比于经典粗糙集方法,模糊粗糙集方法避免了数据离散化的过程,减少了信息损失。但基于传统模糊粗糙集的属性约简并未考虑实际应用中数据的测试代价,为解决这一问题,提出了一种近似质量与测试代价相融合的适应度函数,并利用遗传算法以求得具有较小测试代价的约简。最后,采用UCI中的8组数据集对基于新适应度函数的遗传算法与经典的启发式算法进行对比分析,实验结果表明,遗传算法相较于启发式算法能够在保证近似质量不发生明显变化的情况下获得具有较低测试代价的约简。  相似文献   

5.
连续数据离散化能够提高数据挖掘算法的分类能力.文中提出一种基于统计指标的连续属性离散化方法,凭借相关系数衡量类与属性间的关联度,获取最优区间列表.引入变精度粗糙集模型,有效地控制数据由离散化导致的信息丢失.该方法在声纳传感器数据识别以及其它领域上进行了应用.实验结果表明,该方法在J48决策树上有很好的分类能力.  相似文献   

6.
遗传算法在决策系统离散化中的应用   总被引:9,自引:0,他引:9  
离散化在粗糙集的实际应用中有重要的意义,它使得粗糙集有更广泛的应用范围,粗糙集中的离散化要求在保持原来决策系统的不可分辩关系情况下,用尽量少的断点进行离散化,文章针对该问题提出了一种遗传算法,将最小断点集作为优化目标,同时兼顾一致性的要求,最后对实例进行了求解,证明该算法是有效的。  相似文献   

7.
为解决经典粗糙集理论在处理决策表离散化时规则数多、准确率低的问题,文中提出基于贪心算法和属性值分布率相结合的二次离散化方法.与目前很多离散方法不考虑决策相容性相比,该方法能够最大限度地保留系统的有用信息.通过实验验证了该方法的有效性.  相似文献   

8.
《现代电子技术》2016,(7):115-119
针对传统数据挖掘算法在数据量级方面的局限性,提出在粗糙集理论的基础上,采用类分布链表结构改进传统的基于属性重要性的数据离散化算法、属性约简算法以及基于启发式的值约简算法。讨论了基于动态聚类的两步离散化算法,当算法适应大数据处理之后,采用并行计算的方法提高算法的执行效率。算法测试结果表明,改进算法能有效地处理大数据量,同时并行计算解决了大数据量处理带来的效率问题。  相似文献   

9.
智能家居的关键在于在不需要用户干预的条件下,针对不同的用户生成个性化的服务规则。用户习惯的主观性造成了服务规则不能预先定义,需要在家居系统运行过程中提取。粗糙集是一种处理不完备信息的工具,适合在大量复杂数据中发现潜在规律。把智能家居看成是一个状态驱动的环境,建立状态控制的家居控制系统平台,同时提出了一种基于粗糙集的智能家居个性化规则提取方法,把家庭历史状态记录看作挖掘对象,对状态值进行离散化,通过属性约简,找出影响决策的关键因素,再进行值约简,得出决策规则。智能家居实验室的实验表明,该种方法具有实用价值。  相似文献   

10.
针对传统数据挖掘算法在数据量级方面的局限性,提出在粗糙集理论的基础上,采用类分布链表结构改进传统的基于属性重要性的数据离散化算法、属性约简算法以及基于启发式的值约简算法;讨论了基于动态聚类的两步离散化算法,当算法适应大数据处理之后,采用并行计算的方法提高算法的执行效率。算法测试结果表明改进的算法能有效地处理大数据量,同时并行计算解决了大数据量处理带来的效率问题。  相似文献   

11.
在案例推理系统中,属性的选择和约简是影响系统案例匹配效率的关键因素。粗糙集能够在保持案例集分类能力不变的基础上,对属性进行约简。然而,粗糙集在处理连续型数据时的离散化过程会带来信息损失。为此,提出了一种基于相容关系的案例特征属性优化方法。文中介绍了粗糙集中基于依赖度的属性约简原理,完善了相容粗糙集中相容关系的确定方法,并给出相容粗糙集可用于属性约简的定理。最后,用实例表明该方法的有效性。  相似文献   

12.
基于粗糙集和遗传算法的知识发现方法   总被引:4,自引:0,他引:4  
粗糙集理论是一种处理不确定和不精确问题的新型数学工具,为数据挖掘提供了一条崭新的途径。提出了结合粗糙集理论和遗传算法的知识发现方法。首先通过粗糙集理论对数据进行预处理,在实现属性约简中采用了遗传算法,以提高搜索效率,然后进行规则提取。以农业病虫害诊断知识发现应用为实例说明了该方法的可行性。  相似文献   

13.
粗糙集理论中一种连续属性离散化算法   总被引:4,自引:3,他引:4  
连续属性离散化一直是机器学习领域中亟待解决的关键问题之一。提出一种基于断点重要性的离散化算法。首先给出粗糙集理论的几个基本概念:决策表、不可分辨关系、信息熵和条件熵,然后对离散化问题进行介绍,给出断点分类的条件熵定义,在此基础上给出了断点选择的粗糙集连续属性离散化算法。仿真结果表明,算法的综合性能优越于文献报道的同类算法。  相似文献   

14.
李晶莹  钟子发  范瑞星 《通信技术》2009,42(11):104-107
针对通信对抗系统多传感器侦察数据仓库中数据量大且不完整、不准确的特点,文中提出了一种基于粗糙集理论进行初级融合处理的方法。该方法利用粗糙集知识分类的功能对海量数据进行层层处理,去除冗余信息提高参数精度。仿真分析结果表明,这种算法能为进一步融合处理提供条件,在通信对抗情报分析中有很高的工程应用价值。  相似文献   

15.
《现代电子技术》2017,(4):28-31
传统方法在对公共网络入侵数据检测时存在冗余度高、维数大、精确度差等问题。为了提高公共网络安全防护的实时性和有效性,提出一种基于优化粗糙集理论的公共网络检测方法。针对有入侵风险的数据进行检测和筛选,在粗糙集(RS)概念基础上对其精度进行优化,减少信息的丢失,运用MDLP运算准则完成对数据的离散化处理,使用遗传算法进行数据约简,导出数据分类规则并识别出入侵数据。仿真试验结果表明,所提出的入侵数据检测方法,在入侵检测率和误差率方面传统算法更为有效。  相似文献   

16.
王健  邱剑 《信息技术》2009,(7):131-134
粗糙集理论是一种处理不确定和不完全数据的强有力数学工具,其主要思想是在保持分类能力不变的前提下,通过数据约简得出问题的决策或分类规则.目前,粗糙集理论已成功地应用于机器学习、决策分析、过程控制、数据挖掘等领域,是当前人工智能领域研究热点之一.现介绍了粗糙集理论及其应用的国内外研究现状,总结了主要研究方法,最后指出了粗糙集理论及其应用所面临的主要问题.  相似文献   

17.
提出了一种标准粗糙集约简时连续属性离散化的新方法.采用标准粗糙集进行属性约简时,要求属性为离散的,而大多数情况下属性是连续的,因此需要进行离散化处理.首先介绍了原有的信息熵算法并指出其局限性;其次,对多类别信息熵进行扩充,将距离因素引入到该信息熵的计算中;最后给出了扩展信息熵计算的两个基本准则,利用证据理论完成信度的上聚焦.仿真显示了该方法的有效性.  相似文献   

18.
由于电力大数据背景下电网设备监测数据具有体量大、种类多、产生速度快、精度高等特点,传统的连续属性离散化方法已经无法满足高效处理的要求。为了对电网设备监测大数据进行有效的数据预处理,本研究利用Map Reduce框架对基于似然比假设检验的连续属性离散化方法进行了并行化改进。最后,在Hadoop平台上对变电设备监测数据进行属性离散化,实验结果证明改进后的离散化方法可靠有效,适合当前电力大数据背景下的数据预处理。  相似文献   

19.
粗糙集理论是一种新的软计算方法,能效处理和分析不完备息。文章讲述了粗糙集理论的基本知识和相关算法,分析了粗糙集理论的相关应用,分析了粗糙集理论方法研究中的问题,并对粗糙集理论的发展进行了展望。  相似文献   

20.
针对油浸式变压器故障诊断中信息伴随着随机性、复杂性和不确定性的特点,为了获得更高的诊断率,提出了粗糙集和贝叶斯网络组合诊断模型。在处理不确定性问题方面贝叶斯网络能力很强,粗糙集对离散后的条件属性约简去除冗余信息得到最简决策表后作为贝叶斯网络分类模型的输入,降低了网络结构的复杂性和减少了获取故障属性的难度。对搜集到的数据进行对比测试表明其诊断效果要比单独使用粗糙集或贝叶斯网络分类器的方法更优。最后采用具体的变压器故障实例来测试该方法的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号