首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
连续属性离散化是Rough集理论应用中面临的主要问题之一.提出了一种基于的Rough集连续属性离散化方法.首先提出主泛化决策等概念,在数据过滤方法的基础上,利用等价类的合并对属性离散化.实验表明,利用该方法对数据进行离散预处理后提取的规则具有较好的分类预测准确性.  相似文献   

2.
一种实值属性信息系统的粗集约简方法   总被引:2,自引:0,他引:2  
本文研究应用粗集理论对实值信息系统属性进行约简的方法,对实值属性信息系统进行约简的根本问题是如何对实值属性离散化,通过对离散化方法与属性约简的关系进行研究,提出实值属性离散化的一种自动确定属性类别的方法,并结合粗集理论给出了对实值属性信息系统约简的算法,用所提出的算法进行了实验,并给出了实验结果。  相似文献   

3.
离散化与属性约简相结合算法及Delphi实现   总被引:1,自引:0,他引:1       下载免费PDF全文
主要对Rough Set理论中的离散化问题进行了研究,提出了基于属性值重要性的离散化算法,利用文献[5]中不可分辩类的定义、属性重要性的讨论及属性约简的启发式算法,得到了一种离散化与属性约简相结合的启发式算法,并通过Delphi程序验证了该算法对UCI数据库的有效性。  相似文献   

4.
粗集理论可以通过不可分辨关系发现问题的内在规律,而通常情况下,随机采集得到数据集合中的连续属性值、缺失值、冗余属性等是普遍存在的。文章重点研究了粗集理论应用中属性离散化及缺失值处理、属性重要性计算等典型方法和特点,便于进一步优化和改进属性约简算法效率。  相似文献   

5.
一种新的用于连续值属性离散化的约简算法   总被引:4,自引:0,他引:4  
针对在Nguyen和Skowron的离散化算法中进行启发式约简时会出现某些属性不能进行离散化问题,以及在无核数据集中启发式约简算法计算量比较大等问题,在粗糙集理论和属性频率函数的基础上给出一个新概念-候选核,并提出一种新的用于连续值属性离散化的约简算法-基于候选核的启发式约简算法(简称BCC)。该算法可以寻找到能对所有属性进行离散化的约简,实验表明,所提出的BCC算法能提高大数据集的离散化效果。  相似文献   

6.
基于属性集值不完备信息系统的Rough集方法   总被引:5,自引:0,他引:5  
论文使用基于一般关系的Rough集理论和方法,研究了具有“属性集值”的不完备信息系统。通过研究由属性集值产生的不完备信息系统上的三种基本关系相容关系、非对称相似关系和拟序关系,建立了相应Rough近似集合的某种“单调”关系。在此基础上,讨论了系统属性约简及其实现算法。  相似文献   

7.
目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾,针对粗糙集给出了基于逐级均值聚类的信息熵的离散化算法。首先使用改进的逐级均值聚类算法分别对单个属性的候选断点按其信息熵值进行聚类分析,生成新的规模更小的候选断点集,然后用基于信息熵的离散化算法完成断点的选取并对连续值属性进行离散化。实验结果表明,该方法在识别率相当的情况下比传统的离散化方法的时间代价更低。  相似文献   

8.
李艳  范斌  郭劼 《计算机应用》2022,42(9):2701-2712
属性约简是粗糙集理论中的研究热点,对连续值数据进行属性约简的算法大多基于优势关系或邻域关系。然而连续值数据集的属性不一定具有优势关系;而基于邻域关系的属性约简算法虽然可以通过邻域半径调整粒化程度,不过由于各属性量纲不同且半径参数为连续值使半径难以统一,导致整个参数粒化过程计算量较大。为解决此问题,提出一种基于聚类粒化的多粒度属性约简策略。首先,利用聚类方法将相似样本归类,并提出了基于聚类的近似集、相对正域及正域约简概念;其次,根据JS(Jensen-Shannon)散度理论对簇间各属性数据分布进行差异性度量,并选择出具有代表性的特征用以区分不同类簇;最后,利用可辨识矩阵设计了属性约简算法。所提算法不要求属性具有序关系,且不同于邻域半径,聚类参数为离散值,调节此参数就能够对数据集形成不同粒化程度的划分。在UCI与Kent Ridge数据集上进行的实验结果表明,该属性约简算法可以直接处理连续值数据,且该算法在较小范围内离散地调节聚类参数便能在保持甚至提高分类精度的前提下去除数据集中的冗余特征。  相似文献   

9.
连续属性信息系统的规则约简根本问题是属性在连续范围取任何实值,使得应用与离散属性的规则约简方法难于使用。因此解决连续属性信息系统的规则约简问题为当前研究领域所关注。该文结合粗集与模糊集理论与方法提出了一种新的数据处理与规则约简方法,并给出了该方法的实验结果。  相似文献   

10.
针对现有判定树算法在处理空缺值和连续值以及知识表达上不精确性和复杂性问题,提出基于云变换和Rough扩展模型的判定树构造算法。该算法利用云变换来离散化连续属性,然后根据概念集,采用极大判定法对每个数值型属性的原始属性值进行软划分,从而得到离散属性值。最后利用特性关系下的加权平均粗糙度来选取当前结点的分裂属性来递归生成判定树。与C5.0算法相比,新算法可妥善处理空缺值、合理离散连续属性。试验结果表明,该算法具有良好的实用性。  相似文献   

11.
连续值属性决策表中的可变精度粗糙集模型及属性约简   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究的一个核心问题.为了有效地处理决策表中连续值属性约简,提出了连续值属性决策表中的可变精度粗糙集模型以及基于此模型的连续值属性约简算法.仿真实验结果表明,该算法可以对连续值属性进行约简,而且比经典粗糙集相关方法在处理连续值属性约简方面更有效.  相似文献   

12.
实值信息系统是连续值信息系统的广义形式,其属性值是实际问题反映出来的真实数据。通过在实值信息系统上定义一种相容关系,主要讨论了这种关系下实值信息系统与实值决策表基于粗糙集理论的属性约简,给出了区分函数的定义与约简的判定定理,得到了计算约简的具体方法,并将所得结论用于无线电信号数据分析处理上。  相似文献   

13.
皋军  王建东 《计算机应用》2004,24(2):135-137
在数据挖掘研究过程中,对连续型属性一般要进行离散化。特别是在模糊数据挖掘中,还要对离散化的区间进行模糊处理。文中依托云模式,并结合粗糙集理论提出一种新的连续型属性离散化算法。  相似文献   

14.
一种基于一致性准则的属性约简算法   总被引:3,自引:0,他引:3  
粗糙集方法提供了一种新的处理不精确、不完全与不相容知识的数学工具.属性约简是粗糙集理论的重要研究内容之一,已有的大多数属性约简算法主要针对离散值属性的约简,面向连续值属性的约简报道较少.为此,在引入新的对象一致性定义后,提出一种新的基于一致性准则的属性约简模型,该模型可针对离散或连续值属性进行有效的约简,是经典粗糙集属性约简模型的有效推广.依据新模型,提出了一种基于一致性准则的属性约简算法,该算法可有效进行连续值属性的约简,且通过错分对象数的控制可有效增强属性约简的有效性.理论分析和实验表明提出的算法是有效可行的.  相似文献   

15.
基于广义差别矩阵的核和属性约简算法   总被引:13,自引:1,他引:12  
属性约简是粗糙集理论的重要研究内容.为此引入广义差别矩阵,提出基于广义差别矩阵的核和属性约简算法.该框架可有效避免连续属性值离散化,且有利于与其他机器学习方法相结合.理论分析表明,所提出的算法是有效而可行的.  相似文献   

16.
基于二进制粒子群优化的决策系统属性离散化   总被引:1,自引:0,他引:1  
为解决连续属性无法直接用于粗糙集理论的问题,依据粗糙集连续属性离散化的根本要求,提出了一种基于二进制粒子群优化算法(Binary Particle Swarm Optimization,BinaryPSO)的属性离散化方法。该方法将二进制粒子视为断点子集,最小化断点集中的断点个数作为优化目标,粗糙集属性分类精度作为约束条件。其中,适应函数的定义保证了在尽量减少决策系统信息损失的前提下,得到简化的决策系统。仿真结果表明,该方法得到的离散结果包含较少的断点个数,并且保持了较高的分类能力。  相似文献   

17.
基于容错粗集理论的知识约简   总被引:1,自引:0,他引:1  
粗集理论(RoughSetsTheory,RST)在处理不完全、不精确、不确定性智能信息问题等许多领域已取得成功的应用。然而RST理论还存在某些局限性,比如对等价关系的定义使得知识约简相对复杂化。该文提出利用容错粗集犤1犦RST的概念,建立属性值之间的容错关系,用容错关系对对象进行分类。该方法首先采用遗传算法求出属性阈值的最优组合,然后分别建立属性和对象的特殊矩阵,最后求出属性的相对约简和对象的相对商集。采用容错粗集进行知识约简减少了量化的过程,从而提高知识约简的有效性。该文最后提供了一个实例表明该方法是可行的。  相似文献   

18.
近年来,人们越来越关注粗糙集中的属性约简算法,尤其是启发式的约简算法。为了度量属性重要度,人们把各种不同的信息熵模型应用到粗糙集中,同时在信息熵这一理论的基础上得出了许多约简算法,用来解决粗糙集中属性约简的问题。然而,现有的基于信息熵的方法还存在一系列问题。针对这些问题,本文首先将知识粒度与相对决策熵这2个概念结合在一起,从而引入一种新的信息熵模型--粒度决策熵;然后,利用粒度决策熵来度量属性的重要性,并由此得出新的约简算法--ARGDE约简算法;最后,用不同的UCI数据集来做实验,通过与已有的约简算法比较,该算法能够得到更好的实验结果。  相似文献   

19.
属性约简是粗糙集理论中的重要问题。许多学者针对邻域粗糙集提出多种属性约简方法,包括应用最为广泛的启发式算法。在多半径邻域粗糙集的基础上,针对当前启发式约简算法往往会包含一定冗余属性的缺陷,提出一种融合属性权重影响的改进约简运算方法,通过根据各属性权值大小设置阈值使得约简结果能够消除冗余属性。实验选取UCI的数据集与当前几种常用启发式约简算法进行比较分析。实验结果表明,所提出的属性约简方法能够得到更优的约简集合,同时更大程度地保留了决策表本身的知识信息,具有较高的分类能力。  相似文献   

20.
As one of the useful extensions of classical rough set approach, the dominance-based rough set approach has been successfully applied into multi-criteria decision problems. However, the traditional dominance-based rough set approach is only suitable for the condition attributes, which are positively related with classification analysis. To solve this problem, we propose an extension of the dominance-based rough set approach in incomplete information system by assuming the condition attributes, which are not only positively but also negatively related with classification analysis. Furthermore, by considering the existence of unknown values in incomplete information system, we present the concept of valued dominance relation, which shows the probability of an object is dominating another one with respect to the condition attributes. By using the valued dominance relation, the fuzzy dominance-based rough set models are also studied. A numerical example is employed to substantiate the conceptual arguments. The text was submitted in English by the authors.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号