首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
2.
决策树是常用的数据挖掘方法,扩展属性的选择是决策树归纳的核心问题。基于离散化方法的连续值决策 树归纳在选择扩展属性时,需要度量每一个条件属性的每一个割点的分类不确定性,并通过这些割点的不确定性选择 扩展属性,其计算时间复杂度高。针对这一问题,提出了一种基于相容粗糙集技术的连续值属性决策树归纳方法。该 方法首先利用相容粗糙集技术选择扩展属性,然后找出该属性的最优割点,分割样例集并递归地构建决策树。从理论 上分析了该算法的计算时间复杂度,并在多个数据集上进行了实验。实验结果及对实验结果的统计分析均表明,提出 的方法在计算复杂度和分类精度方面均优于其他相关方法。  相似文献   

3.
In this paper, we propose some new approaches for attribute reduction in covering decision systems from the viewpoint of information theory. Firstly, we introduce information entropy and conditional entropy of the covering and define attribute reduction by means of conditional entropy in consistent covering decision systems. Secondly, in inconsistent covering decision systems, the limitary conditional entropy of the covering is proposed and attribute reductions are defined. And finally, by the significance of the covering, some algorithms are designed to compute all the reducts of consistent and inconsistent covering decision systems. We prove that their computational complexity are polynomial. Numerical tests show that the proposed attribute reductions accomplish better classification performance than those of traditional rough sets. In addition, in traditional rough set theory, MIBARK-algorithm [G.Y. Wang, H. Hu, D. Yang, Decision table reduction based on conditional information entropy, Chinese J. Comput., 25 (2002) 1-8] cannot ensure the reduct is the minimal attribute subset which keeps the decision rule invariant in inconsistent decision systems. Here, we solve this problem in inconsistent covering decision systems.  相似文献   

4.
现有的混合信息系统知识发现模型涵盖的数据类型大多为符号型、数值型条件属性及符号型决策属性,且大多数模型的关注点是属性约简或特征选择,针对规则提取的研究相对较少。针对涵盖更多数据类型的混合信息系统构建一个动态规则提取模型。首先修正了现有的属性值距离的计算公式,对错层型属性值的距离给出了一种定义形式,从而定义了一个新的混合距离。其次提出了针对数值型决策属性诱导决策类的3种方法。其后构造了广义邻域粗糙集模型,提出了动态粒度下的上下近似及规则提取算法,构建了基于邻域粒化的动态规则提取模型。该模型可用于具有以下特点的信息系统的规则提取: (1)条件属性集可包括单层符号型、错层符号型、数值型、区间型、集值型、未知型等; (2)决策属性集可包括符号型、数值型。利用UCI数据库中的数据集进行了对比实验,分类精度表明了规则提取算法的有效性。  相似文献   

5.
针对单值中智集利用单值中智关系处理信息融合问题、决策问题时过于严格。文中结合单值中智集和集合包含度关系,提出了单值中智集的包含度,并建立了单值中智决策信息系统的属性约简模型。定义了单值中智决策信息系统,给出了单值中智集的包含度定义和两种计算公式。提出了单值中智粗糙集模型,并讨论了其相关性质。给出求解单值中智决策信息系统属性约简的算法,并以例子说明算法的有效性。  相似文献   

6.
量化容差关系是粗集理论中一个最重要的扩展模型,然而它却有自己的局限性:需要诸如不完备信息系统中的属性值的概率分布情况等相关领域的知识。本文提出了一个量化容差关系的改进模型,这个新的模型是建立在对不完备信息系统的属性值的统计数据基础上的,它有效地克服了普通量化容差关系的不足。实例分析表明,改进的量化容差关系比原来量化容差关系更符合实际,具有更强的分辨能力。在进行缺失数据补齐时,改进的量化容差关系更适合于作为寻找最相似对象的基础,获得更高的补齐率。  相似文献   

7.
利用基于优势关系的模糊粗糙集模型,讨论了模糊决策信息系统中优化序决策规则的获取问题。利用优势关系定义了模糊目标信息系统中对象的三种属性约简。给出了它们的判定定理,构造相应的区分函数,利用布尔推理技术计算对象的属性约简,得到三类新的优化序决策规则。  相似文献   

8.
Set-valued information systems   总被引:2,自引:0,他引:2  
Set-valued information systems are generalized models of single-valued information systems. Incomplete information systems can be viewed as disjunctively interpreted set-valued information systems. Since some objects in set-valued information systems may have more than one value for an attribute, so we define tolerance relation and use the maximal tolerance classes to classify the universe of discourse. In order to derive optimal decision rules from set-valued decision information systems, we propose the concept of relative reduct of maximal tolerance classes, and define a kind of discernibility function to compute the relative reduct by Boolean reasoning techniques. Finally, we define three kinds of relative reducts for set-valued information systems and used them to evaluate the significance of attributes.  相似文献   

9.
姚晟  陈菊  徐风  汪杰  吴照玉 《测控技术》2019,38(3):16-20
多粒度粗糙集是一种重要的多粒度数据挖掘模型。为了对不完备信息系统中等价类重叠部分的定量信息进行挖掘,提出一种多阈值的量化容差关系程度多粒度粗糙集模型。首先将描述等价类重叠信息的程度多粒度粗糙集模型与处理不完备信息系统的量化容差关系进行结合,提出量化容差关系的程度多粒度粗糙集模型,然后在该模型的基础上,为每个粒度设定与数据相适应的阈值,提高了量化容差关系程度多粒度粗糙集模型的灵活性,增加多粒度数据挖掘的性能。UCI数据集的实验结果表明,本文所提出的粗糙集模型具有较好的分类效果和理论的可行性。  相似文献   

10.
基于二进制粒子群优化的决策系统属性离散化   总被引:1,自引:0,他引:1  
为解决连续属性无法直接用于粗糙集理论的问题,依据粗糙集连续属性离散化的根本要求,提出了一种基于二进制粒子群优化算法(Binary Particle Swarm Optimization,BinaryPSO)的属性离散化方法。该方法将二进制粒子视为断点子集,最小化断点集中的断点个数作为优化目标,粗糙集属性分类精度作为约束条件。其中,适应函数的定义保证了在尽量减少决策系统信息损失的前提下,得到简化的决策系统。仿真结果表明,该方法得到的离散结果包含较少的断点个数,并且保持了较高的分类能力。  相似文献   

11.
集值信息系统是信息系统的一般化模型。在实际应用中信息系统随着对象的变化而不断地动态变化。讨论了相容关系下对象增加时近似集的变化规律,提出了在集值信息系统和集值决策信息系统下近似集变化规律的性质,并通过实例给予验证。  相似文献   

12.
覆盖决策信息系统的属性约简是粗糙集理论中的重要研究内容之一.文中讨论决策为覆盖的覆盖决策信息系统的属性约简,针对覆盖决策信息系统的一类约简,利用证据理论中的信任函数和似然函数给出约简的等价刻画.根据决策类的似然函数值定义覆盖的重要度和相对重要度,给出求解约简的算法,并以实例说明算法的有效性.  相似文献   

13.
Traditional rough set theory is mainly used to extract rules from and reduce attributes in databases in which attributes are characterized by partitions, while the covering rough set theory, a generalization of traditional rough set theory, does the same yet characterizes attributes by covers. In this paper, we propose a way to reduce the attributes of covering decision systems, which are databases characterized by covers. First, we define consistent and inconsistent covering decision systems and their attribute reductions. Then, we state the sufficient and the necessary conditions for reduction. Finally, we use a discernibility matrix to design algorithms that compute all the reducts of consistent and inconsistent covering decision systems. Numerical tests on four public data sets show that the proposed attribute reductions of covering decision systems accomplish better classification performance than those of traditional rough sets.  相似文献   

14.
序贯三支决策方法是一种能够表示问题中的多重层次粒度,并将多粒度结合起来解决不确定决策问题的有效途径。优势-等价关系粗糙集则是针对条件属性具有偏好关系的分类问题,提取有序信息,对目标概念进行近似,从而形成决策知识。利用传统的优势关系粗糙集方法进行知识约简和提取的效率低下,而目前大部分序贯三支决策方法则局限在符号值属性的信息系统中,对连续值和有序值不能进行有效处理,造成一定程度的信息丢失。因此,将序贯三支决策的思想应用于优势关系粗糙集模型中,定义了一种新的基于序贯三支决策的属性约简及相应的属性重要度,对具有偏好值属性的信息系统进行更加高效的处理,通过多粒度的表示和关系的研究,加速了知识约简过程。选取了多组UCI数据进行实验,结果表明所提出的基于优势关系的序贯三支决策方法能够在保证约简质量的基础上明显降低时间耗费。  相似文献   

15.
提出一种基于改进粒子群的连续属性离散化算法。该算法结合集群智能优化理论和粗糙集理论,将各属性离散化分割点初始化为粒子群体,通过粒子间的相互作用寻求最优离散化分割点。将提出的离散化算法应用于UCI数据集实验中,实验结果表明,该算法能使决策系统的信息损失降低到最小,并可获取更为简洁的决策规则。  相似文献   

16.
By combining both vague sets and rough sets in fuzzy data processing, we propose a vague-rough set approach for extracting knowledge under uncertain environments. We compute all attribute reductions using the vague-rough lower approximation distribution, concepts of attribute reduction and the discernibility matrix in a vague decision information system (VDIS). Research results for extracting decision rules from the VDIS show the proposed approaches extend the corresponding method in classical rough set theory and provide a new avenue to uncertain vague knowledge acquisition.  相似文献   

17.

在序决策信息系统中, 定义区间为支配一个特定的对象同时又被另一个特定的对象所支配的所有对象的集合. 以区间为基本知识颗粒, 建立新的优势关系粗糙集模型, 并由此获取决策值为特定区间范围的区间决策规则. 提出区间的约简的概念, 构造区分函数计算区间的约简, 并由此计算优化区间决策规则. 该方法比初始的优势关系粗糙集方法适应性更强, 且所得区间决策规则可直接应用于序信息系统的分类问题.

  相似文献   

18.
在经典形式背景中,利用对象和属性间的二元关系定义一对粗糙模糊上、下近似算子,讨论算子的基本性质,指出算子与已有粗糙近似算子的关系.利用定义的粗糙模糊上、下近似算子,得到两类决策规则,即确定性决策规则和可能性决策规则.针对两类决策规则,提出下近似约简和上近似约简的概念,关于上近似约简,得到可约属性和属性协调集的判别条件,给出属性约简方法,并举例说明方法的可行性.  相似文献   

19.
现实世界中常常包含着海量的、不完整的、模糊及不精确的数据或对象,使得模糊信息粒化成为近年来研究趋势。利用论域上的模糊等价关系定义了模糊粒度世界的模糊知识粒度,给出了新的属性约简条件和核属性计算方法,以便更好地挖掘出潜在的、有利用价值的信息。针对粗糙集在对连续属性约简的过程中容易造成信息缺失和不能对模糊属性处理的现象,提出了一种基于模糊知识粒度对混合决策系统约简的启发式算法,省去了连续属性离散化过程,减少了计算量,为离散值域和混合值域约简提供了统一的方法。最后通过实例验证了其有效性。  相似文献   

20.
Attribute reduction is one of the most important problems in rough set theory. However, in real-world lots of information systems are based on dominance relation in stead of the classical equivalence relation because of various factors. The ordering properties of attributes play a crucial role in those systems. To acquire brief decision rules from the systems, attribute reductions are needed. This paper deals with attribute reduction in ordered information systems based on evidence theory. The concepts of plausibility and belief consistent sets as well as plausibility and belief reducts in ordered information systems are introduced. It is proved that a plausibility consistent set must be a consistent set and an attribute set is a belief reduct if and only if it is a classical reduction in ordered information system.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号