首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
决策表连续属性离散化的一种方法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种基于区间数据分布特征的决策表连续属性离散化的方法。方法在断点的选择上考虑了属性值的出现频率,在区间内的一致性和区间之间的差异性基础上,利用条件信息量作为反馈信息合并区间。通过实验分析表明了算法的有效性,能保持决策表较高的分类能力,提高约简效率。  相似文献   

2.
连续属性离散化是数据分析中重要的预处理过程,本文提出了一种基于云模型,融合相似云度量思想的连续属性整体离散化方法。它首先对例子集合在各个连续属性上的取值进行统一数量级别处理,选出分区基准属性,然后使用正态云模型对每个连续属性进行离散化.最后加以实验验证,指出该方法有一定的理论价值和实际意义.  相似文献   

3.
基于云模型的决策表规则约简   总被引:1,自引:1,他引:1  
代劲  何中市 《计算机科学》2010,37(6):265-267
通过对决策表的转换,将规则映射成为云向量,用云向量数字特征间的相似度来度量决策表规则间的等价关系.基于此,提出了基于云模型的决策表规则约简算法,不仅解决了粗集基于严格属性匹配的等价关系不能区分相似关系,也克服了基于模糊集等价关系依赖专家先验知识、对属性值随机性分布考虑不足的缺点.实验说明了该算法的高效性.  相似文献   

4.
决策表核属性的计算方法   总被引:143,自引:4,他引:143  
王国胤 《计算机学报》2003,26(5):611-615
针对决策表核属性的计算问题,对前人的一些理论观点进行讨论,在认识这些理论观点缺陷的基础上,探讨Rough集理论代数观和信息观这两种形式的关系,发现它们在核属性和约简上的差异,提出决策表核属性的计算方法.  相似文献   

5.
一种基于信息论的决策表连续属性离散化算法   总被引:2,自引:0,他引:2  
连续属性离散化方法对后续阶段的机器学习和数据挖掘过程有着重要的意义。提出一种新的针对决策表的离散化算法,在该算法中,首先将信息熵用作判断标准,从候选断点集中选择合适的断点,然后删除一些冗余的断点来优化离散结果,在删除过程中为了尽可能保证决策表分类能力不变,使用不一致率对该过程进行控制。最后选取多组实验数据,使用当前流行的分类算法——支持向量机(SVM)对离散化后的数据进行分类预测,并与其它离散算法进行对比,结果表明本算法是有效的。  相似文献   

6.
连续属性离散化是Rough集理论应用中面临的主要问题之一.提出了一种基于的Rough集连续属性离散化方法.首先提出主泛化决策等概念,在数据过滤方法的基础上,利用等价类的合并对属性离散化.实验表明,利用该方法对数据进行离散预处理后提取的规则具有较好的分类预测准确性.  相似文献   

7.
基于相对熵的决策表连续属性离散化算法   总被引:3,自引:0,他引:3  
该文提出了一种新的决策表连续属性离散化算法.首先使用相对熵来度量条件属性的重要性;;并据此对条件属性按照属性重要性从小到大排序;;然后按排序后的顺序;;考察每个条件属性的所有断点;;将冗余的断点去掉;;从而将条件属性离散化.该算法易于理解;;计算简单;;算法的时间复杂性为O(3kn2)。  相似文献   

8.
决策表中连续属性离散化,即将一个连续属性分为若干属性区间并为每个区间确定一个离散型数值。该文提出一种新的决策表连续属性离散化算法。首先使用决策强度来度量条件属性的重要性,并据此对条件属性按照属性重要性从小到大排序,然后按排序后的顺序,考察每个条件属性的所有断点,将冗余的断点去掉,从而将条件属性离散化。该算法易于理解,计算简单,算法的时间复杂性为O(3kn2)。  相似文献   

9.
Rough Set理论中连续属性的离散化方法   总被引:95,自引:0,他引:95  
苗夺谦 《自动化学报》2001,27(3):296-302
Rough Set(RS)理论是一种新的处理不精确、不完全与不相容知识的数学工具.传统的RS理论只能对数据库中的离散属性进行处理,而绝大多数现实的数据库既包含了离散属性,又包含了连续属性.文中针对传统RS理论的这一缺陷,利用决策表相容性的反馈信息,提出了一种领域独立的基于动态层次聚类的连续属性离散化算法.该方法为RS理论处理离散与连续属性提供了一种统一的框架,从而极大地拓广了RS理论的应用范围.通过一些例子将本算法与现有方法进行了比较分析,得到了令人鼓舞的结果.  相似文献   

10.
王希雷  苏静 《微机发展》2008,18(4):118-120
简化决策表具有高效处理数据的能力,一经提出即得到广泛的重视。文中通过反例证明简化决策表在处理数据时会产生错误,改变了原决策表表达信息。通过分析得出简化决策表不具备处理不一致数据的能力,针对简化决策表存在的缺陷对其进行修正,提出新简化决策表的概念和建立算法。新简化决策表具有高效处理数据的能力,同时具备处理不一致数据的能力,并且不需要修改原有以决策表或简化决策表为基础的求核和求约简算法。  相似文献   

11.
基于粗糙集理论的模式分类样本特征选择方法研究   总被引:1,自引:0,他引:1  
本文提出了一种基于粗糙集理论的模式分类本特征选择方法,该方法应用粗糙集理论和方法,对给定的学习样本进行特征选择,根据这些特征构造神经网络模型进行训练,并在网络的工作阶段,根据这些特征对待识样本进行分类,在模式分类中,该方法能够减少网络的训练时间并改善网络的泛化能力。  相似文献   

12.
基于Rough集的数据挖掘模型研究   总被引:13,自引:0,他引:13  
这项工作的主要目的是表明怎样能够有效地实现基于Rough集的数据挖掘技术,在这篇论文里,我们详细讨论了Rough集理论,为了从基于Rough集的数据库中发现新的规则,研究了一种适合数据挖掘的面向对象的软件系结构,给出了数据挖掘算法、规则发现算法和规则约简算法,从初始数据库的信息出发,依次建造差别矩阵、约简表和规则表,最后给出了一个模拟实例,表明我们的模型和算法是可行的。  相似文献   

13.
基于信息粒度与Rough集的聚类方法研究   总被引:1,自引:0,他引:1  
本文讨论了信息颗粒、信息粒度的基本含义,提出了字符颗粒和数字颗粒的概念,分析了采用信息粒度和Rough集理论进行聚类的机理,提出了利用模糊隶属度、信息粒度与Rough集理论相结合进行数据库混合数据聚类的方法.  相似文献   

14.
ABSTRACT

A new learning algorithm for space invariant Cellular Neural Network (CNN) is introduced. Learning is formulated as an optimization problem by combining rough sets and genetic programming. Rough Sets approach has been selected for creating priori knowledge about the actual effective cells, determining their significance in classifying the output, and discovering the optimal CNN structure. According to the lattice of CNN architecture and depending on the priori knowledge gained by rough sets, genetic programming will be used in deriving the cloning template. Exploration of any stable domain is possible by the current approach. Details of the algorithm are discussed and several application results are shown.  相似文献   

15.
基于粗糙集的神经网络建模方法研究   总被引:29,自引:0,他引:29  
提出了一种基于粗糙集的神经网络模型,该方法利用粗糙集数据分析方法,从数据中提取出规则将输入映射到输出的子空间上,而后在这个子空间上用神经网络进行逼近.利用这种方法对岩石边坡工程中边坡稳定性进行分析建模,并和传统的神经网络建模方法进行比较,说明了该方法的有效性.  相似文献   

16.
基于粗糙集及RBF网络的英文字母识别   总被引:1,自引:0,他引:1  
将粗糙集理论与神经网络相结合,针对7×5分辨率的大写英文字母,构建了基于RBF网络的字母识别系统,给出了该识别系统的核心算法与核心结构.该系统利用粗糙集中最小决策算法对识别矩阵进行属性约简,减少了大量的计算和数据库存储量,同时提高了系统识别速度和识别率.通过计算机模拟实验,将该识别系统的识别率与标准BP网络算法及改进BP网络算法相比较,证实了该系统的优越性,在有约1/7的像素点受到随机干扰的情况下,该系统识别率仍可达到88%以上.  相似文献   

17.
连续属性的离散化是粗糙集理论的主要问题之一.针对粗糙集理论只能处理离散数据的局限性,提出基于属性决策表和竞争型网络的连续属性离散化方法.首先使用条件属性与决策属性之间的决策关系来度量条件属性的重要性,并据此对条件属性按照重要性由小到大排序,然后利用竞争型网络分类功能找到连续属性的断点,从而实现了对连续属性的离散化.算法分析和实验证明算法是切实可行的.  相似文献   

18.
粗糙集理论和自组织特征映射SOFM(Self-Organizing-Feature-Map)神经网络在聚类分析中有各自的优势和劣势,结合SOFM神经网络和粗糙集理论提出一种算法.该算法利用粗糙集理论的属性约简去掉样本的冗余属性,并将处理过的数据作为SOFM神经网络的训练样本,从而减小了SOFM网络的规模,因此提高了样本的聚类效率.  相似文献   

19.
串行关系是能区分上下近似的最低要求.本文在串行关系下研究粗糙集理论,讨论串行粗糙集的特征性质及计算方法,并把相关结论推广到串行粗槌模糊集上,得出串行粗糙模糊集上下近似算子的有趣性质和简洁算法.  相似文献   

20.
多Agent系统中基于Rough集的推理   总被引:3,自引:0,他引:3  
定义了多Agent系统中的推理模型,建立了在该模型下的Rough集和基于Rough信方法的Rough包含计算或称集合连接计算,在知识发现和数据挖掘中,集合之间往往不是给出它们的相等性,而是讨论它们之间的Rough包含或连接。因为在不同的Agent中集合之间关系的精确和一致解释往往是不容易获得的。一般说来,一条基于决策表上的规则,满足前提公式个体的集合包含于满足结论公式个体的集合常常是用一种支持值和  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号