首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
一种连续条件属性值的决策表的归纳学习方法   总被引:1,自引:0,他引:1  
对由连续条件属性值和离散决策属性值组成的决策表,提出了一种归纳学习方法。把决策表中的连续条件属性值看作一矩阵,进行矩阵的奇异值分解,以确定决策表条件属性的数目。用模糊C均值聚类的方法对连续条件属性值进行不同聚类数目的聚类,得到不同聚类数目下的离散决策表,对这些决策表进行条件属性简化,从而得到不同的条件属性数目。比较矩阵奇异值分解后决策表条件属性的数目和上述不同聚类数目下的离散决策表简化后的条件属性的数目,并考虑决策属性的数目,确定最终的聚类数目。在此基础上,给出了由连续条件属性值和离散决策属性值组成的决策表的归纳学习方法,并验证了其有效性。  相似文献   

2.
基于最小聚类划分的K-means聚类(1+ε)近似算法   总被引:3,自引:0,他引:3  
k-means聚类算法是解决聚类问题的一个常用方法.近年来,国外许多学者对该问题的近似常数算法和(1 ε)近似算法进行了研究.利用Kumar等人随机取样技术对于基于最小聚类划分k-means提出一个(1 ε)随机近似算法.该算法利用随机取样技术从集合中求出部分取样点,再对随机取样点进行组合找出每个聚类的部分点,将该部分点的质心点作为相应子聚类簇的质心点.通过多次运行该算法可以以较高概率求出k-means聚类的1 ε近似值.  相似文献   

3.
基于信息熵模糊聚类和粗糙集理论故障的模糊判据研究   总被引:1,自引:0,他引:1  
复杂电子系统的缓变故障是故障预报的难点之一,针对这一问题提出了基于信息熵模糊聚类和粗糙集理论的故障决策判据方法;该方法主要分两个步骤:以信息熵作为聚类标准,采用谱系的方法确定聚类数目,然后通过FCM模糊聚类构造故障决策表;利用粗糙集理论对故障决策表进行简化和最小化,最终形成带评价的简约故障决策判据;该方法改进了一般模糊聚类算法的不足,克服了先验信息和知识不准确、不完整、不一致情况下故障决策表获取与更新的困难;实际算例表明,信息熵模糊聚类方法比一般模糊聚类方法的聚类质量更高,更客观真实。  相似文献   

4.
连续属性离散化在数据分析的数据预处理中非常重要。本文提出一种基于类信息熵的有监督连续属性离散化方法。该方法运用了粗集理论中决策表的一致性水平的概念。算法分成两部分:首先根据决策表的一致性水平动态调整聚类类别数目,运用分级聚类形成初始聚类。然后,基于类信息熵合并相邻区域,减少区间数目。实践证明该方法是可行的。  相似文献   

5.
Web上的数据规模大,动态性强,而通常发现的知识或规则很可能是不精确的、不完备的,为了克服以上困难,将粗糙集概念引入到Web挖掘中,进行Web事务聚类.介绍了将粗糙近似算法嵌入到WEKA平台的过程,充分利用了开源WEKA中的类和可视化功能,扩充了WEKA系统的聚类算法,并对嵌入的算法进行了分析,测试.粗糙近似算法方法能够实现从Web访问日志中聚类Web事务,并且该算法对分类属性的数据具有很高的准确率.  相似文献   

6.
一种新的聚类算法   总被引:1,自引:0,他引:1  
基于万有引力原理提出一种新的聚类算法 .新算法假定样本元素间的聚类动力取决于元素所在的位置以及所属聚类团 .对于初始产生的聚类团利用模糊 c均值聚类算法的部分改进步骤调整各元素相对于临时聚类中心的模糊权值 ,最后产生 c个不同的聚类团 .实验结果证明该算法具有较好的聚类效果 ,特别是当数据分布具有非凸结构形式时其聚类效果明显优于模糊 c均值 ( FCM)聚类算法  相似文献   

7.
基于层次聚类的差异化属性约简算法   总被引:1,自引:0,他引:1  
属性约简是粗糙集用于数据分析的一个重要概念,提出了一个计算差异化属性约简的算法。利用自底向上的聚合层次聚类方法对决策表的条件属性集进行聚类,得到条件属性集的k个划分,然后对这k个属性子集进行后处理操作而得到k个有较大差异的约简属性集。实验结果表明了算法的有效性。  相似文献   

8.
罗会兰  危辉 《计算机科学》2010,37(8):214-218
提出了基于数学形态学的聚类集成算法CEOMM.它利用不同的结构元素的探针作用,对不同的结构元素探测出来的簇核心图进行集成,在集成所得到的簇核心基础上聚类.实验结果表明,算法CEOMM对有复杂类形状的数据集进行聚类时,效果比传统聚类算法更好,且能确定聚类数.而且由于采用了不同的结构元素进行探测,对于由不同形状的类构成的数据集其聚类效果很理想.  相似文献   

9.
针对彩色结肠镜图像,提出一种融合颜色、亮度、空间距离和纹理信息,采用随机聚类的彩色图像分割新算法。该算法采用分形维作为图像纹理特征的度量,用一种基于元素间的相似性的随机聚类方法对特征空间进行聚类。该聚类算法是基于对图中的切割进行采样的新的图论算法,可以自动获得最佳的分类数目。  相似文献   

10.
现有的很多属性约简算法都是由构造决策表的差别矩阵出发,将矩阵中非空元素的合取范式转化为极小析取范式。为提高对大规模数据的决策表进行约简的效率,文中指出基于U/{a}划分的最小约简算法存在的缺陷,给出以划分粒度为启发式信息,利用单个条件属性把论域划分成多个等价类,将计算整个全域上的属性约简问题转化为计算在相应划分的子区域上属性约简问题,提出了一种基于决策表分解的最小属性约简算法。理论分析和实例表明该约简算法是有效的。  相似文献   

11.
针对实际的决策表中的对象通常是动态变化的情况,首先引入了简化的决策袁,然后在动态更新核的基础上,结合简化二进制差别矩阵和位图运算的设计思想,提出了一种快速的属性约简增量式更新算法.当有新对象加入决策表时,新算法只需验证新增的对象和原决策表中的对象是否一致性,然后采用在计算二进制差别矩阵的同时对原属性约简进行动态更新,从而有效地降低算法的时空复杂度,最后用实例说明了新算法的可行性和高效性.  相似文献   

12.
模糊软集多参数决策方法中经常将Zadeh交与代数积使用在数据融合方法中,在一些实际应用中会产生信息缺失,导致决策者无法做出准确的选择。针对这一问题,结合Einstein运算法则提出一种新的数据融合方法,用于解决信息缺失和对象无法排序的问题。所提出的基于模糊软集的多参数决策方法是通过Einstein积运算进行多个参数集合的整合,从而得到一个合成模糊软集,再由合成模糊软集计算得到对照矩阵与得分表,最终得到对象的全排序,为决策者提供判断依据。通过实例结果,可以验证新方法在决策问题中的正确性和有效性。  相似文献   

13.
一种新的完全决策表属性约简的高效算法   总被引:2,自引:2,他引:2  
属性约简是粗糙集理论的核心问题之一,也是粗糙集有效算法研究的焦点。为获得最简明的规则集,通常希望能找出最小的属性约简集,但得到最优解是NP-hard的问题,通常采取启发式的算法得到近似最优解。文中研究了不完全决策表的属性约简,提出一种衡量不完全决策表属性重要性的标准,依此给出了一种新的进行属性约简启发式算法。对寻找对象的相似类的步骤则在排序和二分查找的基础上提出了一种新的高效的算法,这样就相应地使得属性约简的效率得到提高。此算法较好地解决了不完全决策表的属性约简问题。  相似文献   

14.
文中提出一种基于包围盒和空间分解的碰撞检测算法,用以解决软体的碰撞检测。算法使用AABB包围盒做初步检测,确定可能发生碰撞的物体。再根据包围盒的重叠情况缩小可能发生碰撞的区域,利用哈希表作为数据储存结构进行空间分解,将物体包围盒重叠区域的基本几何元素的空间网格映射到哈希表中,将碰撞区域缩小到基本几何元素,最后用基元碰撞检测找出具体碰撞点。由于前期AABB包围盒的处理减少了空间分解阶段需要映射的基本几何元素数量,该算法具有较高的运算速度。  相似文献   

15.
针对决策表中对象动态删除的情况,研究了核属性的动态更新问题。首先引入了简化决策表的概念,剔除了大量重复冗余的对象,然后详细分析了当决策表删除对象时核属性的动态更新机制,并将逐层细化的方法应用到核属性的动态更新中,避免了许多不必要的重复计算。在此基础上,设计了一种无需存储差别矩阵的核属性动态更新算法。当决策表有对象删除时,该算法只需扫描一遍变化后的决策表,便可快速对核属性进行动态更新。最后,通过实例分析和实验比较验证了算法的可行性和有效性。  相似文献   

16.
基于正区域的属性约简是目前最常用的一类约简算法。现实中的决策表有可能存在不一致的对象。另外,在约简过程中随着属性个数的减少,也有可能产生新的不一致对象。对于基于正区域的约简算法来说,不一致的对象并没有提供任何有用的信息,删除不一致的对象不会改变正区域的计算结果以及最终的约简结果,而且可以显著提高算法的效率。然而现有的基于正区域的约简算法并没有考虑到这个问题,它们采用论域中的所有对象来计算正区域并得出约简结果。针对这一问题,定义了重构相容决策表和重构相容决策子表的概念。引入这两个概念的目的是在约简过程中删除初始决策表中的不一致对象,从而获得一个相容决策表。借助于这两个概念,提出了一种新的基于正区域的属性约简算法。在真实数据集上的实验表明,与传统的算法相比,该算法能够获得较小的约简结果和较高的分类精度,并且具有相对较低的时间复杂度。  相似文献   

17.
把模糊集和粗糙集结合起来,对连续域决策表属性约简算法进行研究。使用三角隶属度函数将连续属性值转化为模糊值。定义两模糊对象间的相似度、模糊对象的相似类以及连续属性在对象集上划分所形成的相似类集组成的特征向量。给出连续型属性的数字特征向量,以此为基础建立连续型属性间的相似矩阵。提出一个新的属性约简算法,并用一个实例加以验证。  相似文献   

18.
基于正域的属性约简算法是利用"下近似"思想,仅考虑被正确区分样本数的约简算法。借鉴"上近似"的思想,利用"邻域信息粒"的概念定义了区分对象集,探讨了其基本性质,并提出了基于区分对象集的属性重要度度量及启发式属性约简算法。该约简算法既考虑信息决策表的相对正域,也考虑以核属性为启发信息逐个增加条件属性时对边界域样本的影响。通过实例分析,说明了所提算法的可行性,并且以6个UCI标准数据集为实验对象,与基于正域的属性约简算法进行对比实验。实验结果说明,采用提出的约简算法得到的约简属性集,与基于正域的属性约简算法相比,在进行分类任务时的分类精度能够保持不变或有所提高。  相似文献   

19.
Rough k-means clustering describes uncertainty by assigning some objects to more than one cluster. Rough cluster quality index based on decision theory is applicable to the evaluation of rough clustering. In this paper we analyze rough k-means clustering with respect to the selection of the threshold, the value of risk for assigning an object and uncertainty of objects. According to the analysis, clusters presented as interval sets with lower and upper approximations in rough k-means clustering are not adequate to describe clusters. This paper proposes an interval set clustering based on decision theory. Lower and upper approximations in the proposed algorithm are hierarchical and constructed as outer-level approximations and inner-level ones. Uncertainty of objects in out-level upper approximation is described by the assignment of objects among different clusters. Accordingly, ambiguity of objects in inner-level upper approximation is represented by local uniform factors of objects. In addition, interval set clustering can be improved to obtain a satisfactory clustering result with the optimal number of clusters, as well as optimal values of parameters, by taking advantage of the usefulness of rough cluster quality index in the evaluation of clustering. The experimental results on synthetic and standard data demonstrate how to construct clusters with satisfactory lower and upper approximations in the proposed algorithm. The experiments with a promotional campaign for the retail data illustrates the usefulness of interval set clustering for improving rough k-means clustering results.  相似文献   

20.
在差别矩阵的基础上,针对不完备决策表提出了基于差别矩阵的区分对象对集定义,并证明求不完备决策表的核可以转化到求基于差别矩阵的区分对象对集上。在此基础上,提出了一种基于区分对象对的不完备决策表求核算法,该算法的时间复杂度为:[max{O(|C||U||Upos|),O(K|C||U|)}],优于同类算法的时间复杂度;用实例说明了新算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号