共查询到19条相似文献,搜索用时 46 毫秒
1.
2.
3.
4.
5.
属性约简是粗糙集理论中最重要的研究内容之一。在决策粗糙集中,学者提出了多种属性约简的定义,其中包括保持所有对象正决策不变的约简定义。针对该约简定义,为了高效地获取约简集,设计了一种启发式函数 ——决策重要度,这种启发式函数根据每个属性正决策对象集合的大小来定义其重要性,正决策对象集合越大表示重要性越高,由此构造了基于决策重要度的启发式属性约简算法。该算法的优点是通过对属性决策重要度的排序,确定了一个搜索方向,避免了属性的组合计算,减少了计算量,能够找出一个较小的约简集。实验结果表明,该算法是有效的,能够得到较好的约简效果。 相似文献
6.
提出了一种基于决策粗糙集的面向知识的自动聚类方法。在面向知识的聚类算法中,获取初始聚类结果依赖人工阂值的设置。为此,首先根据物理学知识提出了一种差值排序方法来自动得到阂值。另外,讨论了决策粗糙集模型的损失函数,提出了一种聚类评佑方法;通过对聚类结果的评佑来实现自动聚类。实验结果表明新方法是有效的。 相似文献
7.
一种基于粗糙集的最小约简算法 总被引:4,自引:6,他引:4
随着计算机技术的发展,急剧产生海量的数据。如何从这些数据中提取有用的信息是一个重要的问题。一种新的数据分析方法——粗糙集理论被提出。该理论在分类的意义下定义了模糊性和不确定性的概念,是一种处理不确定和不精确问题的新型数学工具。文中首先对近年兴起的粗糙集的基本概念进行了叙述,在此基础上运用粗糙集理论提出一种新的约简算法。 相似文献
8.
粗糙集理论中求取最小决策规则的研究 总被引:1,自引:0,他引:1
本文探讨了粗糙集理论中最小决策规则的求取方法,提出决策依赖度的定义,尝试从最短的条件属性组合中提取尽可能多的决策规则。只有现有长度的决策规则无法完全覆盖所有样本时,才会考虑增加决策规则的长度。同时提出了3种减少计算复杂性的方案:1)引入跳跃系数λ;2)在计算中只对具有相同决策值的样本进行等价类划分,从而避免了对含有不同决策值的等价类的无用划分;3)设计Remain集合,只针对其中的样本进行等价类的划分,随着Remain中样本数的减少,计算量会大幅下降。此外,本文所提出的基于决策依赖度的跳跃式决策规则求取方法可以直接应用于不完备信息系统,因此具有良好的实用价值。 相似文献
9.
邹瑞芝 《数字社区&智能家居》2011,(12)
属性约简是粗糙集理论研究的重要内容之一,而求解最小约简是NP难问题。为了有效获取最优或次优约简,该文提出了一种基于遗传算法的粗糙集属性约简算法。该算法将属性核加入遗传算法的初始种群来增加收敛速度,而且在适应度函数中,通过计算决策属性对条件属性的依赖度,使该文算法既保证了全局寻优的特性又具有加强局部搜索的能力,能够获得最佳的搜索效果。该算法通过实例分析,证明是求解属性约简问题的快速有效方法。 相似文献
10.
一种基于粗糙集的决策系统属性约简算法 总被引:28,自引:1,他引:28
从大量数据发现知识时,属性约简是一个关键问题,本文提出了一种新的算法用于粗集中的属性约简,该算法基于Hu的差别矩阵,在对差别矩阵进行化简的基础上,先得到核,然后在逐步减小的差别矩阵中挑选出最频繁的属性加入直到成为一个约简。文中还对求核的正确性,算法的正确性进行了证明,同时对算法复杂度进行了分析,最后给出了一个例子来说明算法的有效性。 相似文献
11.
针对多属性决策,提出一种基于变精度粗糙集的多属性决策方法,提出基于属性依赖度和信息度来确定属性重要性,并且与变权综合结合,从而得到属性的权重。通过实例说明该方法是有效的。 相似文献
12.
基于粗集和熵的多变量决策树的构造算法 总被引:1,自引:0,他引:1
多变量决策树是一种有效用于分类的数据挖掘方法,构造的关键是根据属性之间的相关性选择合适的属性组合作为节点。针对传统方法中用相对核进行多变量检验中属性选择存在的不足,首先对每个节点包含的属性个数加以限制,然后由重新定义的属性依赖度和基于条件熵的距离函数选择相关的属性组合作为节点,从而提出一种新的构造算法。实例说明,该算法不仅有效降低了树的高度,而且还兼顾了分类的可读性。 相似文献
13.
传统变精度多粒度粗糙集模型是基于单一变精度阈值的,而多粒度粗糙集模型是从多角度和多层次处理数据,数据往往是多源的或者是分布式的,其噪音数据的含量也各不相同。因此,不同知识粒度层次所应具有的变精度阈值也不相同,这使得现有的模型难以适应多粒度环境。为克服上述缺点,提出了基于多重阈值的变精度多粒度粗糙集模型,该模型使得不同知识粒度层次的变精度阈值可独立调整,更符合多粒度粗糙集模型的数据特征。该模型更好地结合了多粒度粗糙集模型和变精度粗糙集模型,可从多角度分析解决问题又兼具更灵活的容错能力。 相似文献
14.
基于粗糙集的带决策规则边界的邮件过滤算法 总被引:1,自引:0,他引:1
针对垃圾邮件过滤的准确率和稳定性不高,以及为了解决邮件过滤算法在语料分类上存在漏报和误报等问题,提出基于粗糙集的带决策规则边界的邮件过滤算法(RARM)。该算法运用粗糙集理论对语料库进行直接分析,并采用启发式方法提出了粗糙集理论的三种不同决策规则的执行计划,确保当邮件内容的词汇语义较为模糊时,仍能保证一定的分类准确度。在实验仿真中,通过与基于支持向量机(SVM)、Ada Boost和贝叶斯分类的邮件过滤算法相比较,该算法在垃圾邮件过滤上的准确率优于对比算法。 相似文献
15.
上近似、下近似是粗糙集理论的基本概念,由上下近似概念可导出粗糙集的正域、负域、边界等概念。对于决策信息系统,决策属性的等价类可以用粗糙集理论的上下近似来刻画,边界反映了其粗糙性。分析决策信息系统的边界类属性,结合可变精度粗糙集与经典粗糙集理论,对比边界类属性与正域类属性及负域类属性的差别,提出了正向迁移属性和负向迁移属性概念,结合例子给出正向迁移属性与负向迁移属性的求法,并对其意义加以说明。 相似文献
16.
17.
基于变精度粗糙集理论提出了具有置信度规则决策树的新的构造方法,该方法采用β-边界域的大小作为选择分类属性的标准,并对叶节点的置信度进行了重新的定义。经实验证明,该方法能有效提高分类效率且更加容易理解。 相似文献
18.
现有的属性约简方法大部分关注决策系统中的所有决策类,而在实际决策过程中决策者往往仅关注决策系统中的一种或几种决策类。针对上述问题,提出基于多特定决策类的不完备决策系统正域约简的理论框架。首先,给出不完备决策系统单特定决策类正域约简的概念;第二,将单特定决策类正域约简推广到多特定决策类,构造了相应的差别矩阵及区分函数;第三,分析并证明了相关定理,提出基于差别矩阵的不完备决策系统多特定决策类正域约简算法(PRMDM);最后,选取4组UCI数据集进行实验。在数据集Teaching-assistant-evaluation、House、Connectionist-bench和Cardiotocography上,基于差别矩阵的不完备决策系正域约简算法(PRDM)的平均约简长度分别为4.00、13.00、9.00和20.00,PRMDM算法(多特定决策类中决策类数目为2)的平均约简长度分别为3.00、8.00、8.00和18.00。实验结果验证了PRMDM算法的有效性。 相似文献
19.
为了对电子产品设计缺陷进行评估与预测,需要构建电子产品设计缺陷粗糙集数学描述模型。由于电子产品设计缺陷影响因素关系复杂,直接构造贝叶斯网络预测模型困难大、精度差,因此提出一种贝叶斯网络与粗糙集相结合的方法。采用粗糙集来生成贝叶斯网络预测模型的网络结构和各节点的条件概率表,再通过贝叶斯网络的参数估计建立电子产品设计缺陷的预测模型。实际应用证明,该方法简洁有效,可以预测项目可能存在的设计缺陷。 相似文献