首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 187 毫秒
1.
针对经典粗糙集中属性约简的不足,进一步拓展粗糙集属性约简的应用。提出了一种粗糙集属性近似约简的概念和一种新的粗糙集属性重要性的定义并给出和证明了属性近似约简的性质,理论证明了近似属性约简是传统属性约简的一种推广。在保持知识库分类能力基本不变的条件下,利用所给属性重要性作为启发信息给出了粗糙集属性近似约简的算法。通过一个具体的例子,说明了近似属性约简在信息系统中处理模糊和不确定性知识的可行性和有效性。  相似文献   

2.
基于近似决策熵的属性约简   总被引:3,自引:0,他引:3  
粗糙集理论已被证明是一种有效的属性约简方法. 目前有许多启发式属性约简算法已被提出, 其中基于信息熵的属性约简算法受到了广泛的关注. 为此, 针对现有的基于信息熵的属性约简算法问题, 定义一种新的信息熵模型—–近似决策熵, 并提出一种基于近似决策熵的属性约简(ADEAR) 算法. 通过在多个UCI 数据集上的实验表明, 与现有算法相比, ADEAR算法能够获得较小的约简和较高的分类精度, 具有相对较低的计算开销.  相似文献   

3.
属性约简是粗糙集理论的一个核心部分。由于经典的粗糙集模型对不完备信息系统不适应,通过把属性约简问题归结为0-1组合优化问题,提出了一种应用二进制粒子群算法来求解属性约简的方法。通过引入近似分类精度和近似分类质量,为获得最小约简确定了有效合理的粒子适应度函数。仿真实验结果表明该算法能得到最小相对约简,且具有较高的运算效率。  相似文献   

4.
针对求解变精度粗糙集模型属性约简问题,在对象集上定义一种上下近似二元关系.利用此关系建立属性集上的等价关系,由此构造出依赖空间,从而得到变精度粗糙集的上下近似协调集的判定定理.同时建立一种保持每个决策类的上下近似不变的属性约简方法.最后通过实例验证方法的有效性.  相似文献   

5.
为了在处理噪声数据时获得更可靠的分类规则,提出了一种粗糙规则挖掘算法.通过粗糙规则集的不确定量度,在变精度粗糙集理论下近似约简分析的基础上,引入了信息熵,建立了变精度意义下的决策表的度量方式.利用离散粒子群算法,提出一种基于粒子群优化的粗糙集知识的近似约简算法,导出了粗糙规则集.经过实例分析说明,这种算法不但具有一定的噪声容忍度,而且该算法得到的规则具有较高的正确度和覆盖度,从而保证分类的准确性.  相似文献   

6.
基于贝叶斯粗糙集,引入贝叶斯区分矩阵,采用属性的出现频率与属性的长度作为启发因素,并以此给出了贝叶斯粗糙集属性约简的另外一种算法,最后提出了一种基于颜色特征的图像分类模型及其分类算法。用该方法进行图像资源的分类,克服了经典粗糙集不宜处理带有噪声的数据和决策表不协调的分类问题的缺陷,同时又大大简化分类规则,且形成的规则集便于用户理解。完善了近似空间的概念。实验结果表明在处理决策表不协调的图像分类问题,贝叶斯粗糙集方法性能良好,分类准确和高效。  相似文献   

7.
针对决策粗糙集属性约简在引入代价后分类精度不高的问题,对其中代价敏感与分类精度的平衡进行了研究。将分类总代价和近似分类质量作为属性约简过程中的约束条件,结合模拟退火方法,提出了一个基于代价敏感和近似分类质量的决策粗糙集属性约简(ARACOQ)算法。利用UCI数据集对算法进行了模拟实验,实验结果验证了ARACOQ算法的有效性,该算法能够在可承受代价范围内找到一个分类精度最高的属性约简集。  相似文献   

8.
基于相似关系粗糙集模型的数值属性约简算法   总被引:1,自引:0,他引:1  
吴敏 《计算机应用》2010,30(1):156-158
针对数值属性数据包含大量噪声而经典粗糙集方法易受噪声干扰的问题,提出一种属性度量指标综合衡量属性在样本上的差异性和相似性。以这种属性度量指标为启发式设计了相似关系粗糙集框架下的数值属性约简算法,并推广到经典粗糙集。在车牌字符集和UCI手写体数字字符集上和常用约简算法进行了比较,实验结果显示这种方法产生的约简属性可以导出规则数少并且具有较好分类能力的规则集。  相似文献   

9.
目前粗糙集的研究局限于有限集,且现有的邻域粗糙集属性约简算法中属性重要性度量方式单一。针对邻域粗糙集存在的问题,提出了基于无限集的邻域近似条件熵模型。该模型以邻域近似条件熵下的属性重要度为启发条件,构造了一种基于邻域近似条件熵的前向贪心搜索属性约简算法。利用熵的单调性,证明了算法的正确性,并分析了算法的时间复杂度。通过实例分析和多个UCI数据集上的实验表明,所提出的算法是可行的,能有效减少属性数量,与现有的算法相比,不仅能够获得较小的属性约简结果,而且具有较好的分类性能。  相似文献   

10.
单调性在经典粗糙集属性约简过程中发挥着重要的作用。然而,在一些扩展模型中该单调性质并不存在,如变精度粗糙集模型。针对该问题,提出了变精度粗糙集模型中下近似单调约简的定义,下近似单调约简算法打破了传统意义上属性约简保持下近似不发生变化的局限性,认为属性约简可以追求下近似集尽可能增大。同时给出了求得该约简的属性约简方法。实验结果表明,相较于下近似保持约简算法,下近似单调约简算法求得的约简不仅增加了正域规则数目也减少了边界域规则数目,而且提高了数据的分类精度。由此可见,下近似单调约简算法增加了由正域表示的确定性,同时降低了由边界域带来的不确定性。  相似文献   

11.
Feature selection is a challenging problem in areas such as pattern recognition, machine learning and data mining. Considering a consistency measure introduced in rough set theory, the problem of feature selection, also called attribute reduction, aims to retain the discriminatory power of original features. Many heuristic attribute reduction algorithms have been proposed however, quite often, these methods are computationally time-consuming. To overcome this shortcoming, we introduce a theoretic framework based on rough set theory, called positive approximation, which can be used to accelerate a heuristic process of attribute reduction. Based on the proposed accelerator, a general attribute reduction algorithm is designed. Through the use of the accelerator, several representative heuristic attribute reduction algorithms in rough set theory have been enhanced. Note that each of the modified algorithms can choose the same attribute reduct as its original version, and hence possesses the same classification accuracy. Experiments show that these modified algorithms outperform their original counterparts. It is worth noting that the performance of the modified algorithms becomes more visible when dealing with larger data sets.  相似文献   

12.
王蓉  刘遵仁  纪俊 《计算机科学》2018,45(7):197-201, 229
作为经典Pawlak粗糙集的扩展,邻域粗糙集能有效处理数值型的数据。但是,因为引入了邻域粒化的概念,所以邻域实数空间下的计算量要比经典离散空间下的计算量大得多。对于邻域粗糙集算法而言,能够有效且快速地找到数据集的属性约简是十分有意义的。为此,针对现有算法中属性重要度定义的不足,首先提出了一种改进的投票式属性重要度,然后进一步提出了一种基于投票式属性重要度的快速属性约简算法。实验证明,与现有算法相比,在保证分类精度的前提下,该算法能更快速地得到属性约简。  相似文献   

13.
邻域粗糙集可以直接处理数值型数据,F-粗糙集是第一个动态粗糙集模型.针对动态变化的数值型数据,结合邻域粗糙集和F-粗糙集的优势,提出了F-邻域粗糙集和F-邻域并行约简.首先,定义了F-邻域粗糙集上下近似、边界区域;其次,在F-邻域粗糙集中提出了F-属性依赖度和属性重要度矩阵;根据F-属性依赖度和属性重要度矩阵分别提出了...  相似文献   

14.
针对现有粗糙集属性约简方法中存在的连续数据处理时的信息丢失、粒化策略引入不一致信息、参数寻优困难等问题,提出一种适用于连续型数据、基于类别可区分度的非单调性启发式属性约简算法。首先以各样本的标签为依据对论域进行划分,同一标签的样本组合成一个簇,定义每个簇的类间可区分度和类内可区分度;其次,以最大化类间可区分度、最小化类内可区分度为约简原则,定义了一种新的属性重要性判别准则以确定最优约简集,从而提高后续分类器的分类性能。在十一个UCI数据集上与其他六种属性约简算法进行对比实验。结果表明,与六种算法相比,所提算法获得的约简集平均维度减小了1.16,平均分类精度提高了3.42%,其表现出更好的约简性能。  相似文献   

15.
属性约简能有效地去除不必要属性,提高分类器的性能。模糊粗糙集是处理不确定信息的重要范式,能有效地应用于属性约简。在模糊粗糙集中,样本分布的不确定性会影响对象的近似集,进而影响有效属性约简的获取。为有效地定义近似集,文中提出了基于距离比值尺度的模糊粗糙集,该模型引入了基于距离比值尺度的样本集的定义,通过对距离比值尺度的控制,避免了样本分布不确定性对近似集的影响;给出了该模型的基本性质,定义了新的依赖度函数,进而设计了属性约简算法;以SVM,NaiveBayes和J48作为测试分类器,在UCI数据集上评测所提算法的性能。实验结果表明,所提出的属性约简算法能够有效获取约简并提高分类的精度。  相似文献   

16.
李艳  范斌  郭劼 《计算机应用》2022,42(9):2701-2712
属性约简是粗糙集理论中的研究热点,对连续值数据进行属性约简的算法大多基于优势关系或邻域关系。然而连续值数据集的属性不一定具有优势关系;而基于邻域关系的属性约简算法虽然可以通过邻域半径调整粒化程度,不过由于各属性量纲不同且半径参数为连续值使半径难以统一,导致整个参数粒化过程计算量较大。为解决此问题,提出一种基于聚类粒化的多粒度属性约简策略。首先,利用聚类方法将相似样本归类,并提出了基于聚类的近似集、相对正域及正域约简概念;其次,根据JS(Jensen-Shannon)散度理论对簇间各属性数据分布进行差异性度量,并选择出具有代表性的特征用以区分不同类簇;最后,利用可辨识矩阵设计了属性约简算法。所提算法不要求属性具有序关系,且不同于邻域半径,聚类参数为离散值,调节此参数就能够对数据集形成不同粒化程度的划分。在UCI与Kent Ridge数据集上进行的实验结果表明,该属性约简算法可以直接处理连续值数据,且该算法在较小范围内离散地调节聚类参数便能在保持甚至提高分类精度的前提下去除数据集中的冗余特征。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号