首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
基于粗糙集的不完备信息系统规则推理算法   总被引:6,自引:0,他引:6  
定义了非对称相似关系的近似集概念,提出了一种利用非对称相似关系下近似集和属性值对的基于粗糙集的确定规则推理算法.该算法无需改变初始不完备信息系统的结构,能直接处理缺省数据.实验结果表明,所获得的确定决策规则简洁、高效,与缺省值无关.  相似文献   

2.
基于限制非对称相似关系的粗糙集模型   总被引:1,自引:0,他引:1  
基于不可分辨关系的粗糙集理论不适用于含未知值的不完备信息系统.需要将经典的粗糙集理论不可分辨关系加以扩充才能处理不完备信息系统.目前已经提出了基于容差关系、量化容差关系、限制容差关系、非对称相似关系等的扩充粗糙集理论.但是,这些理论还存在一些局限性.文章提出了一种新的基于限制非对称相似关系的粗糙集扩充模型.理论分析和实验证明,与其它模型相比,可以从基于限制非对称相似关系模型的近似集中获取更多的信息.  相似文献   

3.
基于可变精度粗糙集模型和搜索树提出了一种新的增量式规则获取算法。该算法引入可变精度粗糙集模型以已获取规则集为启发信息,通过对解空间进行深度优先启发式搜索产生新的不确定性规则;并通过对原有规则置信度的更新,给出了原有规则集的更新算法;最后给出了实例分析。  相似文献   

4.
李抒音  刘洋 《计算机工程》2019,45(9):211-215
针对粗糙集分类规则挖掘算法LEM2剪枝条件过于严格的问题,提出一种权重模糊粗糙集的改进规则挖掘算法。在用例带权重的模糊粗糙集理论框架上分析面向混合数据的分类规则挖掘算法,引入粗糙集模型的近似覆盖参数作为挖掘算法的泛化度量参数,实现对规则集数量和规则形式复杂程度的调节。实验结果表明,与LEM2算法和DataSqueezer算法相比,该算法的平均精度和平均召回率更优,分别为81%和80%,且生成规则的平均长度最短。  相似文献   

5.
基于粗集的规则提取LBR和LEM3   总被引:1,自引:0,他引:1  
本文基于粗集理论,提出了一种新的规则提取法LBR(Learning By Rough Sets),并对LBR与另一种已有的规则提取法LEM1,即全局覆盖算法(global covering algorithm)进行了比较和讨论.基于比较的结果,得出了将LEM1改进后的LEM3.LBR不但可用于普通的决策表规则提取,更多地可应用于基于模糊划分的规则提取.LBR的提出,极大地简化和丰富了规则提取算法,在已知数据中可获取更为丰富的信息量.而LEM3的使用,则是在将"依赖"(depend on)这一概念推广的基础上,更灵活地使用"覆盖"(covering),扩大了获取规则的范围.LBR和LEM3因其各自不同的优点,在数据挖掘和智能领域均具有广泛的应用前景.  相似文献   

6.
LEM2算法是一种有效的规则提取算法,但是效率有待提高.针对效率问题,文章对LEM2算法作了一些改进:在计算属性值对的同时获取单条件属性的确定规则,并且可以去掉某些冗余属性;定义了决策分配势矩阵作为启发信息,简化了LEM2算法内部的多重循环.最后给出了两种算法的复杂度分析和仿真对比试验,结果表明改进算法能获取更为简洁的规则,并能有效的提高算法的效率.  相似文献   

7.
经典Rough集理论主要是利用了不可分辨关系对完备信息系统进行分析的。对现有粗糙集模型进行扩充后,才可以应用于不完备信息系统。容差关系、非对称相似关系、基于对象间完备度的限制容差关系、限制非对称相似关系等是现有的扩充模型。通过分析其优点和不足之处,提出一种新的模型——对象间差异度的限制非对称相似关系模型,在该模型中,给出的知识粒度更精确,更符合实际。实例结果也证明新模型可以从不完备信息系统获取更加精确的知识粒度。  相似文献   

8.
不完备信息系统下非对称相似关系的改进   总被引:2,自引:2,他引:0       下载免费PDF全文
通过分析现有粗糙集扩充模型,提出了一种修正非对称相似关系。基于该关系的扩充模型有效地克服了容差关系和非对称相似关系的不足。实例结果表明了其对不完备信息系统处理更简单有效,获取的信息更充分。  相似文献   

9.
基于限制非对称相似关系模型的规则获取算法研究   总被引:1,自引:0,他引:1  
粗糙集理论在不完备信息系统中的应用,是将粗糙集理论进一步推向实用的关键之一,而经典的粗糙集理论对不完备信息系统的处理显得束手无策.在分析研究已有的扩充粗糙集理论模型的基础上,进一步提出基于限制非对称相似关系模型,并将经典的可辨识关系矩阵加以扩充,定义了限制非对称相似关系下的可辨识关系矩阵,采用布尔推理方法,直接从不完备信息系统中提取规则而无需改变初始不完备信息系统的结构.实验结果表明,所获得的决策规则简洁,与缺省值无关.  相似文献   

10.
模糊粗糙集融合了模糊集和粗糙集的思想,是一种新的处理模糊和不确定性知识的软计算工具。针对属性为模糊值的信息系统,提出了一种基于熵的模糊粗糙集知识获取方法:首先通过模糊相似度量计算出各属性下对象的模糊相似值,再根据模糊相似关系构造模糊等价关系,然后根据模糊等价关系建立属性集的信息熵表示,继而使用基于信息熵的决策表属性约简算法获取规则。最后,通过一个实例,分析说明了这种算法的合理有效性。  相似文献   

11.
Our main objective was to compare two discretization techniques, both based on cluster analysis, with a new rule induction algorithm called MLEM2, in which discretization is performed simultaneously with rule induction. The MLEM2 algorithm is an extension of the existing LEM2 rule induction algorithm. The LEM2 algorithm works correctly only for symbolic attributes and is a part of the LERS data mining system. For the two strategies, based on cluster analysis, rules were induced by the LEM2 algorithm. Our results show that MLEM2 outperformed both strategies based on cluster analysis, in terms of complexity (size of rule sets) and, more importantly, error rates.  相似文献   

12.
Our objective is a comparison of two data mining approaches to dealing with imbalanced data sets. The first approach is based on saving the original rule set, induced by the LEM2 (Learning from Example Module) algorithm, and changing the rule strength for all rules for the smaller class (concept) during classification. In the second approach, rule induction is split: the rule set for the larger class is induced by LEM2, while the rule set for the smaller class is induced by EXPLORE, another data mining algorithm. Results of our experiments show that both approaches increase the sensitivity compared to the original LEM2. However, the difference in performance of both approaches is statistically insignificant. Thus the appropriate approach for dealing with imbalanced data sets should be selected individually for a specific data set.  相似文献   

13.
规则学习算法通过学习样本产生规则集,如何判断规则集的好坏?目前规则集的评估标准有很多,如一致性、可测量性和易理解性评估,但它们有各自的缺点。提出一种新的评估规则集方法:相似性度量。这种度量方法可以计算出两个规则集之间的正相似性与负相似性。实验说明这种新的度量方法可以被用来评估规则集间的一致性,并且可以决定使用哪种算法解决某类问题或选择组合分类模型中的基模型。  相似文献   

14.
基于遗传算法的顾客购买行为特征提取   总被引:2,自引:0,他引:2  
提出一种基于遗传算法的顾客行为特征提取算法。首先,采用Tanimoto 相似度来度量顾客间购买行为,并设计遗传聚类算法对顾客群体进行划分,把具有相似购买行为顾客聚集为一类。然后,针对不同顾客群体的购买行为特征,设计一种基于遗传算法的多种群特征提取方法,从各个子群体中发现顾客的购买行为的知识。为了增强种群内部协同进化能力和规则质量,我们采用最近邻替代遗传策略和局部搜索策略。使用实际零售数据集对整个算法进行验证,并与经典的Apriori算法进行比较。实验结果表明该算法在不需要产生频繁项集的情况下,可较高效生成精简规则集,在规则形式方面也更加灵活。最后,对实验结果进行详细分析。  相似文献   

15.
A weighted rough set based method developed for class imbalance learning   总被引:3,自引:0,他引:3  
In this paper, we introduce weights into Pawlak rough set model to balance the class distribution of a data set and develop a weighted rough set based method to deal with the class imbalance problem. In order to develop the weighted rough set based method, we design first a weighted attribute reduction algorithm by introducing and extending Guiasu weighted entropy to measure the significance of an attribute, then a weighted rule extraction algorithm by introducing a weighted heuristic strategy into LEM2 algorithm, and finally a weighted decision algorithm by introducing several weighted factors to evaluate extracted rules. Furthermore, in order to estimate the performance of the developed method, we compare the weighted rough set based method with several popular methods used for class imbalance learning by conducting experiments with twenty UCI data sets. Comparative studies indicate that in terms of AUC and minority class accuracy, the weighted rough set based method is better than the re-sampling and filtering based methods, and is comparable to the decision tree and SVM based methods. It is therefore concluded that the weighted rough set based method is effective for class imbalance learning.  相似文献   

16.
相较于传统的依托词汇频率大小进行关键字提取技术,TextRank算法能够考虑词汇节点之间的相似性信息,却仍忽略了词汇上下文信息以及文章的语义结构等。在节点图权重迭代的基础上,本文利用文本上下文词汇的关联规则信息,引入关联熵的概念,自适应调整阻尼系数和滑动窗口大小,更贴近文本词汇的实际语义情况,能够较好地处理低词频和新词汇信息。实验表明,相较于TFIDF和TR等算法,本文算法在处理关键字提取时能够达到更准确的效果。  相似文献   

17.
D-S证据理论中一种冲突证据的融合方法   总被引:4,自引:0,他引:4       下载免费PDF全文
针对D-S证据理论对于高冲突证据融合失效的问题,基于证据加权平均处理的方法,对D-S算法进行了改进。提出了一种新的相似度函数来表示证据的相似度,并通过归一化处理得到证据的支持度,对证据进行预处理,再采用Dempster规则融合证据。通过数值验证并与其他的改进算法对比,结果更为理想,它能有效地减小伪证据的不良影响,同时具有较高的收敛速度,降低了决策风险。对新的相似度函数进行分析,证明了改进算法的合理性。  相似文献   

18.
提出了一种基于改进的模糊 C 均值聚类的模糊规则提取方法。然后基于所提取的模糊规则给出了一种分类算法,并利用 IRIS 数据对此分类算法进行了仿真测试。结果表明,该算法在训练祥本较少的情况下,仍能得到很好的分类效果,由此说明所提出的模糊规则生成方法有效。  相似文献   

19.
一种新的人工免疫系统检测规则及其应用   总被引:2,自引:0,他引:2  
为了提高检测器集的生成效率,在讨论人工免疫系统负选择模型的基础上,提出一种新的检测规则,即:编辑距离规则.在这种规则中,对于一个随机生成的字符串和Self集中的字符串,采用编辑距离度量它们之间的相似性.随后,利用这种检测规则给出一种新的检测器集生成算法,它要求利用Trie数据结构组织和存储Self集.最后,通过理论分析得出了使用该种算法的优越性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号