首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
基于粗糙集的带决策规则边界的邮件过滤算法   总被引:1,自引:0,他引:1  
针对垃圾邮件过滤的准确率和稳定性不高,以及为了解决邮件过滤算法在语料分类上存在漏报和误报等问题,提出基于粗糙集的带决策规则边界的邮件过滤算法(RARM)。该算法运用粗糙集理论对语料库进行直接分析,并采用启发式方法提出了粗糙集理论的三种不同决策规则的执行计划,确保当邮件内容的词汇语义较为模糊时,仍能保证一定的分类准确度。在实验仿真中,通过与基于支持向量机(SVM)、Ada Boost和贝叶斯分类的邮件过滤算法相比较,该算法在垃圾邮件过滤上的准确率优于对比算法。  相似文献   

2.
一个基于决策粗糙集理论的信息过滤模型   总被引:3,自引:0,他引:3       下载免费PDF全文
介绍了决策粗糙集理论,提出了一个基于决策粗糙集理论的通用信息过滤模型,并通过对电子邮件进行过滤,与传统的基于文本内容的信息过滤方法——朴素贝叶斯方法进行了比较,比较结果证明该文提出的基于决策粗糙集理论的信息过滤模型可以降低误判率,有较高的正确率。  相似文献   

3.
针对决策信息信息表中新对象的分类问题,提出一种基于改进的贝叶斯粗糙集和证据理论的决策信息融合方法.对传统的贝叶斯粗糙集进行改进,扩展到多决策类,定义了支持度的概念以此反映确切分类的对象所占的百分比.利用贝叶斯粗糙集的支持度和置信增益函数作为证据的支持程度,得到各准则下的证据基本概率分配函数,并利用证据合成法则对多个证据进行合成,以此进行决策.将上述方法应用于设备故障的诊断问题中,通过方法的对比验证了该方法实践应用的有效性.  相似文献   

4.
一种基于粗糙集的图像分类方法   总被引:1,自引:1,他引:1  
提出一种基于图像内容的颜色特征并利用粗糙集进行分类的模型。粗糙集理论在数据分类应用中的主要思想是保持分类能力不变的情况下,利用等价类,通过属性约简和决策规则约简,达到挖掘知识并简化知识的目的。实验结果表明在图像分类方面,粗糙集方法性能良好,相对于贝叶斯方法更加准确和高效。  相似文献   

5.
基于贝叶斯粗糙集,引入贝叶斯区分矩阵,采用属性的出现频率与属性的长度作为启发因素,并以此给出了贝叶斯粗糙集属性约简的另外一种算法,最后提出了一种基于颜色特征的图像分类模型及其分类算法。用该方法进行图像资源的分类,克服了经典粗糙集不宜处理带有噪声的数据和决策表不协调的分类问题的缺陷,同时又大大简化分类规则,且形成的规则集便于用户理解。完善了近似空间的概念。实验结果表明在处理决策表不协调的图像分类问题,贝叶斯粗糙集方法性能良好,分类准确和高效。  相似文献   

6.
粗糙集与决策树在电子邮件分类与过滤中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
垃圾邮件的识别与过滤是目前研究的热点问题之一。而粗糙集是一种新的处理模糊和不确定性知识的数据分析工具,已被成功地应用到许多有关分类的领域。将粗糙集与决策树结合,提出一个基于RS-DT的邮件分类方案与模型,并进行了实验及结果分析。通过与朴素贝叶斯模型及SVM的比较,表明提出的基于RS-DT的模型可以降低把正常邮件错分为垃圾邮件的比率,提高过滤系统的自学习能力。  相似文献   

7.
针对混合值不完备决策信息系统,提出一种将邻域联系度粗糙集与贝叶斯理论相结合的分类方法。定义了一种新的属性辨识矩阵——同异反辨识矩阵,给出了基于同异反辨识矩阵的t分配约简算法,以及对约简后的决策信息系统建立基于邻域联系度粗糙集的最小错误率贝叶斯决策准则,用于对含有混合属性值以及不完备数据的对象进行分类。实验表明所提出的方法是客观有效的。  相似文献   

8.
决策粗糙集是一种基于贝叶斯风险最小化原则的具有一定容忍度的概率粗糙集模型,但当前关于决策粗糙集模型的研究只局限于处理具有离散型数据的信息表.文中将模糊集和决策粗糙集理论相结合,在决策粗糙集模型中计算期望风险损失时,利用模糊隶属度函数代替传统的后验概率求解方法,这样可推导出新的决策规则,进而可高效处理那些包含连续型属性的信息系统.实验表明该方法是可行的,并且可通过调整隶属度函数,达到更佳分类效果.  相似文献   

9.
在不完备区间值信息系统中,提出一种基于极大相容类的决策粗糙集模型。首先,针对不完备区间值信息系统中属性相似度存在的缺陷,对属性相似度进行改进。其次,在不完备区间值信息系统中,由于容差关系下建立粗糙集模型存在冗余度高、分类精度低的问题,采用极大相容类代替等价类,结合贝叶斯最小风险决策原则,建立决策粗糙集模型。经证明,基于极大相容类建立粗糙集模型可有效提高分类精度。最后,基于正域分布不变的原则提出基于区分矩阵的属性约简算法并将该算法应用于实例。  相似文献   

10.
粗糙集用于规则归纳时,其正域规则和边界规则这两种不同的分类规则会导致不同的决策序列。这两种分类规则都能够从语法和语义上进行区分,并被Pawlak模型所延伸的粗糙集理论所解释。属性约简是粗糙集理论的一个重要概念,本文针对决策粗糙集中的决策单调性这个分类属性,给出属性约简中基于正域约简模型及其分析。  相似文献   

11.
决策表中规则获取的不确定性研究   总被引:5,自引:0,他引:5  
知识获取的不确定性主要来源于有限的分辨能力以及对于数据描述的不确定性。首先将Rough集理论与不确定问题中的证据理论以及模糊集合理论进行比较,然后介绍不确定性数据的模糊描述。通过引入模糊区别矩阵和扩展近似集方法延伸了Rough集理论,并从模糊决策表中导出合理的决策规则。  相似文献   

12.
论文探讨了旋转机械故障诊断中,用粗糙集理论进行知识获取的方法。粗糙集理论在知识获取方面有很多的优越性能。在使用粗糙集理论进行知识获取时,决策表约简是关键一步。明晰矩阵可以进行属性约简和属性值约简。但是使用明晰矩阵存在占用存储空间大,运算时间长的缺点。论文提出了一种基于明析矩阵的属性值约简新算法。这种算法能够有效地缩短计算时间和节约存储空间,操作简便。  相似文献   

13.
In this paper, we have dealt on the problem of part-of-speech tagging of multi-category words which appear within the sentences of Hindi language. Firstly, a Hindi tagger is proposed which provides part-of-speech tags developed using grammar of Hindi language. For this purpose, Hindi Devanagari alphabets are used and their Hindi transliteration is done within the proposed tagger. Thereafter, a Rules’ based TENGRAM method is described with an illustrative example, which guides to disambiguate multi-category words within sentences of Hindi corpus. The rules generated in TENGRAM are the result of computation of discernibility matrices, discernibility functions and reducts. These computations have been generated from decision tables which are based on theory of Rough sets. Basically, a discernibility matrix helps in cutting down indiscernible condition attributes; a discernibility function has rows corresponding to each column in the discernibility matrix which develops reducts; and the reducts provide a minimal subset of attributes which preserve indiscernibility relation of decision tables and hence they generate the decision rules.  相似文献   

14.
粗糙集对于学习分析系统的属性约减模型有着重要的研究意义和使用价值。针对教育大数据高维度、不完备、增量性等现状,提出了基于不完备决策表的差别信息增量更新算法,并结合树形结构对差别信息的高效存储和粗糙集的核属性概念,设计构建了MIX_FP树,实现高维属性的有效约减。实验结果验证了该算法具有较好的运行效率和空间性能,为教育大数据的属性约减提供了有效的方法,同时为基于粗糙集理论的属性约减算法研究和及其在学习分析领域的应用提供了新的研究思路。  相似文献   

15.
Rough集理论是对大型数据库进行知识发现的主要方法之一。根据属性集核和相对等价类的概念,对数据库属性集中的属性进行约简,提取相应的规则(知识),是用Rough集知识发现的精髓。该文基于Rough集差别矩阵,提出了属性集的布尔函数的构造方法,并应用吸收律、分配律和等幂律对属性集布尔函数化简。论文证明了属性集布尔函数的化简与属性集的差别矩阵约简等价,同时给出了求相对决策属性基本集的算法和IRIS提供的数据仿真实验结果。  相似文献   

16.
经典Rough集理论是基于完备信息系统的。然而在实际应用中,由于数据存取或数据处理方面的原因,决策表经常是不完备的,即存在缺值。为了处理不完备信息系统,Kryszkiewicz提出了基于容差关系的Rough集模型。在该模型下进行知识约简时,现有的算法一般都采用构造区分矩阵和相应区分函数的方法。该方法虽然可以求得所有约简,然而业己证明这是一个NP-hard问题,因此实践中更为可行的方法是利用启发式搜索算法求出最优或次最优约简。在文中提出属性的重要性定义,并以此作为启发式信息,设计一种完备的知识约简算法。  相似文献   

17.
基于优势区分矩阵的求核方法   总被引:2,自引:0,他引:2       下载免费PDF全文
在提出基于优势关系粗糙集方法下的类区分矩阵概念后,为解决不一致数据问题,新的优势区分矩阵定义及其求核方法被提出,但是该方法计算代价高。为了能够快速求出存在不一致数据的信息系统的核,该文给出改进的优势区分矩阵定义和求核算法,其空间和时间复杂度都优于现有的算法。实验证明,该算法适用于处理大数据集。  相似文献   

18.
李艳  郭娜娜  赵浩 《计算机科学》2017,44(Z6):70-74
属性约简是粗糙集理论研究的重要内容。传统的基于差别矩阵的属性约简方法只能处理一致决策表,改进的差别矩阵针对决策表中一致和不一致的对象做不同的处理,从而解决了这一问题。浓缩布尔矩阵进一步节省了矩阵的存储空间并提高了矩阵的生成效率,从而可以快速计算得到约简。在此基础上,结合变精度的思想把部分不一致对象合理地加入到一致对象的集合中,从而增加了一致数据的信息量,并通过使用浓缩布尔矩阵有效降低了约简的计算消耗。实验表明,所提方法在运行速度和分类精度方面均表现出了优势。  相似文献   

19.
粗糙集理论是近年来出现的处理模糊和不确定性的数学工具,并已广泛应用于人工智能的许多领域。文章针对在增量式数据环境下挖掘决策规则的特点,在回顾基于分辨矩阵的数据挖掘算法及其不足的基础上,利用决策矩阵的概念有效地处理具有不同决策类的各种决策系统。在此基础上提出相应的对每一个决策类建立决策矩阵的增量式挖掘算法,最后利用算例验证了算法的合理性和有效性。该算法步骤同传统的分辨矩阵算法相比,能在增量式环境下快速而有效地进行确定性规则和可能性规则的学习并对可能性规则建立相应的置信度,使规则的获取更具实用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号