首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于粗糙集的文本自动分类方法的研究   总被引:4,自引:0,他引:4  
提出一种利用粗糙集理论生成文本分类规则的方法 ,通过将文本关键词的权值进行离散化处理后 ,作为规则的条件属性 ,文本所属的类别用作决策属性 ,构造决策表。然后通过属性约简和规则化简提取出文本的分类规则。该方法生成的规则易于理解 ,分类准确度较高 ,分类速度快。  相似文献   

2.
在图像分类中,单一特征提取容易造成图像信息的缺失,而多特征融合则会生成大量的冗余特征,使得图像分类的准确率降低。针对上述问题,通过改进邻域粗糙集特征选择算法,使其可以处理多维的图像特征,并将该算法应用于图像分类中。利用HOG和SURF结合空间金字塔匹配模型,得到最终的图像描述;利用线性SVM类性能和鲁棒性。  相似文献   

3.
本文介绍了粗糙集和决策粗糙集理论,提出一种基于决策粗糙集理论的两步信息过滤算法,相比原始的此类算法,该算法缩小了负域范围,采取两步策略进行分类,当发现新样本和未知样本时,能确保它是否属于负域,从而尽量减少将不属于负域的样本划分到负域,降低了分类错误和损耗。与传统朴素贝叶斯方法和一般决策粗糙集理论算法比较结果证明,本文提出的基于决策糙集的两步信息过滤算法,可以提高分类精度和降低分类损耗。  相似文献   

4.
针对数据流时变性产生的概念漂移问题,在利用L-M算法优化BP神经网络的基础上,引入增量式学习机制,提出了一种具有动态自适应能力的概念漂移流式数据分类算法IBPNN-CDCA.实验结果表明,算法较之传统BP神经网络分类算法等具有更好的抗概念漂移能力,并且大幅度提高了分类准确度,从而为实时分类海量概念漂移数据提供了一种新方法.  相似文献   

5.
《现代电子技术》2015,(14):24-27
在粗糙集理论基础上,提出一种增量式的垃圾邮件过滤方法。该方法将邮件样本的局部最小确定性作为阈值来控制规则产生,并在邮件识别过滤过程中增加了反馈环节,将错判和未识别样本作为增量样本进行再学习,动态调整邮件规则的置信度。根据阈值选择可信度较高的规则进行更新,从而减少了规则的个数,提高了样本的正确识别率,最后用实验证明了该方法的有效性。  相似文献   

6.
文中主要研究了粗糙集理论在空间数据分类中的应用。在空间数据分类的同时考虑了数据的空间属性和非空间属性,并提出了一种新的基于Rough集理论的决策表离散化算法。由于空间数据对象的属性受其附近的其他空间对象的影响,所以在进行基于空间数据库的数据分类时应该考虑到这种影响。文中首先对空间数据进行预处理,在其属性表中添加空间属性信息,然后使用粗糙集理论处理扩展后的属性表,对其进行数值型数据的离散化、属性表的属性约简和值约简等操作,最终生成分类规则。  相似文献   

7.
目前决策表的数据信息都是动态变化的,为了有效地对这些数据集进行属性约简处理,在改进的等价关系矩阵的基础上,提出一种增量式属性约简算法,决策表增加了一些属性,利用更新前决策表的等价关系矩阵和属性约简等信息,便能快速求解出更新后的决策表属性约简.实验结果进一步验证了该方法的有效性和正确性.  相似文献   

8.
一种基于半监督学习的应用层流量分类方法   总被引:3,自引:0,他引:3  
基于应用层的流量分类在用户行为识别、网络带宽管理等方面有着十分重要的应用.将机器学习应用到应用层流量分类问题中.首先提出了一种基于熵函数的组合式特征选择算法,提取了5种TCP连接的特征.针对监督学习中无法识别新流量类型的问题,提出了一种基于半监督学习的流量分类算法.实验结果表明,算法的检测率优于Kmeans方法.在少量标记样本的情况下,随着未标记样本数增加,算法的检测率在增加.  相似文献   

9.
基于粗糙集信息观的决策表属性约简方法   总被引:2,自引:0,他引:2  
粗糙集理论是近年来发展起来的一种有效的处理不精确、不确定、含糊信息的数学理论方法,它被广泛应用于相容和不相容决策表的属性约简和核属性计算。利用反例指出目前基于粗糙集信息观[2、6]的决策表属性约简和核属性计算方法的局限性。对决策表的性质作了深入的研究,研究发现文献[2、6]方法的不足原因是:它们没有考虑U/ind(C)中等价类的相客性。给出了基于U/ind(C)中等价类相客性的属性约简定义和核属性定义,并给出了一种新的基于粗糙集信息观的决策表属性约简和核属性计算方法。讨论了该方法同文献[2、6]方法的区别。最后用相同实例验证了该方法的有效性。  相似文献   

10.
粗糙集理论和支持向量机在数据挖掘方面具有较强的互补特性,基于粗糙集理论的上近似集、下近似集和边界域概念,结合支持向量机的分类原理,提出了一种支持向量机分类算法。首先,在支持向量机分类中定义样本分类的粗糙集规则,然后在边界域寻找两类样本中使判别式绝对值取值最小且分类正确的样本来确定最优分类面,脱离了对惩罚系数C的寻优问题,有效避免了过拟合问题,并通过循环迭代算法寻找合适的参数b,获得分类性能更优的支持向量机,最后通过对一个二维样本数据库进行分类实验,验证了此算法的有效性与可行性。  相似文献   

11.
An Incremental Rule Acquisition Algorithm Based on Rough Set   总被引:3,自引:0,他引:3  
1 Introduction Rough set theory introduced by Pawlak (1982)[1] is avalid mathematical theory developed in recent years, whichhas the ability to deal with imprecise, uncertain, and vagueinformation. It has been used successfully in such field asmedicine, pharmacology, market analysis, engineering,pattern recognition, data mining etc. Pawlak showed that theproblems of machine learning could be explained, analyzedand disposed within the framework of rough set theory[2]. Inhis paper[2], t…  相似文献   

12.
基于Rough集约简算法的中文文本自动分类系统   总被引:7,自引:0,他引:7  
现有的文本自动分类离不开文档向量的构造,向量的分量与文档中的特征项相对应。这种向量通常高达几千维甚至数万维,计算量相当大,因此需要对向量进行约简。而传统的基于频率的阈值过滤法往往会导致有效信息的丢失,影响分类的准确度。该文将Rough集理论引入自动分类,并提出了一种新的文档向量约简算法。实验证明该算法不仅能有效缩减文档向量的规模,而且相比传统的阈值法信息损失小、准确率更高。  相似文献   

13.
Feature selection is one of the challenging problems facing data analysis in areas such as pattern recognition, data mining, and decision support. Many rough set algorithms for feature selection have been developed, most of which are essentially dependent on the definite information contained within the lower approximation. This paper proposes a novel approach, called Unbal- anced binary tree based feature selection (UBT-FS), which utilizes the indefinite information contained within rough set boundary region for reduction. UBT-FS designs the underlying mechanism for obtaining the boundary region from the unbalanced binary tree and adopts the boundary region based significance for determining the optimal search path as well as the boundary region based evaluation criterion for identifying feature subsets. These allow UBT-FS to have considerable ability in finding an optimal or suboptimal reduct whilst simultaneously achieving obviously better computational efficiency than other available algorithms, which is also supported by the experimental results.  相似文献   

14.
基于粗集与遗传算法相结合的文本模糊聚类方法   总被引:1,自引:0,他引:1  
该文将粗集与遗传算法相结合的方法成功应用于文本模糊聚类.在聚类过程中,将权重参数的设定也通过编码由遗传算法确定,从而使得权重参数的设定具有科学性和可操作性,避免了在类似算法中确定权重时的主观性和不可靠性.最后的实例说明了算法的可行性.  相似文献   

15.
基于可变精度粗糙集的决策规则格构造   总被引:1,自引:1,他引:0  
谷雨 《微电子学与计算机》2005,22(4):174-176,180
基于概念格理论提出了决策规则格的概念,格中的每一节点均可表示为相应的决策规则。针对格节点之间存在偏序关系的特点,文中给出了三种剪枝策略。特别地,将粗糙集知识约简的思想和可变精度粗糙集的β下近似思想应用于决策规则格的构造,有效地减少了格中节点的数目,并有较强的抗噪声数据干扰能力。  相似文献   

16.
基于粗糙集的过程控制规则挖掘算法及应用   总被引:1,自引:0,他引:1  
在现代工业生产过程中,如何从实际生产过程中提取出有用的规则,用于调整控制生产是过程控制中一个难题。文章提出了一种基于粗糙集的过程控制规则挖掘算法,可以较大的降低计算复杂度,并将算法用于实际烟草制丝生产线的关联规则提取.得到了可用于实际生产过程控制的规则。  相似文献   

17.
基于变精度粗糙集的粗集神经网络   总被引:2,自引:0,他引:2  
本文研究了基于变精度粗糙集模型下的粗集神经网络设计,对近似约简条件进行了弱化推广,同时提出了近似约简的选取原则。在对Brodatz纹理图像的分类实验中,比较了经典粗集神经网络RNN和变精度粗集神经网络VPRNN的性能,VPRNN不仅具有更为精简的结构和更短的训练时间,而且具有更强的近似决策和泛化能力。  相似文献   

18.
一种基于粗集理论的视频流派分类方法   总被引:1,自引:0,他引:1  
视频分类提供了一种管理和利用视频数据的有效手段.现有的视频流派分类方法倾向于使用尽量多的特征,借此更有效地表示视频内容,以保证分类的效果,但提取这些视频特征的代价通常都很高,因此有必要考虑流派分类中的特征选择问题.提出了一种基于粗集理论的方法实现视频特征的选择和流派的分类:通过分析相关文献中所使用的各种特征.提取了多种有效特征构成分类的基础;基于启发式搜索的方法用于发现最优约简,从而实现特征选择;通过约简导出的分类规则实现流派标识的确定.与已有方法分类效果的比较以及与决策树方法的实验对比表明了文中方法的有效性.  相似文献   

19.
为解决粗逻辑神经网络精度与网络规模复杂性和推广泛化能力之间的矛盾,该文提出了一种具有可变离散精度的粗逻辑神经网络设计方法.该方法通过近似域划分,将论域空间划分为确定性区域和可能性区域,由于可能性区域信息粒度过大是造成误分类的重要原因,只需对可能性区域离散区间进一步细化,即可达到提高粗逻辑网络的精度,同时抑制网络规模增长过快的目的.在长白山地区的遥感图像分类实验中,常规方法在离散等级为7时有最好性能,而该文方法以较小的网络代价和训练时间获得了逼近的分类结果.  相似文献   

20.
基于类别分布差异和VPRS特征选择的文本分类方法   总被引:3,自引:0,他引:3  
权值计算和特征降维是影响文本分类的精度和效率的两个重要步骤。该文首先根据特征词的类别分布差异进行特征过滤;然后,分析传统的权值公式TF-IDF的缺点,采用改进的权值计算公式简记为TF-CDF,依据TF-CDF公式计算每个特征词的权值,生成文档集的向量空间模型VSM;接着,提出了一种基于可变精度粗糙理论(VPRS)的特征选择进一步选择对分类贡献度大的特征,并用SQL实现。最后利用支持向量机LibSVM分类器进行实验,实验结果表明特征过滤和选择方法及TF-CDF权值公式有助于提高分类精度和分类效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号