共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
3.
本文介绍了粗糙集和决策粗糙集理论,提出一种基于决策粗糙集理论的两步信息过滤算法,相比原始的此类算法,该算法缩小了负域范围,采取两步策略进行分类,当发现新样本和未知样本时,能确保它是否属于负域,从而尽量减少将不属于负域的样本划分到负域,降低了分类错误和损耗。与传统朴素贝叶斯方法和一般决策粗糙集理论算法比较结果证明,本文提出的基于决策糙集的两步信息过滤算法,可以提高分类精度和降低分类损耗。 相似文献
4.
针对数据流时变性产生的概念漂移问题,在利用L-M算法优化BP神经网络的基础上,引入增量式学习机制,提出了一种具有动态自适应能力的概念漂移流式数据分类算法IBPNN-CDCA.实验结果表明,算法较之传统BP神经网络分类算法等具有更好的抗概念漂移能力,并且大幅度提高了分类准确度,从而为实时分类海量概念漂移数据提供了一种新方法. 相似文献
5.
6.
7.
目前决策表的数据信息都是动态变化的,为了有效地对这些数据集进行属性约简处理,在改进的等价关系矩阵的基础上,提出一种增量式属性约简算法,决策表增加了一些属性,利用更新前决策表的等价关系矩阵和属性约简等信息,便能快速求解出更新后的决策表属性约简.实验结果进一步验证了该方法的有效性和正确性. 相似文献
8.
一种基于半监督学习的应用层流量分类方法 总被引:3,自引:0,他引:3
基于应用层的流量分类在用户行为识别、网络带宽管理等方面有着十分重要的应用.将机器学习应用到应用层流量分类问题中.首先提出了一种基于熵函数的组合式特征选择算法,提取了5种TCP连接的特征.针对监督学习中无法识别新流量类型的问题,提出了一种基于半监督学习的流量分类算法.实验结果表明,算法的检测率优于Kmeans方法.在少量标记样本的情况下,随着未标记样本数增加,算法的检测率在增加. 相似文献
9.
基于粗糙集信息观的决策表属性约简方法 总被引:2,自引:0,他引:2
粗糙集理论是近年来发展起来的一种有效的处理不精确、不确定、含糊信息的数学理论方法,它被广泛应用于相容和不相容决策表的属性约简和核属性计算。利用反例指出目前基于粗糙集信息观[2、6]的决策表属性约简和核属性计算方法的局限性。对决策表的性质作了深入的研究,研究发现文献[2、6]方法的不足原因是:它们没有考虑U/ind(C)中等价类的相客性。给出了基于U/ind(C)中等价类相客性的属性约简定义和核属性定义,并给出了一种新的基于粗糙集信息观的决策表属性约简和核属性计算方法。讨论了该方法同文献[2、6]方法的区别。最后用相同实例验证了该方法的有效性。 相似文献
10.
粗糙集理论和支持向量机在数据挖掘方面具有较强的互补特性,基于粗糙集理论的上近似集、下近似集和边界域概念,结合支持向量机的分类原理,提出了一种支持向量机分类算法。首先,在支持向量机分类中定义样本分类的粗糙集规则,然后在边界域寻找两类样本中使判别式绝对值取值最小且分类正确的样本来确定最优分类面,脱离了对惩罚系数C的寻优问题,有效避免了过拟合问题,并通过循环迭代算法寻找合适的参数b,获得分类性能更优的支持向量机,最后通过对一个二维样本数据库进行分类实验,验证了此算法的有效性与可行性。 相似文献
11.
An Incremental Rule Acquisition Algorithm Based on Rough Set 总被引:3,自引:0,他引:3
YU Hong~ YANG Da-chun~.Institute of Computer Science & Technology Chongqing University of Posts & Telecommunications Chongqing P.R.China .Chongqing R&D Institute of ZTE Corp. Chongqing P.R.China 《中国邮电高校学报(英文版)》2005,12(1)
1 Introduction Rough set theory introduced by Pawlak (1982)[1] is avalid mathematical theory developed in recent years, whichhas the ability to deal with imprecise, uncertain, and vagueinformation. It has been used successfully in such field asmedicine, pharmacology, market analysis, engineering,pattern recognition, data mining etc. Pawlak showed that theproblems of machine learning could be explained, analyzedand disposed within the framework of rough set theory[2]. Inhis paper[2], t… 相似文献
12.
基于Rough集约简算法的中文文本自动分类系统 总被引:7,自引:0,他引:7
现有的文本自动分类离不开文档向量的构造,向量的分量与文档中的特征项相对应。这种向量通常高达几千维甚至数万维,计算量相当大,因此需要对向量进行约简。而传统的基于频率的阈值过滤法往往会导致有效信息的丢失,影响分类的准确度。该文将Rough集理论引入自动分类,并提出了一种新的文档向量约简算法。实验证明该算法不仅能有效缩减文档向量的规模,而且相比传统的阈值法信息损失小、准确率更高。 相似文献
13.
Feature selection is one of the challenging problems facing data analysis in areas such as pattern recognition, data mining, and decision support. Many rough set algorithms for feature selection have been developed, most of which are essentially dependent on the definite information contained within the lower approximation. This paper proposes a novel approach, called Unbal- anced binary tree based feature selection (UBT-FS), which utilizes the indefinite information contained within rough set boundary region for reduction. UBT-FS designs the underlying mechanism for obtaining the boundary region from the unbalanced binary tree and adopts the boundary region based significance for determining the optimal search path as well as the boundary region based evaluation criterion for identifying feature subsets. These allow UBT-FS to have considerable ability in finding an optimal or suboptimal reduct whilst simultaneously achieving obviously better computational efficiency than other available algorithms, which is also supported by the experimental results. 相似文献
14.
基于粗集与遗传算法相结合的文本模糊聚类方法 总被引:1,自引:0,他引:1
该文将粗集与遗传算法相结合的方法成功应用于文本模糊聚类.在聚类过程中,将权重参数的设定也通过编码由遗传算法确定,从而使得权重参数的设定具有科学性和可操作性,避免了在类似算法中确定权重时的主观性和不可靠性.最后的实例说明了算法的可行性. 相似文献
15.
基于可变精度粗糙集的决策规则格构造 总被引:1,自引:1,他引:0
谷雨 《微电子学与计算机》2005,22(4):174-176,180
基于概念格理论提出了决策规则格的概念,格中的每一节点均可表示为相应的决策规则。针对格节点之间存在偏序关系的特点,文中给出了三种剪枝策略。特别地,将粗糙集知识约简的思想和可变精度粗糙集的β下近似思想应用于决策规则格的构造,有效地减少了格中节点的数目,并有较强的抗噪声数据干扰能力。 相似文献
16.
基于粗糙集的过程控制规则挖掘算法及应用 总被引:1,自引:0,他引:1
在现代工业生产过程中,如何从实际生产过程中提取出有用的规则,用于调整控制生产是过程控制中一个难题。文章提出了一种基于粗糙集的过程控制规则挖掘算法,可以较大的降低计算复杂度,并将算法用于实际烟草制丝生产线的关联规则提取.得到了可用于实际生产过程控制的规则。 相似文献
17.
18.
一种基于粗集理论的视频流派分类方法 总被引:1,自引:0,他引:1
视频分类提供了一种管理和利用视频数据的有效手段.现有的视频流派分类方法倾向于使用尽量多的特征,借此更有效地表示视频内容,以保证分类的效果,但提取这些视频特征的代价通常都很高,因此有必要考虑流派分类中的特征选择问题.提出了一种基于粗集理论的方法实现视频特征的选择和流派的分类:通过分析相关文献中所使用的各种特征.提取了多种有效特征构成分类的基础;基于启发式搜索的方法用于发现最优约简,从而实现特征选择;通过约简导出的分类规则实现流派标识的确定.与已有方法分类效果的比较以及与决策树方法的实验对比表明了文中方法的有效性. 相似文献
19.
基于近似域划分的可变离散精度粗逻辑网络及其遥感图像分类应用 总被引:1,自引:0,他引:1
为解决粗逻辑神经网络精度与网络规模复杂性和推广泛化能力之间的矛盾,该文提出了一种具有可变离散精度的粗逻辑神经网络设计方法.该方法通过近似域划分,将论域空间划分为确定性区域和可能性区域,由于可能性区域信息粒度过大是造成误分类的重要原因,只需对可能性区域离散区间进一步细化,即可达到提高粗逻辑网络的精度,同时抑制网络规模增长过快的目的.在长白山地区的遥感图像分类实验中,常规方法在离散等级为7时有最好性能,而该文方法以较小的网络代价和训练时间获得了逼近的分类结果. 相似文献
20.
基于类别分布差异和VPRS特征选择的文本分类方法 总被引:3,自引:0,他引:3
权值计算和特征降维是影响文本分类的精度和效率的两个重要步骤。该文首先根据特征词的类别分布差异进行特征过滤;然后,分析传统的权值公式TF-IDF的缺点,采用改进的权值计算公式简记为TF-CDF,依据TF-CDF公式计算每个特征词的权值,生成文档集的向量空间模型VSM;接着,提出了一种基于可变精度粗糙理论(VPRS)的特征选择进一步选择对分类贡献度大的特征,并用SQL实现。最后利用支持向量机LibSVM分类器进行实验,实验结果表明特征过滤和选择方法及TF-CDF权值公式有助于提高分类精度和分类效率。 相似文献