首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
基于支持向量机的兼类文本分类算法研究   总被引:1,自引:0,他引:1  
针对兼类文本,提出了两种基于支持向量的分类算法.一种是采用1-a-1方法训练子分类器,通过子分类器得到待分类样本的隶属度矩阵,依据隶属度矩阵每行元素和判定该文本所属类别.另一种是采用1-a-r方法训练子分类器,通过子分类器得到待分类样本的隶属度向量,根据隶属度向量判定该文本所属的类别.实验结果表明,这两种算法都具有较好的准确率,召回率和F1值.  相似文献   

2.
提出了一种基于最大隶属度原则的基因表达式编程(Gene Expression Programming,GEP)分类方法MDM-GEP。引入模糊集合中的隶属度描述分类的模糊性,在训练集上得到逼近各类别隶属函数的GEP分类器。对于待分类实例,计算其在各模糊集中的隶属度,基于最大隶属度的模糊模式识别原则确定最终归属类,并在三个UCI数据集上对该算法进行了实验。实验结果表明,MDM-GEP不仅具有较好的分类性能,而且有效解决了传统的简单GEP分类方法中存在的拒分区域问题。  相似文献   

3.
基于相似性进行文本分类是当前流行的文本处理方法。基于特征隶属度的文本分类相似性度量方法旨在利用特征与文档间的隶属关系度量文档相似性,从而实现文本分类。该方法基于特征与文档的隶属关系,对特征进行全隶属、偏隶属和无隶属词集划分,并基于3种隶属词集定义隶属度函数。全隶属词集隶属于两篇文档,隶属度随权差增大而降低;偏隶属词集仅隶属于其中某一篇文档,隶属度为一个定值;无隶属词集与两篇文档无隶属关系,隶属度为零。在度量相似性时,偏隶属关系高于全隶属关系。由于同类文档词集相近,异类文档词集差异明显,因此,基于特征与文档的隶属度进行相似性度量,可清晰界定词集与类别的隶属关系,提升分类精度。最后,采用数据集20-Newgroups和Reuters-21578对分类有效性进行验证,结果表明基于特征隶属度的相似性度量方法的性能优于目前流行的相似性度量方法。  相似文献   

4.
基于直觉模糊集的基本概念,考虑其隶属度与非隶属度两个因素的影响,定义了一种多值直觉模糊集,并给出了五种多值直觉模糊集的隶属度与非隶属度的综合评判准则,即算术平均法、几何平均法、去掉最大最小值算术平均法、隶属度中值法、非隶属度中值法,从而使直觉模糊得到了拓广和应用.  相似文献   

5.
通过文档基于模糊限定词的特征表达,定义特征的模糊函数,将文档表示为隶属度限幅的特征向量,构 造文本集隶属度限幅的类特征矩阵,将每一类文本集映射为类期望向量,所有类期望向量便构成了隶属度限幅 的特征VSM。在此基础上设计了一种新的文本分类模型。实验结果证明,该分类模型能有效实现文本分类。  相似文献   

6.
针对直觉模糊集(IFS)的非隶属度函数难以确定的问题,提出一种基于三分法的IFS非隶属度函数确定方法.首先,给出了确定IFS非隶属度函数的计算公式和非犹豫度指数的概念,规范了IFS非隶属度函数的确定方法,进而给出了非犹豫度指数的性质定理.其次,提出了基于三分法的IFS非隶属度函数的计算方法,给出了正规直觉模糊集的概念,证明了该方法确定的直觉模糊集是正规直觉模糊集.最后,以空袭目标识别的指标参数(飞行高度)实例,验证了方法的有效性.  相似文献   

7.
秦玉平  陈一荻  王春立  王秀坤 《计算机科学》2011,38(11):204-205,224
提出了一种基于超椭球的兼类文本分类算法。对每一类样本,在特征空间求得一个包围该类样本的最小超椭球,使得各类样本之间通过超椭球隔开。对待分类样本,通过判断其是否在超椭球内确定其类别。若没有超椭球包围待分类样本,则通过隶属度确定其所属类别。在标准数据集Reuters 21578上的实验结果表明,该方法较超球方法提高了分类精度和分类速度。  相似文献   

8.
多主题文本分类的实现算法   总被引:4,自引:1,他引:3       下载免费PDF全文
针对一个文本具有多主题属性,提出一种基于模糊支持向量机的多主题文本分类算法。用1-a-r方法训练子分类器,计算待分类文本到每个超平面的距离,依据距离得到隶属度向量,根据隶属度向量判定该文本所属的主题。实验结果表明,该算法在保证单主题文本分类精度的前提下,实现了多主题文本分类,并且有较好的准确率、召回率和F1值。  相似文献   

9.
通过粗隶属函数,将粗糙集理论与模糊集理论联系起来,建立一种粗糙集理论与模糊集理论间的关系。把粗隶属函数视为论域上的一个特殊模糊集,用它的!-截集和强"-截集的概念,将经典粗糙集模型进行推广,提出基于等价关系的隶属度粗糙集模型,验证一些有用的性质,并证明该模型比Pawlak粗糙集模型具有更好的精度。最后将基于等价关系的隶属度粗糙集模型拓展到基于一般二元关系的广义隶属度粗糙集模型,并给出其相应的性质。  相似文献   

10.
汤建国  佘堃  祝峰 《控制与决策》2012,27(11):1653-1662
在覆盖粗糙集与模糊集结合的研究中,已有的覆盖粗糙模糊集模型存在两类问题:一类是元素的上、下近似隶属度之间的差值通常过大;另一类是元素的上、下近似隶属度与其在给定模糊集中的隶属度无关.对此,通过定义模糊覆盖粗糙隶属度,将元素的最小描述与给定模糊集建立联系,同时综合元素在给定模糊集中的隶属度,进而建立一个新的覆盖粗糙模糊集模型.理论比较和实验结果均表明该模型可以有效解决上述两类问题.  相似文献   

11.
改进了模糊支持向量机隶属度函数设计方法。考虑样本分布不确定的问题,使用灰色关联度代替现有方法中的欧氏距离,定义了样本的平均灰色绝对关联度;针对噪声识别过程中支持向量对分类贡献被削弱的问题,提出了基于同类中心和异类中心双参照点的噪声判别方法;分析了模糊支持向量机求解对偶问题中参数与支持向量的对应关系,进而给出新的隶属度函数设置步骤。实验结果说明了方法的有效性及实用性。  相似文献   

12.
张秋余  竭洋  李凯 《计算机应用》2008,28(12):3227-3230
针对模糊支持向量机在文本分类应用中的隶属度函数确定问题,提出了一种基于模糊支持向量机与决策树的文本分类器的构建方法。该方法不仅考虑了样本与类中心之间的关系,还根据传统支持向量机中包含支持向量且平行于分类面的平面构建切球,来确定类中各个样本之间的关系,由样本点与球的位置关系计算其隶属度,可以合理地区分有效样本和噪音、孤立点样本。并与决策树方法相结合,实现多类分类。实验结果表明,该方法具有良好的分类效果。  相似文献   

13.
针对蚁群系统(Ant Colony System,ACS)容易陷入局部最优和收敛速度较慢的不足,提出了自适应模糊蚁群系统(AF-ACS)用于旅行商问题(TSP)。该算法的核心是引入模糊隶属度和信息熵的概念,AF-ACS将以信息熵为概率,自适应地对ACS引入模糊隶属度,以平衡算法的种群多样性与收敛速度之间的关系。算法早期引入模糊隶属度的概率较小,保证算法的多样性;算法后期引入模糊隶属度的概率较大,提高算法的收敛速度。通过与ACS和ECACS(Entropy-based Adaptive Chaotic Ant Colony Algorithm)进行14种不同规模的TSP测试集实验对比,AF-ACS以较少的迭代次数取得最优解或较优解。从而证明了AF-ACS的可行性与高效性。  相似文献   

14.
Abstract: In generating a suitable fuzzy classifier system, significant effort is often placed on the determination and the fine tuning of the fuzzy sets. However, in such systems little thought is given to the way in which membership functions are combined within the fuzzy rules. Often traditional fuzzy inference strategies are used which consequently provide no control over how strongly or weakly the inference is applied within these rules. Furthermore such strategies will allow no interaction between grades of membership. A number of theoretical fuzzy inference operators have been proposed for both regression and classification problems but they have not been investigated in the context of real-world applications. In this paper we propose a novel genetic algorithm framework for optimizing the strength of fuzzy inference operators concurrently with the tuning of membership functions for a given fuzzy classifier system. Each fuzzy system is generated using two well-established decision tree algorithms: C4.5 and CHAID. This will enable both classification and regression problems to be addressed within the framework. Each solution generated by the genetic algorithm will produce a set of fuzzy membership functions and also determine how strongly the inference will be applied within each fuzzy rule. We investigate several theoretical proven fuzzy inference techniques (T-norms) in the context of both classification and regression problems. The methodology proposed is applied to a number of real-world data sets in order to determine the effects of the simultaneous tuning of membership functions and inference parameters on the accuracy and robustness of fuzzy classifiers.  相似文献   

15.
模糊集间的语义关联度及其应用   总被引:7,自引:0,他引:7  
何新贵 《软件学报》1994,5(6):19-24
本文提出了一种描述模糊集间近似程度的语义关联度概念,它不仅与模糊集论域元素的隶属度有关,而且考虑了论域元素间的语义近似程度,因此它比过去模糊数学中定义的各种距离和贴近度等概念更加精细地刻划了模糊集间的相似性,从而在人工智能和其它领域中可有广泛应用,文中列举了它在情报检索和正文分类等方面的应用实例。此外,论文还给了两种近似地计算语义关联度的算法。  相似文献   

16.
在经典的模式识别理论中,Viterbi算法代表了统计概率的模式匹配算法,而DTW算法代表了模版匹配的模式匹配算法,它们之间是否存在关系至今尚无定论.为了找到这两种算法之间的关系,在类别隶属度是广义概率的假设前提下,应用模糊数学的理论在Viterbi算法与DTW算法之间建立起联系.首先,提出了利用模糊数学的贴近度把DTW算法的距离向Viterbi算法的概率转化的通用贴近度表达式,并对通用贴近度表达式给出了理论上的证明.其次,应用DTW的通用贴近度表达式重估HMM参数,建立DTW算法与Viterbi算法之间的模糊贴近度关系,并为此提出了δ-ε算法,得到基于数据帧的类似于HMM的参数重估形式.然后,为了确保建立DTW算法与Viterbi算法之间的模糊贴近度关系的正确性,以定理的形式给出了相应的证明.再次,通过设定的DTW贴近度表达式对HMM参数重估的过程中,发现了DTW贴近度的重估参数与HMM重估参数之间存在着的模糊关系,以定理的形式对这种模糊关系加以证明.最后,依据上述定理提出了Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法,以定理的形式对Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法的正确性加以证明,并将对Dtw-ViterbiⅠ...  相似文献   

17.
复杂设备的故障特征具有不确定性,非线性等特点,为预防故障可能造成的严重后果,提高故障预测准确性是非常必要的.针对故障预测具有不确定性的特点,本文将模糊数学中的模糊贴近度和粒子滤波算法相结合设计故障预测的方法.新方法利用隶属度函数设计了描述系统运行正常的正常模糊子集和运行异常的异常模糊子集,利用粒子滤波算法计算系统运行的预测值,并计算预测值的正常隶属度;再分别计算预测值的正常隶属度与正常模糊子集和异常模糊子集的贴近程度来实现故障预报.该方法通过三容水箱系统T2水箱水位变化预测三容水箱系统是否出现故障和通过UH-60行星齿轮盘裂纹何时开始增大的故障进行实验,并同基于改进余弦相似度的粒子滤波故障预报、基于随机摄动粒子滤波器的故障预报算法和基于粒子滤波的FDI方法进行了对比.实验验证了该方法的可行性,可及时准确地预测出系统故障.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号