首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对传统支持向量机(SVM)在数据分类方面准确率识别较低的问题,提出了一种改进鲸鱼优化算法同步优化SVM的特征选择模型。首先,利用Levy飞行策略对鲸鱼优化算法的螺旋更新位置进行变异扰动,利用单纯形策略中的反射操作对种群中的精英个体进行反射点求解的改进,标准函数的测试结果证明其改进能有效提高算法的收敛速度和计算精度;其次,将SVM核参数和特征选择目标作为共同优化对象,在获得最优核参数的同时得到相对应的最优特征子集;最后,对UCI标准数据集和真实乳腺癌数据集进行特征选择仿真实验,在平均分类准确率、平均适应度值、适应度标准差和所选特征个数上进行评价。结果表明,本文算法在降低特征维度,实现数据分类上效果明显。在真实乳腺癌数据集上的分类精度与传统支持向量机相比提高了11.053%。  相似文献   

2.
对文本特征提取中的统计量方法进行了介绍,并且指出了该方法在分类中的不足之处;在此基础上,提出了一种改进的特征选择方法,并把该方法应用到后续的文本分类中.分类实验结果表明,分类准确率得到了一定的提高.  相似文献   

3.
对文本特征提取中的统计量方法进行了介绍,并且指出了该方法在分类中的不足之处;在此基础上,提出了一种改进的特征选择方法,并把该方法应用到后续的文本分类中.分类实验结果表明,分类准确率得到了一定的提高.  相似文献   

4.
突发事件类别众多,若采用传统的平面文本分类方法对突发事件分类,模型训练所需计算量剧增,并且对测试文本分类时要和全部分类器进行比较,导致极大的时间开销。根据突发事件类别体系结构层次性特点,提出了一种基于领域特征词的突发事件层次分类方法,将领域特征词自动提取算法用于特征选择,并在每个分类平面上采用改进的基于二叉树的SVM多类分类算法构建分类器。实验证明,基于领域特征词提取算法的特征选择方法优于传统方法,采用层次分类方法对突发事件分类,降低了时间复杂度,同时改善了分类效果,有效降低了错误分类的风险。  相似文献   

5.
为了有效解决中文文本分类问题,提高文本分类的准确性,提出一种基于TF-IDF和神经网络相结合的文本自动分类算法——TI-LSTM算法。算法根据语义情景提取相应特征,进行量化,通过长短期神经网络(LSTM)对量化后的特征进行训练并赋予权重,最后以特征权重为依据对中文文本信息进行评价。使用TI-LSTM算法可以在保留原文语义的情况下准确提取特征。将该算法应用到长春理工大学贫困生等级分类研究中。与传统的KNN、逻辑回归、朴素贝叶斯和LSTM分类方法进行了比较,训练和测试的准确率都有了较大的提升,准确率达到了86%以上。  相似文献   

6.
介绍了基于KNN方法的中文文本分类流程及相关技术,在分析传统KNN方法不足的基础上提出一种改进的KNN方法.该方法在特征选取、权值确定、相似度计算等方面进行了改进,并给出了优化措施.实验表明:与传统的KNN方法相比,改进后的KNN方法在保证分类准确率的同时,使分类效率得到了有效提高.  相似文献   

7.
针对传统文本分类算法准确率低和正确率分布不均匀的问题,提出了基于深度学习的文本分类算法。深度信念网络具有强大的学习能力,可以从高维的原始特征中提取高度可区分的低维特征,不仅能够更全面的考虑到文本信息量,而且能够进行快速分类。采用TF-IDF方法计算文本特征值,利用深度信念网络构造分类器进行精准分类。实验结果表明,与支持向量机、神经网络和极端学习机等常用分类算法相比,该算法有更高的准确率和实用性,为文本的分类研究开拓了新思路。  相似文献   

8.
针对疲劳驾驶引起的道路交通安全问题,提出一种改进蚁群优化(IACO)算法对车辆状态疲劳 特征进行优化。 将特征选择问题转化为全连接的无向图,引入 Fisher 分数与最大信息系数来提高搜 索效率、降低特征冗余度。 从车辆状态参数中提取疲劳特征,利用 IACO 算法对疲劳特征进行优化, 得到最优疲劳特征子集。 实验结果表明,IACO 算法的 SVM 分类准确率为 85. 6%、KNN 分类准确率 为 83. 2%,均高于其他常用特征优化算法的分类结果,说明 IACO 算法对疲劳特征的优化性能高于 其他常用特征优化算法。  相似文献   

9.
基于改进的kNN算法的中文网页自动分类方法研究   总被引:6,自引:0,他引:6  
概述了中文网页分类的一般过程,重点论述了在分类过程中特征词提取、训练库建立和文本分类算法等关键问题,针对向量空间模型的文本特征表示方法中特征词数量的多少与分类算法的效率有着密切关系的特点,提出了基于词性的特征词提取方法,并且在文本相似度计算时,融入传统的特征向量的比较方法来对kNN算法进行改进,提出了基于特征词减少的改进kNN算法,提高了分类算法的效率和性能.  相似文献   

10.
在处理高维小样本、高冗余、高噪声的基因微阵列数据时,无法采用传统特征选择方法进行分析。针对该问题提出了一种结合Relief和粒子群优化算法(Relief-PSO)的混合特征选择方法。首先采用Relief预选滤除部分特征,然后以SVM-PSO封装算法选择出最优特征子集,采用典型的小样本高维公共微阵列数据测试算法。结果表明,总体分类精度不低于85%,与SVMRFE,SVMDEA特征选择算法进行了比较,基于Relief和PSO的混合特征选择算法精度较高,能够有效应用于基因微阵列数据的分析。  相似文献   

11.
基于K-最近距离的自动文本分类的研究   总被引:13,自引:1,他引:13  
提出并实现了利用统计词频信息和语言信息相结合的方法选择特征,计算特征的权重值时不仅考虑词频,还利用了特征的集中度、分散度.经过训练和统计对每一类文本形成特征的权重向量,利用K-最近距离的方法对测试集进行分类.对英文文本的测试结果表明,该算法提高了文本分类的准确率.  相似文献   

12.
针对传统网页分类中存在的准确率和查全率不高、分类效率低的情况,提出一种基于朴素贝叶斯分类的网页预分类算法.算法根据用户的网上活动情况提取相关网址,分析网页内容和网页关键词,利用朴素贝叶斯分类算法进行分类,根据用户对各类网页的浏览情况分析用户的行为特征.采用改进的文本权值计算方法,并引进网址预分类机制,提高数据的处理效率以及分类的准确率.结果表明,网址分类算法准确,能够充分发掘用户的兴趣喜好,可以作为用户行为分析的数据算法进行商业推广和司法取证.  相似文献   

13.
针对率失真性能和算法复杂度约束,提出基于偏移量自适应模式预选的高效帧间模式选择算法.计算所有可能模式率失真优化关闭判据下的编码代价,对代价进行自适应偏移量调整.基于调整后的代价进行模式预选,选择几种性能可能较优的候选模式,对这些模式进行率失真优化模式选择.由于该算法采用统计分析建模方法,自适应地确定偏移量参数,显著提高了模式预选准确率,较好地平衡了复杂度和算法性能.针对典型视频测试序列进行算法验证.实验表明,与完全率失真优化模式选择算法相比,该算法的复杂度大大降低,视频质量仅存在轻微退化.  相似文献   

14.
焊接缺陷的分类属于不平衡样本多分类问题,在不平衡样本中重要的特征子集通常也不相同,需要通过特征选择获得更具差异性的特征,提高稀有类样本的识别率。使用支持向量机作为分类器评价特征子集,人工免疫系统算法寻找可靠的特征,并且利用人工免疫算法优化支持向量机的参数,目的是同时完成参数优化和特征子集的选择。将此算法应用于低碳钢对接焊、低碳钢角接焊、低碳钢T型焊、低碳钢搭接焊、不锈钢对接焊、不锈钢角接焊、不锈钢T型焊、不锈钢搭接焊8类焊接缺陷数据集上进行常见焊接缺陷的气孔、夹渣、裂纹、未熔合、未焊透和伪缺陷的分类识别,并与未进行特征选择直接进行分类的结果进行比较及不同特征选择和分类算法下进行比较。结果表明,采用本文算法,焊接缺陷的气孔、夹渣、裂纹、未熔合、未焊透和伪缺陷的的平均分类准确率达到了(96.21±0.67)%,平均敏感度值达到了(85.43±1.65)%,比传统的基于相关性的特征选择算法(CFS)、最小冗余最大相关性算法(m RMR)、粗糙集条件互信息算法(RCMI)特征选择法和贝叶斯(Bayes)、分类回归树(CART)分类方法的组合具有明显的提高。因此,本文算法优于传统分类方法,利用较少属性的同时提高焊接接头缺陷分类准确率,保证稀有类的识别率,并能够提供不同缺陷的最优特征参数。  相似文献   

15.
改进的离散PSO和SVM的特征基因选择算法   总被引:2,自引:0,他引:2  
针对现有的基于粒子群的特征基因选择算法易于陷入局部最优的问题,提出了一种改进的离散粒子群和支持向量机的特征基因选择算法IDPSO-SVM.该算法首先预选一些与分类强相关的基因组成特征基因备选集合,然后基于此集合采用PSO进行寻优搜索,并应用SVM对选出的特征子集的分类能力进行评估,最后得出最优特征子集.该算法加入了一种可以有效克服粒子群在寻优过程中陷入局部最优的机制,因而可以不断探测到新的最优解.该算法在结肠癌与前列腺癌数据集上的分类精度分别达到了96.8%与99.0%,从而证明了其有效性与可行性.  相似文献   

16.
一种新的混合特征选择方法RRK   总被引:2,自引:1,他引:1  
提出一种新的基于包装方法和过滤器方法的混合特征选择算法RRK。该算法主要包括两个方面:①在特征预选阶段,提出一种基于ReliefF算法的特征加权算法NReliefF和降维算法DR,以实现特征加权并去掉不太重要的特征;②在特征选择阶段,把NReliefF算法和KNN算法结合起来,将预选特征作为输入,用分类正确率来选择最优特征。分别采用一个实际的乘员类型数据集和UCI上的imagine标准数据集进行了实验。实验结果表明,采用RRK后分类的效率和正确率都有明显提高。  相似文献   

17.
在对未知应用静态分析的基础上,提取AndroidManifest.xml中申请的权限为特征,采用信息增益算法优化选择分类特征,再采用拉普拉斯校准、乘数取自然对数改进的朴素贝叶斯算法创建恶意应用分类器.通过十折交叉试验验证改进的朴素贝叶斯分类器的准度和精度较高,且通过信息增益优化选择的分类特征在保障准确率的情况下能有效提高检测效率.与k最近邻和k-Means分类器相比,改进的朴素贝叶斯分类器具有较好的分类效果.  相似文献   

18.
基于知识语义权重特征的朴素贝叶斯情感分类算法   总被引:1,自引:0,他引:1  
针对文档级情感分类的准确率低于普通文本分类的问题,提出一种基于知识语义权重特征的朴素贝叶斯情感分类算法.首先,通过特征选择的方法,对情感词典中的词进行重要度评分并赋予不同权重.然后,基于词典极性的分布信息与文档情感分类的相关性,将情感词的语义权重特征融合到朴素贝叶斯分类中,实现了新算法.在标准中文数据集上的实验结果表明,提出的算法在准确率、召回率和F1测度值上都优于已有的一些算法.  相似文献   

19.
为了降低特征冗余,提高移动用户行为识别的准确率,提出一种基于蚁群算法的移动用户行为识别加速度信号特征优选方法。首先对样本数据进行预处理,根据特征对不同行为的分类敏感度进行初次优选,降低特征搜索空间的维度;然后利用蚁群算法结合神经网络分类器,以特征的分类准确度为评价准则对特征集合进行了二次优选。实验结果表明,该方法优选出的特征集具有较好的识别性能。  相似文献   

20.
一种基于文本分类的特征选择方法   总被引:1,自引:0,他引:1  
文本分类中通常采用向量空间模型(VSM)来表示文本特征,如何选择最能够表达文本主题的特征词,从而减少特征空间维数,降低时空复杂度,是一个十分重要的问题。针对此问题本文提出了采用截集模糊C-均值(S2FCM)聚类进行类间特征降维,该方法以最大隶属度原则为指导,在保持模糊聚类的同时,提高收敛速度,并且能够提高特征选择的正确性。同时在算法中使用改进的隶属度、聚类中心计算方法并使用非随机方法确定初始聚类中心。最后实验表明采用该方法选择的文本特征项进行文本分类能够收到比较好的分类结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号