共查询到19条相似文献,搜索用时 74 毫秒
1.
为解决投诉举报文本分类困难这一问题,提出一种基于改进果蝇优化算法的文本分类方法.针对果蝇优化算法存在的搜索半径相对固定、种群多样性低等问题,对算法进行改进;采用支持向量机建立文本分类模型,利用改进后的果蝇优化算法对支持向量机的参数进行动态寻优,以此提高模型的分类精度.实验结果表明,该文本分类方法的准确率和召回率相比于文... 相似文献
2.
3.
《计算机科学与探索》2016,(5):709-721
通过引入置信规则库的线性组合方式,设定规则数等于分类数及改进个体匹配度的计算方法,提出了基于置信规则库推理的分类方法。比较传统的置信规则库推理方法,新方法中规则数的设置不依赖于问题的前件属性数量或候选值数量,仅与问题的分类数有关,保证了方法对于复杂问题的适用性。实验中,通过差分进化算法对置信规则库的规则权重、前件属性权重、属性候选值和评价等级的置信度进行参数学习,得到最优的参数组合。对3个常用的公共分类数据集进行测试,均获得理想的分类准确率,表明新分类方法合理有效。 相似文献
4.
5.
基于K近邻的支持向量机分类方法 总被引:3,自引:0,他引:3
针对支持向量机对噪声和孤立点非常敏感,以及对大规模且交错严重的训练集支持向量个数多,分类速度慢和精度低等问题,基于KNN方法提出KNN-SVM分类器.首先在特征空间中,根据每个样本K个近邻中同类别样本数目的多少来删减样本集,然后对新样本集进行SVM训练;又证明了当取高斯核函数或指数核函数时,上述删减方法可简化为在原空间中进行.该方法减少了由噪声和孤立点以及一些对分类面贡献不大的样本所带给训练器的负担,减少了支持向量的个数,从而与SVM相比,加快了训练和测试速度,提高了分类精度.仿真实验表明KNN-SVM具有上述优势,而且比NN-SVM更能合理地删减样本集,达到更高的分类精度. 相似文献
6.
为了进一步提高支持向量机分类的准确性和泛化能力,提出一种基于支持向量机的改进二叉树分类算法.首先介绍支持向量机的基本原理,总结了常见的多分类器分类算法及其特点,结合现有分类算法的优点,为分类器引入了不同的权值,提出二叉树改进分类算法,有效避免了常用分类算法不足.通过仿真实验,与典型的多类分类算法对比,验证该算法的有效性,为多类分类预测研究提供了一条有效的途径. 相似文献
7.
基于结肠癌基因表达数据,运用信息科学的方法和技术建立结肠癌的预测分类模型,对结肠癌的识别具有重要意义。在建立模型的过程中,如何能够有效的排除噪声基因进而挑选出分类特征基因对结肠癌预测的准确性有着非常重要的影响。针对该类问题,这篇文章提出了一种新的特征基因选取方法,并以支持向量机作为分类器建立结肠癌分类预测模型,最后以结肠癌的基因表达谱作为实验数据进行了实验,实验结果表明上述方法的可行性和有效性. 相似文献
8.
9.
刘冰 《数字社区&智能家居》2007,1(6):1590-1593
介绍分析了SVM基础理论和目前多类SVM分类算法及其优缺点,提出了一种边界向量抽取算法,并基于该算法改进了1ar和1a1两种多类SVM算法。实验结果表明该边界向量抽取算法可以有效的减少训练样本的数量,在保持分类器推广能力的条件下缩短SVM的训练时间,特别是在大样本训练数据时1arΔ可以提供最好的训练性能。 相似文献
10.
随着客户关系管理系统的不断发展和应用,使用先进的算法进行客户分析变得越来越重要.尤其是象银行这种以客户为导向的行业,客户分析是十分必要的.当前,支持向量机方法作为一种统计学习理论的分类方法已经发展的哪比较成熟而且成功应用到了很多领域.文章解决的主要问题是对银行的客户数据根据其属性对客户进行分类,为银行的客户关系管理系统提供一种可靠的分类方法.文中主要介绍了银行的客户分类学习的过程和结果,如,客户数据清洗,数据预处理,SVM进行数据分类,多类分类处理,客户属性选择等问题. 相似文献
11.
12.
13.
低层特征的选择与提取是自动图像分类的基础,一方面,所选择的图像特征应能代表各种不同的图像属性,利于不同类别图像之间的区分;另一方面,为了提高后续模型的计算效率,需要减少噪声特征、冗余特征.提出了一种基于特征加权的自动图像分类方法.该方法根据图像低层特征分布的离散程度来衡量特征相对于类别的重要性,增加相关度高的特征的权重,降低相关度低的特征权重,从而避免后续模型被弱相关或不相关的特征所支配.所提的特征加权算法主要考察的是特征相对某个具体类别的重要程度,可以为每个类别选择出适合自身的特征权重.然后,将加权特征嵌入到支持向量机算法中用于自动图像分类,在Corel图像数据集上的实验结果表明,基于特征加权的自动图像分类算法可以有效地提高图像分类的准确性. 相似文献
14.
15.
16.
随机森林与支持向量机分类性能比较 总被引:5,自引:0,他引:5
随机森林是一种性能优越的分类器。为了使国内学者更深入地了解其性能,通过将其与已在国内得到广泛应用的支持向量机进行数据实验比较,客观地展示其分类性能。实验选取了20个UCI数据集,从泛化能力、噪声鲁棒性和不平衡分类三个主要方面进行,得到的结论可为研究者选择和使用分类器提供有价值的参考。 相似文献
17.
18.
与蓝色牌照的固定格式相比,白色牌照的字符排列方式呈现多变的特点。如果能够对白色车牌的字符进行准确分割及分类,就可以提高整个系统的识别正确率。首先根据车牌内字符间的排列方式使用支持向量机进行分类,然后根据该类车牌的标准排列模型,即可实现对车牌字符的准确分割及分类。实验结果表明,该方法正确率较高,稳定性好。 相似文献