首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
中文文本分类中的特征选择算法研究   总被引:34,自引:0,他引:34  
比较了文档频率、信息增益、互信息、X^2统计量、期望交叉熵、文本证据权以及几率比等7种常用于文本分类的特征选择算法。实验采用国家“八六三计划”中文文文本语料库和Rocchio分类器对以上的特征选择算法分别进行评估,测评结果表明,几率比法的性能优于其它特征选择算法。  相似文献   

2.
针对调制信号分类特征选择问题,提出了自适应惯性权重模拟退火二进制离散粒子群算法。该算法将模拟退火算法嵌入到离散粒子群算法循环体中,利用模拟退火算法具有较强的局部搜索能力和避免陷入局部最优解的特点,解决了简单智能优化算法早熟收敛和局部搜索能力弱等问题。仿真结果表明,该算法能有效选取最优特征,性能优于简单离散粒子群算法和遗传算法。  相似文献   

3.
《现代电子技术》2017,(17):47-50
为了提高图像分类的效果,考虑当前方法准确实现图像分类的难题,提出粒子群优化算法选择特征的运动图像分类方法。对当前运动图像分类方法的研究现状进行分析,提取不同类型的图像,并采用粒子群优化算法选择最优特征,组成特征向量,将特征向量机作为神经网络的输入,实现运动图像的分类。采用具体图像分类实验进行验证,结果表明,该方法可以描述不同运动图像的类别信息,缩小图像的分类误差,避免其他图像分类方法的缺陷,提高了图像的整体分类正确率。  相似文献   

4.
通过在不同文本数据集上的试验表明,文中提出的算法具有不错的表现。与文本分类中常用的特征选择算法IG、CHI相比,文中算法是有效的且能够提高分类的精确率。  相似文献   

5.
吴丹 《电子世界》2013,(12):109-110
负选择算法是人工免疫的分支,对自我和非我细胞区分过程进行计算模拟。由于负选择算法具有对于自我和非我较强的判别能力,可以模拟数据分类。本文在对特征提取算法,人工免疫系统以及负选择算法深入研究之后,将基于改进的负选择理论应用于数据分类。主要采用对检测器的改进提高负选择算法的检测率,采用自然计算方法优化负选择算法,通过其高效的全局搜索能力和局部搜索能力,优化负选择算法,并将其应用到数据分类,设计基于新算法的数据分类系统,检测该系统的效率。  相似文献   

6.
王晓微 《电子技术》2007,34(11):132-134
由于网络的发展,中文文本的分类技术也有待提高.向量空间模型是中文文本分类中常用的模型,词作为中文文本的特征,其维数很高,如此高的维数对分类并不是都有用的.所以对特征的选择尤为重要,文章通过两种分类器对多种特征选择方法在同一平面内进行比较,将分类器的各种参数设为最优状态,得到了IG的分类效果较好,并且利用了平均查全率对不同的特征选择方法进行纵向与横向的比较,实验证明,SVM整体的分类效果要优于KNN的分类效果.  相似文献   

7.
高慧敏  王云鹤  卞闯  李向涛 《电子学报》2023,51(6):1619-1636
特征选择(Feature Selection,FS)是一种有效的数据预处理方法,它可以通过选择高维数据中一组具有高相关性和低冗余性的特征,从而解决数据冗余引起的维数灾难.目前许多计算方法已经被应用于求解FS问题,其中基于教与学优化(Teaching and Learning-based Optimization Algorithm,TLBO)的特征选择模型由于其高效的全局搜索能力受到越来越多学者的关注.然而,随着数据规模的不断扩大,这些算法所具有的模型不稳定、模型精确度低和局部搜索能力差等局限性,使算法的研究逐步陷入困境.为解决上述问题,本文提出了融合教与学优化算法与局部搜索方法(Local Search,LS)的混合进化Wrapper算法模型(Teaching and Learning-based Optimization-Local Search Algorithm,TLBOLS).首先,由于传统的教与学优化算法不能直接用于求解特征选择问题,算法在初始化阶段将实数型编码转为二进制编码,然后为保证种群的多样性,在教阶段引入最差个体重启机制,并针对进化班级过程中学习者与教学者两种身份采...  相似文献   

8.
目前在文本分类领域较常用到的特征选择算法中,仅仅考虑了特征与类别之间的关联性,而对特征与特征之间的关联性没有予以足够的重视.在特征相关性分析的基础上,提出了一种新的算法,改进了特征选择算法中所出现的上述问题.实验验证了算法的可行性和有效性.  相似文献   

9.
适用于不确定文本分类的特征选择算法   总被引:1,自引:0,他引:1  
王博  贾焰  杨树强  周斌 《通信学报》2009,30(8):32-38
基于Hilbert-Schmidt依赖性准则提出了一种新颖的特征选择算法FSUNT,重点考虑特征选择过程中可能出现的模糊性和不确定性.针对类标号不确定而其他特征值确定的文本数据,通过考察特征与不确定的类标号间的Hilbert-Schmidt相关性,对特征进行排序,并选取最终的结果子集.最后大量真实与仿真实验结果表明,基于该算法可得到良好的分类效果和稳定性.  相似文献   

10.
包分类是多种网络应用的关键性技术,包分类算法的性能对网络的时延和吞吐量有决定性的影响。本文通过介绍包分类应用中常用的哈希算法和递归流分类算法的原理,比较它们的性能特点和应用范围,阐述在应用中各自的优缺点。  相似文献   

11.
刘怡  蔚磊  刘子利  王鹏 《电子学报》2008,36(Z1):152-156
 歌曲风格的自动分类技术研究,是音乐信息检索领域中一个重要课题.本文主要讨论了对中国民歌地域风格自动分类中不同特征选择方法对于分类性能的影响.论文选用10个不同地域的1392首原生态中国民歌,进行了地域风格的分类实验.实验结果表明:在多种分类器的试验中,SVM分类器的分类准确率最高;在多种特征选择实验中使用SVM与Active Feature Selection的特征选择方法的分类准确率最高,为83%,且选择出的有效特征参数从74维降为35维,更便于进行参数分析.  相似文献   

12.
分支界定算法是目前为止惟一既能保证全局最优,又能避免穷尽搜索的算法。他自上而下进行搜索,同时具有回溯功能,可使所有可能的特征组合都被考虑到。对分支界定算法进行研究,并对其做了一些改进;最后对改进前后的算法在特征选择领域进行比较,选择效率有了明显的提高。  相似文献   

13.
文本分类中改进型互信息特征选择的研究   总被引:5,自引:2,他引:3  
互信息是文本分类中常用的特征选择方法.提出了一种新的基于互信息的特征选择方法.首先分析了特征选择影响文本分类精度的因素,将这些因素组合起来表征特征对于分类的强弱,并用公式直观地表示由组合因素计算出的特征值,根据这些值得大小选择对分类影响大的特征.最后理论证明了其可行性,并通过实验证明了该方法在提高分类精度方面比传统方法提高了10%.  相似文献   

14.
特征选择是机器学习和模式识别领域的一个关键问题。文中详细分析研究一类基于K近邻分类间隔的特征选择算法,并着重讨论当K〉1时,特征选择的评价准则和搜索策略的设计,同时在多个数据集上验证其性能。  相似文献   

15.
使用智能手机中集成的加速度传感器识别用户日常动作在惯性定位、个性化推荐、运动量评估等领域有重要的应用。手机位置不固定导致的动作识别率低下是该领域面临的主要问题。为了提高手机位置不固定时的动作识别率,该文提出一种基于层次分类的动作识别方法。该方法将动作识别分为多层,每一层包含一个分类器。在训练某一层分类器时,首先根据本层训练样本集进行特征选择并训练分类器。然后使用训练得到的分类器对训练样本分类,并计算分类结果的可信度。最后通过对低可信度的样本进行剪枝得到下层分类器的训练样本。对未知类别的样本分类时,首先使用第1层分类器分类。如果分类结果可信度较高,则分类结束;否则使用下层分类器分类,直至所有分类器遍历完。实验部分通过对采集的动作数据进行仿真,验证了该文方法的有效性。结果表明,与单层分类器相比,该方法可以将动作识别率由85.2%提高至89.2%。  相似文献   

16.
SVM全极化SAR图像分类中的特征选择   总被引:1,自引:0,他引:1  
本文将SVM用于全极化SAR图像分类,并提出一种新的应用于SVM分类的特征选择算法。该算法以支持向量个数作为特征评估准则,利用顺序前进法加入特征。基于NASA/JPL实验室AIRSAR系统的L波段荷兰Flevoland全极化数据的与RELIEF-F算法的对比实验表明,在特征个数更少(或相当)的情况下,本文特征选择算法能在更广泛的SVM参数取值范围内获得更高的分类精度。  相似文献   

17.
本文研究可视化技术在分类算法中的应用.通过将数据进行预处理成为符合要求的数据后,然后调用数据挖掘中分类算法选择不同的可视化方法展示不同的可视化模型结果.通过采用不同的可视化技术,可以从不同角度分析数据挖掘的结果,对其有深刻直观的理解,从而打破传统挖掘算法的黑盒子模式,对数据挖掘的应用度显著提高.  相似文献   

18.
将基于决策树的特征选择方法应用于卫星故障检测中,在卫星故障检测应用研究中,综合分析了问题的特征,指出了基于决策树的特征选择方法,并且给出了在该方法下,特征选择算法的正确率和在卫星故障检测中的应用效果。  相似文献   

19.
在线流特征选择通过实时过滤无关特征和冗余特征,实现流特征空间降维.针对已有算法,如Alpha-investing分类精度低、SAOLA选择特征数多和OSFS在低冗余高相关数据集下运行时间长的问题,提出了一种面向分类的流特征在线特征选择算法——OSFIC.算法运用四层过滤框架,通过无条件独立过滤不相关新特征、单条件下互信息过滤冗余新特征和候选特征集合中的部分冗余特征,最后通过多条件独立过滤候选特征集中的剩余冗余特征,最终得到分类标签的近似马尔可夫毯.为了分析OSFIC的性能,选择了NIPS 2003和Causality Workbench中的数据集,从预测精度、特征数量、运行时间和AUC方面与已有基准算法进行比较.实验表明,OSFIC平均分类精度比Alpha-investing提升4.41%.在保证精度的前提下,平均特征数量比SAOLA减少41.9%,运行时间比OSFS减少91.59%.最后,在真实的应用场景下验证了OSFIC的有效性.  相似文献   

20.
针对现有的图像分类学习方法无法对特定对象的分类识别任务进行特征选取的不足,提出了利用异构特征组进行选取的方法,使用水墨画低阶视觉特征对水墨画进行分类识别。该算法首先提取图像中低阶异构特征去描述水墨画独特艺术风格,确定水墨画高阶语义特征和低阶异构特征的对应关系;改进Lasso模型可提取异构特征子集中最可体现此画家典型艺术风格的特征,实现水墨画低阶异构特征和不同作者艺术风格之间的映射关系。采用异构特征组可获得水墨画艺术风格特征信息并对其进行分类识别。实验结果表明,与SVM、Lasso方法相比,该方法能有效地提取异构特征组信息,可以获得水墨画艺术风格深度信息,并能够取得较好的水墨画分类识别性能,提高识别率和鲁棒性,实现水墨画自动分类识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号