首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
对文本特征选择的传统方法进行了深入分析并对各自的优缺点进行了详细的对比;其次,通过利用遗传算法自身的寻优特点,把它与传统特征选择方法相结合,并得出了算法。最后,在对各自算法进行了分析,表明了在性能上有了明显的提高。  相似文献   

2.
文本分类中一种混合型特征降维方法   总被引:5,自引:1,他引:4       下载免费PDF全文
提出一种基于特征选择和特征抽取的混合型文本特征降维方法,分析基于选择和抽取的特征降维方法各自的特点,借助特征项的类别分布差异信息对特征集进行初步选择。使用一种新的基于PCA的特征抽取方法对剩余特征集进行二次抽取,在最大限度减少信息损失的前提下实现了文本特征的有效降维。对文本的分类实验结果表明,该特征降维方法具有良好的分类效果。  相似文献   

3.
特征选择是中文文本分类过程中的一个关键环节,文本特征项选择的优劣将直接影响文本分类的准确率。针对传统的特征选择算法没有考虑到特征项的类别区分度在特征选择中的作用而丧失了一些优秀的特征项的问题,文中通过引入特征项的类别区分度对传统的特征选择算法进行改进。实验结果表明,改进方法的分类效果要好于传统方法,从而验证了改进方法的有效性和可行性。  相似文献   

4.
针对利用单一特征集对肠癌病理图像的识别率难以提高这一情况,提出了一个基于HOG-GLRLM特征肠癌病理图片分类方法。考虑到图像中丰富的纹理和边缘信息,分别利用改进型的灰度行程矩阵和梯度方向直方图提取特征。并采用最小冗余最大关联的方法对各自和合并特征集进行特征选择。实验结果表明该方法的有效性。  相似文献   

5.
特征选择是一种常用的机器学习降维方法,然而传统非监督特征选择算法在保持数据样本维度的局部结构时,却忽略了排序局部性对特征选择的影响。利用数据的三元组局部结构,构建数据之间的排序关系并在特征选择过程中进行局部性保持,提出基于三元组排序局部性的同时正交基聚类特征选择(SOCFS)改进算法,选择具有局部结构保持性且判别区分度高的特征。实验结果表明,与传统非监督特征选择算法相比,SOCFS改进算法聚类效果更好、收敛速度更快。  相似文献   

6.
特征选择是模式识别领域的重要环节。本文提出了一种改进的类别依赖型特征选择技术,通过事先选定参数m,自动选择出在文中准则下各个类各自最能区别于其他类的kx维特征。将各类所选择特征的并集作为BP神经网络的输入结点,进而用待识别样本进行分类识别。实验结果说明,该类特征选择方法能够选择出对每一类而言最能区分于其他类的特征。与选择所有特征相比,用该法进行特征选择以后的BP神经网络分类识别有着较高的正确识别率。此外,本文还利用相关分析方法在预处理过程中剔除了线性相关的冗余特征。  相似文献   

7.
文本特征选择是在文本自动分类中最重要的一个环节。为了更好地解决维吾尔文文本分类中特征空间的高维性和文档表示向量的稀疏性问题, 提出一种基于特征的类别分布差异和信息熵的维吾尔文文本特征选择方法。该方法不仅要考虑特征在类别间的分布情况, 而且也要考虑特征在类别内的分布情况。采用本方法对维吾尔文文本语料进行了分类实验, 并与一些传统的特征选择方法进行了比较。从结果来看, 本方法在所选特征数更少的情况下, 达到了比其他方法更高的分类MacroF1值853%, 比传统的IG和CHI等方法在MacroF1值上分别高出了43%和61%。  相似文献   

8.
焦娜 《计算机科学》2013,40(Z6):125-128,140
在基因表达数据中,有效的基因选择方法是癌症基因数据研究的重要内容。粗糙集是一个去掉冗余特征的有效工具。由于基因表达数据的连续性,为了避免运用粗糙集方法所必须的离散化过程带来的信息丢失,将相容粗糙集应用于基因的特征选择,提出基于相容粗糙集的基因特征选择方法,并在此方法基础上进一步对粗糙集的边界域进行研究,提出了基于相容粗糙集的改进的基因特征选择方法。在两个标准的基因表达数据上进行实验,结果表明与传统的基因特征选择方法相比,所提方法能够有效提高分类精度。  相似文献   

9.
介绍了粗糙集理论的特征选择在客户关系管理中的应用.分析了以前特征选择方法中由于特征数目过多而造成分类时间和精度不高的缺点,提出了一种基于粗糙集的特征选择方法,其特点是以特征在分类中的重要性对特征进行选择.对客户关系管理进行了研究,为解决客户关系管理问题提出了一个新的方法,基于粗糙集的特征选择方法与传统的特征选择方法相比也能达到降维的目的.最后实验结果表明该算法是可行的.  相似文献   

10.
面向非特定人语音情感识别的PCA特征选择方法   总被引:1,自引:1,他引:0  
罗宪华  杨大利  徐明星  徐露 《计算机科学》2011,38(8):212-213,256
在语音情感识别中,如何选取有效的情感特征是识别过程的重要环节。迄今为止,一些常用的特征选择算法虽然能够帮助提高识别性能,但也存在理论性不强、随机性高、计算量大的缺点。因此提出了一种基于主成分分析(PCA)的特征选择方法,亦即对原始特征集合先进行PCA变换,再利用变换矩阵分析出原始特征进行变换时各自的权重,最后根据权重的大小对原始特征进行选择。实验结果表明,选择出的特征对识别率具有较大的贡献,属于重要特征。  相似文献   

11.
特征选择是维吾尔语文本分类的关键技术,对分类结果将产生直接的影响。为了提高传统信息增益在维吾尔文特征选择中的效果,在深度分析维吾尔文语种特点的基础上,提出了一种新的信息增益特征选择方法。该方法结合类词频和特征分布系数以及倒逆文档频率,对传统信息增益进行修正;引入一个备选特征分布系数来平衡类间选取的特征个数;在维吾尔文数据集上实验验证。实验结果表明,改进的算法对维吾尔文分类效果有明显的提高。  相似文献   

12.
为提高投资者在股票市场的收益,解决在证券投资中股票选择这一重要问题,提出一种基于遗传算法的股票选择模型。算法以上市公司的财务指标为样本特征,为克服K-means算法的不稳定性,采用基于遗传算法的K-means算法对同一板块股票进行聚类分析,剔除财务指标较差的一类中的股票。对筛选条件编码,为解决传统遗传算法处理复杂问题时存在的过早收敛现象,提出改进的遗传算子,利用改进的遗传算法寻找使股票市场投资收益最大化的选股模型参数。实验结果表明,该算法在股票选择上具有较好的效果,可供市场投资者借鉴。  相似文献   

13.
当前,常用文本分类特征选择算法主要通过某种评价函数来计算单个特征对类别的区分能力,由于仅考虑了特征和类别之间的关联性,忽略了特征与特征之间的相关性,从而导致特征集存在冗余。针对这一问题,本文提出了一种新的用于文本分类的特征选择算法,该算法可以帮助选出类别区分能力强,特征之间关联性弱的特征。实验证实,该算法的性能要优于传统的特征选择算法。  相似文献   

14.
针对文本数据中含有大量噪声和冗余特征,为获取更有代表性的特征集合,提出了一种结合改进卡方统计(ICHI)和主成分分析(PCA)的特征选择算法(ICHIPCA)。首先针对CHI算法忽略词频、文档长度、类别分布及负相关特性等问题,引入相应的调整因子来完善CHI计算模型;然后利用改进后的CHI计算模型对特征进行评价,选取靠前特征作为初选特征集合;最后通过PCA算法在基本保留原始信息的情况下提取主要成分,实现降维。通过在KNN分类器上验证,与传统特征选择算法IG、CHI等同类型算法相比,ICHIPCA算法在多种特征维度及多个类别下,实现了分类性能的提升。  相似文献   

15.
分析传统否定选择算法和计算机病毒检测技术所存在的问题,总结诸多学者在这方面的改进方案和实施方法。根据切割空间的否定选择算法,提出一种应用于二进制生成串检测器的新型切割否定选择算法。  相似文献   

16.
物化视图是数据仓库中提高查询效率的有效方法,物化视图选择问题是数据仓库设计时期最重要的决定之一。通过研究和实验,提出了一种结合迭代改进算法和模拟退火算法的两阶段优化算法,用于解决物化视图的选择。理论分析和实验结果表明,该算法有效地解决了传统模拟退火算法收敛过慢的缺点,并且其解的质量逼近经典贪婪算法。  相似文献   

17.
基于GIS和遗传算法的物流配送中心选址研究   总被引:3,自引:0,他引:3  
林娜  李志 《遥感信息》2010,(5):110-114
物流配送中心的选址是物流系统优化的一个具有战略意义的问题。在分析传统物流配送中心选址算法不足的基础上,建立了一个基于GIS和遗传算法的物流配送中心选址模型。首先确定配送中心选址的目标及影响选址的因素,接着利用GIS的空间分析技术,定量分析可在电子地图上表现的物流配送中心选址的影响因素,得出一系列候选地点,最后利用遗传算法,求解得出最佳选址地点,并通过实例研究表明该算法的可行性。  相似文献   

18.
一种基于反向文本频率互信息的文本挖掘算法研究   总被引:1,自引:0,他引:1  
针对传统的文本分类算法存在着各特征词对分类结果的影响相同,分类准确率较低,同时造成了算法时间复杂度的增加,在分析了文本分类系统的一般模型,以及在应用了互信息量的特征提取方法提取特征项的基础上,提出一种基于反向文本频率互信息熵文本分类算法。该算法首先采用基于向量空间模型(vector spacemodel,VSM)对文本样本向量进行特征提取;然后对文本信息提取关键词集,筛选文本中的关键词,采用互信息来表示并计算词汇与文档分类相关度;最后计算关键词在文档中的权重。实验结果表明了提出的改进算法与传统的分类算法相比,具有较高的运算速度和较强的非线性映射能力,在收敛速度和准确程度上也有更好的分类效果。  相似文献   

19.
研究无线传感器网络路径优化问题,针对无线传感器网络(WSN)路径优化问题,在分析了遗传算法和蚁群算法各自优缺点的基础上,通过把蚁群算法作为WSN路径优化的主框架,采用遗传算的选择、交叉和变异算子提高蚁群算法搜索速度,提出一种改进蚁群算法的WSN路径优化方法。仿真结果表明,改进蚁群算法有效地克服了基本蚁群算法的缺陷,提高了WSN路径优化效率和成功率,减少了能理消耗,有效延长了网络生存时间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号