共查询到19条相似文献,搜索用时 234 毫秒
1.
对文本特征选择的传统方法进行了深入分析并对各自的优缺点进行了详细的对比;其次,通过利用遗传算法自身的寻优特点,把它与传统特征选择方法相结合,并得出了算法。最后,在对各自算法进行了分析,表明了在性能上有了明显的提高。 相似文献
2.
3.
4.
针对利用单一特征集对肠癌病理图像的识别率难以提高这一情况,提出了一个基于HOG-GLRLM特征肠癌病理图片分类方法。考虑到图像中丰富的纹理和边缘信息,分别利用改进型的灰度行程矩阵和梯度方向直方图提取特征。并采用最小冗余最大关联的方法对各自和合并特征集进行特征选择。实验结果表明该方法的有效性。 相似文献
5.
6.
特征选择是模式识别领域的重要环节。本文提出了一种改进的类别依赖型特征选择技术,通过事先选定参数m,自动选择出在文中准则下各个类各自最能区别于其他类的kx维特征。将各类所选择特征的并集作为BP神经网络的输入结点,进而用待识别样本进行分类识别。实验结果说明,该类特征选择方法能够选择出对每一类而言最能区分于其他类的特征。与选择所有特征相比,用该法进行特征选择以后的BP神经网络分类识别有着较高的正确识别率。此外,本文还利用相关分析方法在预处理过程中剔除了线性相关的冗余特征。 相似文献
7.
文本特征选择是在文本自动分类中最重要的一个环节。为了更好地解决维吾尔文文本分类中特征空间的高维性和文档表示向量的稀疏性问题, 提出一种基于特征的类别分布差异和信息熵的维吾尔文文本特征选择方法。该方法不仅要考虑特征在类别间的分布情况, 而且也要考虑特征在类别内的分布情况。采用本方法对维吾尔文文本语料进行了分类实验, 并与一些传统的特征选择方法进行了比较。从结果来看, 本方法在所选特征数更少的情况下, 达到了比其他方法更高的分类MacroF1值853%, 比传统的IG和CHI等方法在MacroF1值上分别高出了43%和61%。 相似文献
8.
在基因表达数据中,有效的基因选择方法是癌症基因数据研究的重要内容。粗糙集是一个去掉冗余特征的有效工具。由于基因表达数据的连续性,为了避免运用粗糙集方法所必须的离散化过程带来的信息丢失,将相容粗糙集应用于基因的特征选择,提出基于相容粗糙集的基因特征选择方法,并在此方法基础上进一步对粗糙集的边界域进行研究,提出了基于相容粗糙集的改进的基因特征选择方法。在两个标准的基因表达数据上进行实验,结果表明与传统的基因特征选择方法相比,所提方法能够有效提高分类精度。 相似文献
9.
介绍了粗糙集理论的特征选择在客户关系管理中的应用.分析了以前特征选择方法中由于特征数目过多而造成分类时间和精度不高的缺点,提出了一种基于粗糙集的特征选择方法,其特点是以特征在分类中的重要性对特征进行选择.对客户关系管理进行了研究,为解决客户关系管理问题提出了一个新的方法,基于粗糙集的特征选择方法与传统的特征选择方法相比也能达到降维的目的.最后实验结果表明该算法是可行的. 相似文献
10.
11.
特征选择是维吾尔语文本分类的关键技术,对分类结果将产生直接的影响。为了提高传统信息增益在维吾尔文特征选择中的效果,在深度分析维吾尔文语种特点的基础上,提出了一种新的信息增益特征选择方法。该方法结合类词频和特征分布系数以及倒逆文档频率,对传统信息增益进行修正;引入一个备选特征分布系数来平衡类间选取的特征个数;在维吾尔文数据集上实验验证。实验结果表明,改进的算法对维吾尔文分类效果有明显的提高。 相似文献
12.
为提高投资者在股票市场的收益,解决在证券投资中股票选择这一重要问题,提出一种基于遗传算法的股票选择模型。算法以上市公司的财务指标为样本特征,为克服K-means算法的不稳定性,采用基于遗传算法的K-means算法对同一板块股票进行聚类分析,剔除财务指标较差的一类中的股票。对筛选条件编码,为解决传统遗传算法处理复杂问题时存在的过早收敛现象,提出改进的遗传算子,利用改进的遗传算法寻找使股票市场投资收益最大化的选股模型参数。实验结果表明,该算法在股票选择上具有较好的效果,可供市场投资者借鉴。 相似文献
13.
14.
针对文本数据中含有大量噪声和冗余特征,为获取更有代表性的特征集合,提出了一种结合改进卡方统计(ICHI)和主成分分析(PCA)的特征选择算法(ICHIPCA)。首先针对CHI算法忽略词频、文档长度、类别分布及负相关特性等问题,引入相应的调整因子来完善CHI计算模型;然后利用改进后的CHI计算模型对特征进行评价,选取靠前特征作为初选特征集合;最后通过PCA算法在基本保留原始信息的情况下提取主要成分,实现降维。通过在KNN分类器上验证,与传统特征选择算法IG、CHI等同类型算法相比,ICHIPCA算法在多种特征维度及多个类别下,实现了分类性能的提升。 相似文献
15.
王飞 《自动化与仪器仪表》2012,(2):180-181
分析传统否定选择算法和计算机病毒检测技术所存在的问题,总结诸多学者在这方面的改进方案和实施方法。根据切割空间的否定选择算法,提出一种应用于二进制生成串检测器的新型切割否定选择算法。 相似文献
16.
物化视图是数据仓库中提高查询效率的有效方法,物化视图选择问题是数据仓库设计时期最重要的决定之一。通过研究和实验,提出了一种结合迭代改进算法和模拟退火算法的两阶段优化算法,用于解决物化视图的选择。理论分析和实验结果表明,该算法有效地解决了传统模拟退火算法收敛过慢的缺点,并且其解的质量逼近经典贪婪算法。 相似文献
17.
基于GIS和遗传算法的物流配送中心选址研究 总被引:3,自引:0,他引:3
物流配送中心的选址是物流系统优化的一个具有战略意义的问题。在分析传统物流配送中心选址算法不足的基础上,建立了一个基于GIS和遗传算法的物流配送中心选址模型。首先确定配送中心选址的目标及影响选址的因素,接着利用GIS的空间分析技术,定量分析可在电子地图上表现的物流配送中心选址的影响因素,得出一系列候选地点,最后利用遗传算法,求解得出最佳选址地点,并通过实例研究表明该算法的可行性。 相似文献
18.
一种基于反向文本频率互信息的文本挖掘算法研究 总被引:1,自引:0,他引:1
针对传统的文本分类算法存在着各特征词对分类结果的影响相同,分类准确率较低,同时造成了算法时间复杂度的增加,在分析了文本分类系统的一般模型,以及在应用了互信息量的特征提取方法提取特征项的基础上,提出一种基于反向文本频率互信息熵文本分类算法。该算法首先采用基于向量空间模型(vector spacemodel,VSM)对文本样本向量进行特征提取;然后对文本信息提取关键词集,筛选文本中的关键词,采用互信息来表示并计算词汇与文档分类相关度;最后计算关键词在文档中的权重。实验结果表明了提出的改进算法与传统的分类算法相比,具有较高的运算速度和较强的非线性映射能力,在收敛速度和准确程度上也有更好的分类效果。 相似文献