共查询到18条相似文献,搜索用时 140 毫秒
1.
何爱香 《计算机工程与应用》2007,43(18):242-245
提出了一种基于两轮遗传算法的用于结肠癌微阵列数据基因选择与样本分类的新方法。该方法先根据基因的Bhattacharyya距离指标过滤大部分与分类不相关的基因,而后使用结合了遗传算法和CFS(Correlation-based Feature Selection)的GA/CFS方法选择优秀基因子集,并存档记录这些子集。根据存档子集中基因被选择的频率选择进一步搜索的候选子集,最后以结合了遗传算法和SVM的GA/SVM从候选基因子集中选择分类特征子集。把这种GA/CFS-GA/SVM方法应用到结肠癌微阵列数据,实验结果及与文献的比较表明了该方法效果良好。 相似文献
2.
基于遗传算法和支持向量机的特征选择研究 总被引:3,自引:0,他引:3
为了让特征子集获得较高的分类准确率,提出了基于遗传算法和支持向量机的特征选择方法.该方法在ReliefF算法提供先验信息的基础上,将SVM参数混编入特征选择基因编码中,然后利用遗传算法寻求最优的特征子集和支持向量机参数组合.实验结果表明,通过该方法选择的特征子集和支持向量机参数组合能以较小的特征子集获得较高的分类准确率. 相似文献
3.
提出了一种基于遗传算法(GA)优化支持向量机(SVM)分类决策树的用于肿瘤基因分类的新方法。该方法针对基因表达数据样本少维数高的特点,采用了支持向量机分类间隔作为遗传算法适应度函数。利用遗传算法在每一决策树结点自动选择最优或近优的分类决策,实现了对决策树的优化。试验结果表明,在样本有限的情况下,与传统的方法相比,该方法比单个决策树算法具有更高的分类精度。 相似文献
4.
基于BP神经网络的肿瘤特征基因选取 总被引:2,自引:0,他引:2
该文提出基于BP神经网络的灵敏度分析方法,并用于选取肿瘤特征基因。以结肠癌基因表达谱为例,首先定义基因对BP神经网络模型输出函数的灵敏度,递归去除灵敏度较低的若干基因,生成一组嵌套的候选特征基因子集。然后以支持向量机为分类器,检验候选特征基因子集对样本分类的贡献,选取错分率最低的候选特征基因子集为结肠癌特征基因子集。通过实验对比,该特征基因子集的分类结果优于文献给出的其他特征基因子集,表明了该方法的可行性和有效性。 相似文献
5.
6.
性别是人脸反映的一个重要信息,通过人脸图像实现性别自动分类对大型人脸数据库的检索和识别具有重要意义。提出了一种新的结合独立分量分析(ICA)和遗传算法(GA)的人脸性别分类方法。首先采用快速独立分量分析方法(FastICA)提取人脸图像的独立基图像和投影向量,获得人脸的低维表征;然后通过遗传算法从该低维空间中选择对性别分类有利的特征子集;最后采用支持向量机进行分类。将ICA的空间局部特征提取功能、遗传算法快速寻优的特征选择功能以及SVM的强分类能力有机地结合起来。实验表明,该方法取得了很好的分类性能。 相似文献
7.
基于离散粒子群和支持向量机的特征基因选择算法 总被引:1,自引:0,他引:1
基因芯片表达谱信息,为识别疾病相关基因及对癌症等疾病分型、诊断及病理学研究提供一新途径。在基因表达谱数据中选择特征基因可以提高疾病诊断、分类的准确率,并降低分类器的复杂度。本文研究了基于离散粒子群(binary particle swarm optimization,BPSO)和支持向量机(support vector machine,SVM)封装模式的BPSO-SVM特征基因选择方法,首先随机产生若干种群(特征子集),然后用BPSO算法优化随机产生的特征基因,并用SVM分类结果指导搜索,最后选出最佳适应度的特征基因子集以训练SVM。结果表明,基于BPSO-SVM的特征基因选择方法,的确是一种行之有效的特征基因选择方法。 相似文献
8.
基于遗传算法和支持向量机的玉米品种识别 总被引:5,自引:0,他引:5
提出了一种基于遗传算法(GA)和支持向量机(SVM)的玉米种子的图像特征选择和分类识别的新方法。该方法首先用遗传算法对采集到的玉米种子图像的特征进行优化,而后采用决策二叉树的支持向量机分类算法对玉米品种进行识别。该分类算法将分类器分布在各个结点上,构成多类支持向量机,减少了分类器的数量和重复训练样本的数量。实验结果表明该方法能选出适合于识别的玉米种子特征并能对玉米种子进行正确地识别。 相似文献
9.
入侵检测实质上是一个分类的问题,对于提高分类精度是十分重要的.支持向量机(SVM)是一个功能强人的用于解决分类问题的工具.基于支持向量机的入侵检测精度较高,但如何获得更高的精度是一个新的问题.本文利用基于支持向量机和遗传算法(GA)的入侵检测来解决这些问题.我们首先利用遗传算法进行特征选择及优化,然后使用支持向量机模型... 相似文献
10.
针对遗传算法(GA)与支持向量机(SVM)集成相结合的疾病诊断方法存在属性冗余的问题,提出了一种改进的约简和诊断乳腺癌决策方法。该方法将最小化约简属性个数、最大化区分矩阵可区别属性的个数以及最大化约简属性对决策属性的依赖度这三种目标函数相结合作为GA的适应度函数。在约简属性后取多个子集,以便利用SVM集成学习。在UCI数据库中乳腺癌数据集的实验表明,与原始的SVM算法相比,该方法在分类诊断的准确度以及敏感性方面有一定的提高,其中分类准确度至少提高了2%。 相似文献
11.
Shutao Li Xixian Wu Xiaoyan Hu 《Soft Computing - A Fusion of Foundations, Methodologies and Applications》2008,12(7):693-698
In this paper, we present a gene selection method based on genetic algorithm (GA) and support vector machines (SVM) for cancer
classification. First, the Wilcoxon rank sum test is used to filter noisy and redundant genes in high dimensional microarray
data. Then, the different highly informative genes subsets are selected by GA/SVM using different training sets. The final
subset, consisting of highly discriminating genes, is obtained by analyzing the frequency of appearance of each gene in the
different gene subsets. The proposed method is tested on three open datasets: leukemia, breast cancer, and colon cancer data.
The results show that the proposed method has excellent selection and classification performance, especially for breast cancer
data, which can yield 100% classification accuracy using only four genes. 相似文献
12.
Mingyuan Zhao Chong Fu Luping Ji Ke Tang Mingtian Zhou 《Expert systems with applications》2011,38(5):5197-5204
Support vector machines (SVM) are an emerging data classification technique with many diverse applications. The feature subset selection, along with the parameter setting in the SVM training procedure significantly influences the classification accuracy. In this paper, the asymptotic behaviors of support vector machines are fused with genetic algorithm (GA) and the feature chromosomes are generated, which thereby directs the search of genetic algorithm to the straight line of optimal generalization error in the superparameter space. On this basis, a new approach based on genetic algorithm with feature chromosomes, termed GA with feature chromosomes, is proposed to simultaneously optimize the feature subset and the parameters for SVM.To evaluate the proposed approach, the experiment adopts several real world datasets from the UCI database and from the Benchmark database. Compared with the GA without feature chromosomes, the grid search, and other approaches, the proposed approach not only has higher classification accuracy and smaller feature subsets, but also has fewer processing time. 相似文献
13.
14.
为了充分利用极化合成孔径雷达(SAR)图像不同极化特征对不同地物目标类型的刻画能力,提出一种基于多层支持向量机(SVM)的极化SAR特征分析与分类方法。该方法首先通过特征分析确定适合不同地物类型的最佳特征子集;然后采用分层分类树的方式,根据每一种地物类型的特征子集逐层进行SVM分类;最终得到整体分类结果。RadarSAT-2极化SAR图像分类实验结果表明所提方法水域、耕地、林地、城区4类地物分类精度为85%左右,总体分类精度达到86%。该算法充分利用了不同地物目标类型的特性,提高了分类精度,也降低了算法时间复杂度。 相似文献
15.
16.
17.
基于带特征染色体遗传算法的支持向量机特征选择和参数优化 总被引:2,自引:0,他引:2
鉴于支持向量机特征选择和参数优化对其分类准确率有重大的影响,将支持向量机渐近性能融入遗传算法并生成特征染色体,从而将遗传算法的搜索导向超参数空间中的最佳化误差直线.在此基础上,提出一种新的基十带特征染色体遗传算法的方法,同时进行支持向量机特征选择和参数优化.在与网格搜索、不带特征染色体遗传算法和其他方法的比较中,所提出的方法具有较高的准确率、更小的特征子集和更少的处理时间. 相似文献