首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 62 毫秒
1.
基于基因表达谱的结肠癌特征基因选取   总被引:2,自引:0,他引:2  
在分析肿瘤基因表达谱的基础上,运用模式识别方法选取结肠癌特征基因.利用浮动顺序搜索算法在结肠癌基因表达谱数据中生成若干个候选特征基因子集,再以RBF支持向量机作分类器,以其在训练集和测试集中的错误分类率为依据,从候选特征基因子集中选取结肠癌特征基因集合.实验结果表明了该方法的可行性和有效性.  相似文献   

2.
对结肠癌的基因表达谱数据进行分析,提出选取其特征基因的新方法。首先考虑到基因表达谱数据高维数、小样本的特点,采用Bhattacharyya距离对数据进行降维,运用遗传算法生成特征基因子集,以支持向量机作为分类器,建立了基于GA-SVM的结肠癌两类别分类模型。实验结果表明,仅需提取10个特征基因就可获得95.62%分类准确率。  相似文献   

3.
通过对29例来自日本的胃癌样本基因表达谱数据集进行样本分类特征基因选择的研究,提出一种称为混合法的特征基因选取方法.该法结合了基因选择法中的过滤法(filter)和融合法(wrapper)的优点,可在过滤法的时间内达到融合法的分类效果.研究还采用了支持向量机(SVM)、人工神经网络(ANN)和K-近邻法(KNN)3种分类方法对混合法所选取出的10个与胃癌有关的特征基因的有效性进行了验证,发现所选取出的10个特征基因中,有2个与K im等人的研究成果相重合.研究表明混合法特征基因选取方法是有效的.  相似文献   

4.
多发性骨髓瘤基因表达谱分析   总被引:2,自引:0,他引:2  
为了依据肿瘤基因表达谱数据提取出其中蕴含的样本分类规则,以多发性骨髓瘤的基因表达谱为例,提出了一种在基因表达数据中提取分类特征规则的方法.该方法从统计学角度出发,以基因与样本类别问的相关系数作为衡量属性包含样本分类信息量的标准,并利用神经网络进行属性规约找出分类特征属性集,最后利用决策树进行知识提取,给出样本分类的产生式规则.实验结果表明,所提取出的3条规则对实验样本正确分类率达到100%.  相似文献   

5.
提出基于支持向量机的灵敏度分析方法选取结肠癌特征基因.用支持向量机分析基因对分类决策函数的灵敏度,递归去除灵敏度较低的若干基因,得到一组候选特征基因子集;以支持向量机为分类工具,检验候选特征基因子集对样本分类的贡献,选取具有最佳分类能力的候选特征基因子集作为结肠癌特征基因子集.通过实验比较,该特征基因子集的分类能力优于文献给出的其他特征基因子集,表明了该方法的可行性和有效性.  相似文献   

6.
基因表达数据存在高维、小样本、高噪声等特性,使得相应的肿瘤分类诊断面临着一定的挑战。为了实现更加精确的分类准确率,利用人工蜂群(artificial bee colony, ABC)算法对支持向量机(support vector machine, SVM)的核函数参数和惩罚因子进行优化,采用准确率作为分类模型的适应度函数,提出一种基于ABC和SVM的基因表达数据分类方法ABC-SVM。在6种公开的肿瘤基因表达数据集上进行试验,并对比分析其他的分类方法。结果表明,在筛选得到的较少信息基因基础上,ABC-SVM可获得更高的肿瘤分类准确率,对肿瘤样本类型进行更有效的分类预测。  相似文献   

7.
依据基于二叉树思想的多分类支持向量机算法,进行了天气图像的情感分类方法的研究。通过定性分析和计算对比,确定了图像情感分类的可行算法和合理参数选取方法。结果表明,完全二叉决策树SVM算法对于天气图像的情感识别具有较理想的效果。  相似文献   

8.
依据基于二叉树思想的多分类支持向量机算法,进行了天气图像的情感分类方法的研究。通过定性分析和计算对比,确定了图像情感分类的可行算法和合理参数选取方法。结果表明,完全二叉决策树SVM算法对于天气图像的情感识别具有较理想的效果。  相似文献   

9.
针对滚动轴承发生点蚀故障时峭度和1倍频能量都会发生变化的情况,提出了基于局部均值对故障信号进行分解的方法。该方法取峭度值较大有效分量信号进行重构,再做切片双谱进一步降低高斯噪声对特征频率的影响,提取故障特征1倍频、2倍频和3倍频并进行归一化处理得到特征向量。利用支持向量机对提取的特征向量进行训练与测试,从而识别故障与否及发生点蚀故障的程度。通过对实测滚动轴承振动信号的分析与诊断,验证了该方法的有效性,说明其具有良好的应用前景。  相似文献   

10.
文章针对数据挖掘技术在电子商务客户流失预测方面的应用研究,使用决策树算法、支持向量机算法分别建立电子商务客户流失预测模型,分析客户流失特征数据,并对2种方法的预测结果进行分析.  相似文献   

11.
停车位预测技术是解决城市停车难问题的一种可行方案。针对神经网络等预测模型难以应对诸如路边占道停车等复杂情况,提出了一个基于支持向量机和决策树集成的模型训练方法,不再着重预测停车位的个数,而是预测某一位置的停车难度。在每轮训练过程中拟合一个支持向量机模型,同时收集预测出错的样本,最后在误分类样本集合上训练决策树模型来提高整个模型的预测准确性。采用该方法训练了一个城市空间停车难度预测模型,并利用该模型预测了近一周时间的停车难度。实验结果显示,该方法的预测效果优于单独使用支持向量机、决策树和全连接神经网络模型,可以较好地捕捉到停车难度随时间变化的基本情况。  相似文献   

12.
梯度提升决策树(GBDT)和支持向量机(SVM)是预测光伏出力的两种常用算法。分析了光伏发电出力的影响因素,介绍了GBDT算法和SVM算法的原理,以及基于两种算法的光伏出力预测模型的流程,并进行对比分析。实验结果表明,基于GBDT算法的光伏出力预测模型的平均绝对相对误差和均方根误差都较小,预测效果更好。  相似文献   

13.
基于支持向量机和决策树的多分类方法存在错误累积问题,累积的错误往往使分类准确率下降,分类效果变差.在仔细分析了其产生错误累积原因的基础上,提出了基于哈夫曼树的支持向量机多分类方法.该方法首先将一个多分类问题分解为多个二分类问题,针对每个二分类问题使用支持向量机二分类方法解决;然后根据相异度来决策分类的优先顺序,构建基于哈夫曼树的支持向量机多分类模型;最后使用勒卡斯开源数据集进行验证,并将它与传统的支持向量机多分类方法进行实验比较.实验结果表明,新的方法在分类速度和分类精度上较传统的支持向量机多分类方法优越.  相似文献   

14.
新型智能电表普及后,为了准确检测出电网中的窃电用户,可以结合机器学习的方法.为此,选择了支持向量机、随机森林和迭代决策树3种机器学习中较常用的大数据算法进行分析,通过不断调整试验数据集的大小,对3种算法的效率和准确率进行测试.对比分析结果发现,随机森林算法运行的时间和数据量的大小基本呈线性关系,效率较高,且准确率稳定在86%以上,表现较好.  相似文献   

15.
给出了支持向量机的信誉检测模型和基于决策树的信誉检测模型的建立方法,并在这2种单一分类器的基础上,归纳总结了支持向量机方法和决策树方法对信用卡信誉检测的偏好特性,提出了一种基于偏好特性的组合分类模型建立方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号