首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于基因表达谱的结肠癌特征基因选取   总被引:2,自引:0,他引:2  
在分析肿瘤基因表达谱的基础上,运用模式识别方法选取结肠癌特征基因.利用浮动顺序搜索算法在结肠癌基因表达谱数据中生成若干个候选特征基因子集,再以RBF支持向量机作分类器,以其在训练集和测试集中的错误分类率为依据,从候选特征基因子集中选取结肠癌特征基因集合.实验结果表明了该方法的可行性和有效性.  相似文献   

2.
采用生物信息学方法对肿瘤基因表达数据进行挖掘,以获取和肿瘤不同亚型相关的候选标志基因集合,应用机器学习方法从标志基因集合中提取出甄别肿瘤不同亚型的规则集,进而建立起肿瘤预测模型.利用Relief、信息增益和分类信息指数从不同角度挖掘蕴含在基因表达谱中的候选特征基因,抽取出候选特征基因公约集合.以对不同肿瘤组织样本的识别能力为依据,选取分类能力最强的一组基因集合作为特征基因.利用规则判定树提取出反映这些特征基因相互作用的规则集并以此构建肿瘤预测模型,并将此模型应用于白血病基因表达数据中,建立了白血病分子预测模型.研究表明,该模型得到的白血病标志基因对肿瘤临床诊断具有一定的参考价值.  相似文献   

3.
根据基因表达谱数据高维度、小样本、高噪声的特点,提出一种基于相关特征选择(Correlation- based Feature Selection ,CFS)的分层抽样的基因特征选择方法(简称CFS- SS)。首先,利用CFS算法提取与分类相关性大的特征基因集,然后通过分层方法构造多层特征子集空间,在部分层空间中寻找最优特征子集。在Leukemia, Colon, Prostate数据集上进行了交叉测试实验。实验结果表明, CFS- SS有效地从不同层次的特征子集样本中可以提取出有价值的基因特征集,在不同的分类器上取得较好的分类性能。  相似文献   

4.
为了找到与结肠癌相关的基因,提高结肠癌样本的识别率,提出了基于Chernoff距离的浮动顺序搜索算法(sequential floating search method, SFSM)。通过对结肠癌基因表达谱数据集的分析,对每个基因进行评价和筛选;对筛选后的基因子集利用SFSM算法进行搜索,并以Chernoff距离作为其评估函数,生成若干候选特征基因子集;利用支持向量机(support vector machine,SVM)、K-近邻(K nearest neighbor,KNN)和径向基(radical basis function,RBF)神经网络分类器来检验候选特征基因子集的分类效果。实验结果表明,利用SFSM及评估函数Chernoff距离发现在参数β=025时能找到最佳的特征基因组合,该组合能以很高的正确率识别结肠癌样本。  相似文献   

5.
特征选择是生物信息领域中数据预处理阶段必不可少的步骤。传统特征选择算法忽视了特征之间的依赖相关性和冗余性,因此提出一种联合互信息的特征选择算法(JFRR)。该算法利用互信息计算特征之间的冗余值,并利用联合互信息分别计算已选特征集合、候选特征及类标签之间的相关性。将JFRR与其他6个特征选择算法在2个分类器上,使用9个不同基因数据集,进行分类准确率指标(Precision_micro和F1_micro)验证。实验结果表明,该算法能有效提高分类精度。  相似文献   

6.
提出一种二阶段并行基因选择方法(TPM),可以获得最优特征子集。针对以往算法易于陷入局部极值的不足,提出了一种模糊多种群粒子群(FMP),可以有效地扩展搜索空间。通过在leukemia、colon、breast cancer、lung carcinoma、brain cancer五个数据集上的测试,验证了本文方法不仅可以获得更优特征子集和更高的分类精度,而且可以选择尺寸更小的特征子集。本文的研究成果可为基因表达领域提供一种新的思路。  相似文献   

7.
对结肠癌的基因表达谱数据进行分析,提出选取其特征基因的新方法。首先考虑到基因表达谱数据高维数、小样本的特点,采用Bhattacharyya距离对数据进行降维,运用遗传算法生成特征基因子集,以支持向量机作为分类器,建立了基于GA-SVM的结肠癌两类别分类模型。实验结果表明,仅需提取10个特征基因就可获得95.62%分类准确率。  相似文献   

8.
肿瘤基因选择方法LLE Score   总被引:1,自引:0,他引:1  
针对处理肿瘤基因表达数据特征选择问题,提出了一种特征选择方法 LLE Score.该方法是典型的过滤器类型特征选择方法,在样本类别信息的基础上,LLE Score针对特征向量的局部邻域保存能力进行评价,并且根据评价结果进行特征的选取,以此达到良好的特征选择效果.在实验部分对肿瘤数据集进行特征选择,并采用支持向量机分类器计算分类准确率.通过分类准确率说明了该方法的有效性.  相似文献   

9.
将几何学习方法应用于肿瘤的分型.按传统处理方法对肿瘤基因表达谱数据预处理,选取特征基因;再应用几何学习方法将样本中的特征基因表达水平数据构造已知类的空间几何凸胞,然后应用分型识别算法对待分型样本进行分类.并将该方法应用于公开发表的白血病基因表达谱数据集的分型研究,取得100%分型准确率,此外,将几何学习的分型模型与支撑向量机比较,实验结果证明该方法具有有效性与可行性.  相似文献   

10.
在网络入侵检测中,由于原始数据特征维度高和冗余特征多,导致入侵检测系统的存储负担增加,检测分类器性能降低。针对该问题本文提出了一种基于信息论模型的入侵检测特征提取方法。它以具有最大信息增益的特征为搜索起点,利用搜索策略和评估函数迭代调整数据集分类标记、已选取特征子集和候选特征三者之间的相关度,最后通过终止条件确定选取特征子集。以入侵检测样本数据集为实验数据,将该方法选取的特征向量运用到支持向量机分类算法中,在特征维度大幅度降低的情况下,检测精度变化很小。实验结果证明了本方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号