首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 484 毫秒
1.
基于基因表达谱的SRBCT分类研究   总被引:2,自引:0,他引:2  
肿瘤亚型的准确判别对肿瘤的治疗具有重要的意义。文章提出了一种多类肿瘤分类和特征基因选取的策略。该方法以儿童SRBCT(小圆蓝细胞瘤)的基因表达谱为例,计算基因的类加权Bhattacharyya距离,并据此选取特征基因,然后利用这些基因的表达数据建立了基于支持向量机的多模预测模型并对SRBCT的4种亚型进行了识别。实验结果表明了该方法的有效性和可行性。  相似文献   

2.
利用肿瘤基因表达谱建立有效的"预测性"分类模型,对肿瘤的不同亚型进行准确判别是当前生物信息学研究的重要课题.从生物学分析出发,首先利用RFSC(Revised Feature Score Criterion)算法剔除无关基因,然后利用模糊K-NN算法对这些数据进行分析,从而发现有差异的基因表达.实验结果表明了上述方法的可行性和有效性.  相似文献   

3.
基于支持向量机的肿瘤亚型识别   总被引:4,自引:0,他引:4  
肿瘤亚型的准确判别对肿瘤的治疗具有重要意义。该文依据肿瘤的基因表达谱,研究了利用支持向量机进行肿瘤亚型识别的方法。该方法以基因蕴含的样本分类信息量为依据首先排除噪声基因,然后采用支持向量机作为分类器进行肿瘤亚型的识别。文章以急性白血病的基因表达谱数据为例,进行亚型识别并同已有的研究成果进行了对比。实验结果表明了该方法的可行性和有效性。  相似文献   

4.
针对肿瘤基因表达谱样本少,维数高的特点,提出一种用于肿瘤信息基因提取和亚型识别的集成分类器算法.该算法根据基因的Fisher比率值建立候选子集,再采用相关系数和互信息两种度量方法,分别构造反映基因共表达行为和调控关系的特征子集.粒子群优化算法分别与SVM和KNN构成两个基分类器,从候选子集中提取信息基因并对肿瘤亚型进行分类,最后利用绝对多数投票方法对基分类器的结果进行整合.G.Gordon肺癌亚型识别的实验结果表明了该算法的可行性和有效性.  相似文献   

5.
基于基因表达谱建立具有有效预测性的肿瘤分类模型对肿瘤的临床诊断与治疗具有非常重要的意义。针对肿瘤亚型识别问题,所要解决的一个关键问题就是发现决定肿瘤亚型的一组特征基因子集。提出了一个组合式的肿瘤信息基因选择策略:首先从单个的样本基因信息量角度出发,采用Relief-F算法剔除分类无关基因;其次考虑样本基因间的关系,使用K-means算法过滤冗余基因,最后采用人工神经网络作为分类器来测试和评估所选出的肿瘤信息基因的分类能力。实验是在具有七种亚型的急性白血病基因表达谱数据集上完成的,其留一法准确率达到100%,表明所提出的信息基因选择方法对于多肿瘤亚型的识别问题研究是非常有效的。  相似文献   

6.
基于基因表达谱提出了一种依据类加权Bhattacharyya距离提取特征基因并使用人工神经网络(ANN)进行肿瘤亚型识别的方法。分析了儿童小圆蓝细胞瘤(SRBCTs)的基因表达数据后,在训练样本集上计算出各个基因的类加权Bhattacharyya距离,并据此选择特征基因构造若干ANN模型,利用独立测试集验证其分类能力,且依据分类错误率最小的原则确定了含40个基因的特征基因组合。基于该特征基因组合的ANN模型不仅正确地识别了所有的患病样本的亚型,还能鉴别非患病样本。  相似文献   

7.
一种简单有效的算法在肿瘤亚型发现中的应用   总被引:2,自引:2,他引:0  
本文采用了一种简单有效的肿瘤亚型发现的算法。该算法主要包括三个步骤:首先对数据进行预处理;然后采用定义的信息系数进行信息基因的选择;最后将层次聚类算法与t-检验相结合,完成了肿瘤亚型的发现。以白血病和结肠癌的基因表达谱为例,得出了很好的分型结果,表明了该方法的有效性和可行性。  相似文献   

8.
曹娟  张颖淳  赵玲 《计算机科学》2013,40(7):226-228,265
依据基因表达谱建立有效肿瘤分类模型的关键在于准确找出决定样本类别的一组特征基因。粗糙集理论已成功应用于肿瘤分类特征基因选取中。然而,粗糙集方法处理连续值的基因表达谱数据集所必需的离散化过程会使得部分信息丢失,对所选取的特征基因的分类精度造成一定影响。因此,曾提出基于互信息的模糊粗糙集基因表达谱数据集特征基因的选取算法。然而,该算法计算代价较高,当所选取的基因数较多时难以实现。为此,对 该算法进行了 改进,从最大相关性和最重要性(最小冗余)两方面对互信息进行了近似替代计算,大大降低了算法的复杂度,提高了算法的效率。以急性白血病亚型(leukemia)、直肠癌(colon)和乳腺癌(Breast)分类特征基因选取为例进行实验,然后分别采用1NN和SVM分类器进行特征基因分类精度检验,结果证实了新方法的可行性和有效性。  相似文献   

9.
张新征 《计算机应用》2011,31(9):2468-2472
传统小波独立分量分析(ICA)提取合成孔径雷达(SAR)目标特征时大都采用单一的小波基函数,并且仅利用小波分解低频子带数据进行ICA处理,而忽略了高频子带信息。针对这一问题,采用多类小波基函数对SAR目标图像进行分解;针对得到的所有低频和高频子带数据,引入子带加权的判别熵准则,结合现有的小波ICA算法,提出多小波子带加权判别熵的SAR目标图像ICA特征提取算法。采用MSTAR实测SAR目标图像数据,根据提出算法进行特征抽取,利用最近邻准则进行SAR目标识别。识别结果表明提出算法优于仅利用小波分解低频子带ICA算法。  相似文献   

10.
针对基于基因表达谱数据的多类肿瘤亚型的识别与特征基因选取问题进行了研究;采用Gini指数与"信噪比"(SNR)指标相结合的方法,构建GSNR综合指标,剔除无关基因;然后采用BP神经网络设计复合分类器;最后使用SM算法,并依据独立测试的分类错误数最终确定特征基因子集,以急性白血病的基因表达谱数据为例,按三类肿瘤亚型分类,从7129个基因中选出8个特征基因,其对独立测试集的预测准确度达到97%;实验表明综合指数GSNR对数据进行预处理具有良好的鲁棒性和可伸缩性.  相似文献   

11.
赵宇海  王国仁  印莹 《计算机应用》2005,25(6):1388-1391
提出了一种用于基因表达数据的无参数聚类算法。该算法把多维数据的模糊聚类方法与CTWC相结合,并引入基于范数的方法进一步对该方法加以改进和论证。将该算法应用于真实的结肠癌基因表达数据集,确定了含8个基因的特征基因组合,该特征基因组合不仅达到了90%左右的结肠癌样本识别率,还能鉴别结肠癌样本的亚型。实验结果充分验证了这种算法的可行性。  相似文献   

12.
建立病变组织分类模型的关键在于找出一组能准确区分样本类别的特征基因。糙集理论中的属性依赖度分析方法能对目标数据进行有效分析。基于属性间的依赖关系和属性对决策的影响存在这样的关系,即属性依赖度越大,属性就越重要,对决策划分的影响就越大,提出了一种属性最大依赖度(maximum dependency of attributes based on rough sets,MDA-RS)算法,并将其应用于特征基因选取。首先用启发式K-均值聚类算法对基因进行聚类分析得到类数为k的基因子集;然后用MDA-RS选出每类的  相似文献   

13.
基于粒子群神经网络集成的肿瘤分型研究   总被引:2,自引:0,他引:2       下载免费PDF全文
程慧杰  张国印  何颖 《计算机工程》2010,36(10):209-211
针对肿瘤基表达谱样本少、维数高的特点,提出一种用于肿瘤分型的粒子群神经网络集成算法。根据相似性度量函数滤出分类无关基因,形成候选特征子集。采用基于灵敏度分析的BP神经网络模型作为基分类器,进一步剔除冗余基因。改进的粒子群优化算法全局搜索BP神经网络的权值和阈值。实验结果表明,该算法对肿瘤分型具有良好的识别率,且特征集合中仅包含54个特征基因。  相似文献   

14.
杨红喆  赵立辉 《计算机工程》2014,(2):256-258,262
脑肿瘤分割是计算机辅助脑病诊断的基础。为提高脑肿瘤分割精度,提出一种融合高斯混合模型的测地线脑肿瘤分割方法。根据相邻2个像素点间互相到达时间构造离散且带有权重的网格图,通过高斯混合模型估计每个像素点属于目标物体的罚度,并融合高斯混合模型的概率密度差异表示区域属性与边缘属性构成能量函数,利用快速最短路径算法求解前景与背景间的测地线距离,并根据该距离最小化能量函数,得到脑肿瘤的分割结果。利用10组脑部核磁共振图像数据对算法进行评估,结果表明,该算法分割结果与金标准的重叠率在0.60~0.85之间,可有效避免局部最优解的情况,对非匀质区域具有较好的分割效果。  相似文献   

15.
In this paper, the bias-compensation-based recursive least-squares (LS) estimation algorithm with a forgetting factor is proposed for output error models. First, for the unknown white noise, the so-called weighted average variance is introduced. With this weighted average variance, a bias-compensation term is first formulated to achieve the bias-eliminated estimates of the system parameters. Then, the weighted average variance is estimated. Finally, the final estimation algorithm is obtained by combining the estimation of the weighted average variance and the recursive LS estimation algorithm with a forgetting factor. The effectiveness of the proposed identification algorithm is verified by a numerical example.  相似文献   

16.
A reliable and precise classification of tumors is essential for successful treatment of cancer. Gene selection is an important step for improved diagnostics. The modified SFFS (sequential forward floating selection) algorithm based on weighted Mahalanobis distance, called MSWM, is proposed to identify optimal informative gene subsets taking into account joint discriminatory power for accurate discrimination in this study. Firstly, we make use of the one-dimensional weighted Mahalanobis distance to perform a preliminary selection of genes and then make use of the modified SFFS method and multidimensional weighted Mahalanobis distance to obtain the optimal informative gene subset for tumor classification. Finally, we used the k nearest neighbor and naive Bayes methods to classify tumors based on the optimal gene subset selected using the MSWM method. To validate the efficiency, the proposed MSWM method is applied to classify two different DNA microarray datasets. Our empirical study shows that the MSWM method for tumor classification can obtain better effectiveness of classification than the BWR (the ratio of between-groups to within-groups sum of squares) and IVGA_I (independent variable group analysis I) methods. It suggests that the MSWM gene selection method is ability to obtain correct informative gene subsets taking into account genes’ joint discriminatory power for tumor classification.  相似文献   

17.
文章结合科技动员管理信息系统,对经过相关数据查询后得到的结果集,利用遗传算法在数据搜索方面的优化特性,通过构造加权属性权值对人员征集再次选择进行仿真实现。仿真的实验结果表明生成的结果集具有较好的实用性和可操作性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号