首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
基因芯片技术作为一门新兴技术,目前已经广泛应用于生物学和医学的各个领域。在技术迅速发展的同时,由基因芯片实验所产生的数据也呈指数级增加,如何有效处理和管理这些海量数据已越来越得到研究者的关注。肿瘤基因表达谱分类是基因芯片数据处理中的一项重要技术。文中对肿瘤基因表达谱分类方法进行了系统的介绍,并对当前肿瘤基因表达谱数据分类技术存在的一些问题以及下一步的研究思路做了分析。  相似文献   

2.
肿瘤基因表达谱分类特征基因选取问题及分析方法研究   总被引:18,自引:1,他引:18  
对肿瘤分类特征基因选取问题的研究是发现肿瘤特异表达基因、研究肿瘤基因表达模式的重要手段,文中基于多类别肿瘤基因表达谱数据集,从研究肿瘤与正常组织的分类入手,对肿瘤分类特征基因选取问题进行分析和研究,首先对基于Relief算法的特征选取策略加以改进生成候选特征集合;然后以支持向量机作为分类器对其分类性能进行检验以选取分类特征基因;最后结合分类模型。利用灵敏度分析方法进行特征基因的精确搜索以滤除冗余,基于该方法文中选出了52个具有良好分类性能的特征基因作为肿瘤的基因特征,并对其表达行为进行了简要分析。  相似文献   

3.
利用肿瘤基因表达谱建立有效的"预测性"分类模型,对肿瘤的不同亚型进行准确判别是当前生物信息学研究的重要课题.从生物学分析出发,首先利用RFSC(Revised Feature Score Criterion)算法剔除无关基因,然后利用模糊K-NN算法对这些数据进行分析,从而发现有差异的基因表达.实验结果表明了上述方法的可行性和有效性.  相似文献   

4.
基于基因表达谱运用信息科学的方法和技术建立胃癌的分类模型,关键在于准确找出决定样本类别的一组特征基因.针对该问题在分析胃癌的基因表达谱基础上研究了胃癌特征基因选取问题.本文提出了一种新的特征基因选取方法--CLUSTER_S2N法,并用支持向量机作为分类器,以分类错误率为标准进行了胃癌的分类预测实验,实验结果表明了该方法的可行性和有效性.  相似文献   

5.
肿瘤亚型的准确判别对肿瘤的治疗具有重要意义,对肿瘤的不同亚型进行准确判别是当前生物信息学研究的重要课题.本文首先利用Relief算法排序基因并选出初始的肿瘤信息基因子集,然后利用向基于邻域粗糙集模型的向前属性约减算法FARNeM来计算加权基因集合,最后用加权KNN算法对肿瘤对这些数据进行分析,从而发现有差异的基因表达。实验结果表明了上述方法的可行性和有效性。  相似文献   

6.
人类基因组计划的研究已进入后基因组时代,后基因组时代研究的焦点已经从测序转向功能研究,主要采用无监督和有监督技术来分析基因表达谱和识别基因功能,通过基因转录调控网络分析细胞内基因之间的相互作用关系的整体表示,说明生命功能在基因表达层面的展现,对目前基因表达谱数据分析技术及它们的发展,进行了综述性的研究,分析了它们的优缺点,提出了解决问题的思路和方法,为基因表达谱的进一步研究提供了新的途径。  相似文献   

7.
针对较大规模结肠癌基因表达谱信息,对其噪声处理在基因标签提取问题中的作用进行了研究。不考虑噪声,用ReCorre算法确定分类基因,再用增l减r搜索算法确定基因标签组,对每个基因标签组使用基于支持向量机的留一交叉检验,确定最优的基因标签。分析噪声的影响,对于数据噪声,利用小波阈值去噪的方法滤除;对于无用基因,采用交替选择算法处理,进而重新确定基因标签。实验证明对肿瘤基因表达谱中噪声的处理有助于获取分类能力更好的基因标签。  相似文献   

8.
黄经纬 《自动化应用》2021,(10):15-17,22
针对肿瘤基因数据的样本小、维度高特点,为解决小样本对分类准确率的影响,提出对样本进行扩充的方法;结合特征获取的方式不同,将主成分分析(PCA)、核主成分分析(KPCA)和非负矩阵(NMF)特征进行组合,再通过鲁棒性更强的堆栈自动编码器(SDAE)和Softmax进行分类.实验表明,经过合理的样本特征组合及小样本扩充能够...  相似文献   

9.
基于基因表达谱的SRBCT分类研究   总被引:2,自引:0,他引:2  
肿瘤亚型的准确判别对肿瘤的治疗具有重要的意义。文章提出了一种多类肿瘤分类和特征基因选取的策略。该方法以儿童SRBCT(小圆蓝细胞瘤)的基因表达谱为例,计算基因的类加权Bhattacharyya距离,并据此选取特征基因,然后利用这些基因的表达数据建立了基于支持向量机的多模预测模型并对SRBCT的4种亚型进行了识别。实验结果表明了该方法的有效性和可行性。  相似文献   

10.
晁浩  阮晓钢 《计算机工程与应用》2005,41(31):178-179,204
基于肿瘤基因表达数据,运用信息科学的方法和技术建立肿瘤的预测分类模型,对肿瘤的识别具有重要意义。针对该类问题,论文提出了一种利用支持向量机进行肿瘤分类与判别的方法。该方法在分析基因表达谱特征的基础上,首先对所有的基因进行聚类,并挑选出每一类的“代表基因”作为特征基因,然后采用支持向量机作为分类器进行肿瘤分类。论文以前列腺癌的基因表达谱数据为例进行分类实验并取得了良好的分类结果,表明了该方法的有效性和可行性。  相似文献   

11.
基于基因表达谱提出了一种依据类加权Bhattacharyya距离提取特征基因并使用人工神经网络(ANN)进行肿瘤亚型识别的方法。分析了儿童小圆蓝细胞瘤(SRBCTs)的基因表达数据后,在训练样本集上计算出各个基因的类加权Bhattacharyya距离,并据此选择特征基因构造若干ANN模型,利用独立测试集验证其分类能力,且依据分类错误率最小的原则确定了含40个基因的特征基因组合。基于该特征基因组合的ANN模型不仅正确地识别了所有的患病样本的亚型,还能鉴别非患病样本。  相似文献   

12.
基于基因表达谱的癌症检测对癌症的治疗具有十分重要的意义。显现模式(Emerging Patterns,EPs)能够挖掘隐含的具有生物意义的基因表达模式,基于显现模式的癌症分类方法可以检测出癌症样本。针对提取显现模式时在小样本情况下将频率近似于概率的缺陷,引入贝叶斯估计以提高熵的可靠度,提取癌症表达中的增强显现模式(Improved Emerging Patterns,EPIs),并提出一种基于增强显现模式的基因分类算法(A Cancer Classification Algorithm with Improved Emerging Patterns CCEPI)。最后在急性白血病数据集上进行实验,实验结果表明算法提高了癌症检测的正确率。  相似文献   

13.
Abstract: Cancer classification, through gene expression data analysis, has produced remarkable results, and has indicated that gene expression assays could significantly aid in the development of efficient cancer diagnosis and classification platforms. However, cancer classification, based on DNA array data, remains a difficult problem. The main challenge is the overwhelming number of genes relative to the number of training samples, which implies that there are a large number of irrelevant genes to be dealt with. Another challenge is from the presence of noise inherent in the data set. It makes accurate classification of data more difficult when the sample size is small. We apply genetic algorithms (GAs) with an initial solution provided by t statistics, called t‐GA, for selecting a group of relevant genes from cancer microarray data. The decision‐tree‐based cancer classifier is built on the basis of these selected genes. The performance of this approach is evaluated by comparing it to other gene selection methods using publicly available gene expression data sets. Experimental results indicate that t‐GA has the best performance among the different gene selection methods. The Z‐score figure also shows that some genes are consistently preferentially chosen by t‐GA in each data set.  相似文献   

14.
采用传统的病理学诊断方法对肿瘤进行分类存在一定的局限性,基因芯片等高通量技术的问世为肿瘤研究带来了革命性的进展,在肿瘤分类中发挥了积极作用。该文以weka数据挖掘平台作为特征基因选择与样本分类模型建立的工具,解决了肿瘤分类理论性强,操作难度高的问题。该文以97名乳腺肿瘤患者的基因表达谱数据进行实验,实验结果表明,weka平台可以有效降低基因表达谱数据的维度,对肿瘤的精确诊断具有较高应用价值。  相似文献   

15.
基于基因表达谱的分类技术对于疾病检测具有十分重要的研究意义。利用显现模式(Emerging Patterns,EPs)的基因分类方法不仅可以识别癌症样本,同时可以挖掘出隐含的与癌症相关的具有生物意义的基因模式,从基因角度揭示癌症病理。针对提取显现模式时在小样本情况下将频率近似于概率的缺陷以及PCL(Prediction by Collective Likelihood)分类器的不足,提出一种基于显现模式的基因分类算法:在显现模式的提取中引入贝叶斯估计以提高熵的可靠度,并借鉴KNN思想,提出一种新的基于EP的分类算法EP-KNN(Emerging Patterns-K Nearest Neighbors)。最后在急性白血病数据集上进行实验,实验结果表明新的算法提高了分类正确率,说明了该方法的有效性。  相似文献   

16.
从癌症基因表达谱分析入手,针对基因表达谱维数高、样本少的特点,提出一种用于癌症分类的基于邻域粗糙集和概率神经网络集成的分类方法.首先利用Relief算法对基因进行排序,然后利用邻域粗糙集选取分类特征基因,最后结合概率神经网络集成分类模型进行癌症分类.实验结果表明,该方法可以快速有效地选取癌症特征基因,能获得更好的分类效...  相似文献   

17.
对肿瘤基因表达谱进行分析,从而有效区分正常样本与肿瘤样本的关键是:准确找出能够决定样本类别的最少特征基因,并用一个性能较好的分类器进行分类预测。针对该问题,用修订的特征记分准则(RFSC)去除分类无关基因;对两两冗余法进行改进,提出强相关树法用于冗余基因的去除;对粗糙支持向量机(RSVM)改进,提出近似等价粗糙支持向量机(AE-RSVM)对样本集进行分类测试。以肿瘤样本集为例进行测试,实验结果表明了提出方法的可行性和有效性。  相似文献   

18.
Gene selection is one of the important issues for cancer classification based on gene expression profiles. Filter and wrapper approaches are widely used for gene selection, where the former is hard to measure the relationship between genes and the latter requires lots of computation. We present a novel method, called gene boosting, to select relevant gene subsets by integrating filter and wrapper approaches. It repeatedly selects a set of top-ranked informative genes by a filtering algorithm with respect to a temporal training dataset constructed according to the classification result for the original training dataset. Empirical results on three microarray benchmark datasets have shown that the proposed method is effective and efficient in finding a relevant and concise gene subset. It achieved competitive performance with fewer genes in a reasonable time, as well as led to the identification of some genes frequently getting selected.  相似文献   

19.
肿瘤识别过程中特征基因的选取   总被引:7,自引:0,他引:7  
阮晓钢  晁浩 《控制工程》2007,14(4):373-376
基于肿瘤基因表达数据,运用信息科学的方法和技术建立肿瘤的预测分类模型,对肿瘤的识别具有重要意义。在建立模型的过程中,如何能够有效地排除噪声基因进而挑选出分类特征基因对肿瘤预测的准确性有很大的影响。针对该类问题,提出了一种新的特征基因选取方法—CLUSTER_S2N法。该方法采取了“信噪比”指标与聚类相结合的方法来挑选特征基因,并分别以前列腺癌和急性白血病的基因表达谱为例,用支持向量机作为分类器进行了肿瘤的分类预测实验。实验结果表明该方法的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号