首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 218 毫秒
1.
李辉  王金莲 《电子学报》2008,36(5):989-992
 本文从肿瘤基因表达谱分析入手,研究并选取胃癌相关标志基因集合,以此集合为基础抽取甄别肿瘤与正常组织的基因分类规则集,进而建立起肿瘤预测模型.首先,以支持向量机为分类器用特征基因集合的样本识别率为适应度函数,采用遗传算法对特征基因进行筛选.然后用决策树抽取特征基因的规则集,结合肿瘤分子生物学文献和生物实验建立肿瘤预测模型.最后通过对胃癌基因表达谱数据的分析,建立了胃癌预测模型,结果表明该模型对胃癌分子生物学实验和临床诊断具有一定的指导意义和参考价值.  相似文献   

2.
李颖新  阮晓钢 《电子学报》2005,33(4):651-655
利用肿瘤基因表达谱建立有效的"预测性"分类模型,对肿瘤的不同亚型进行准确判别并找出决定样本类别的一组特征基因是当前生物信息学研究的重要课题.本文在分析肿瘤基因表达谱特征的基础上,以急性白血病的基因表达谱为例,研究了肿瘤亚型识别与分类特征基因选取问题.在类别可分离性判据的问题上,修正了已有的"信噪比"指标,据此进行无关基因的剔除,并以支持向量机作为分类器进行肿瘤亚型的识别.在特征基因选取问题上,本文从生物学分析出发,首先剔除无关基因和具有较强相关性的冗余基因,然后采用顺序浮动搜索算法进行分类特征基因的选取.实验结果表明了上述方法的可行性和有效性.  相似文献   

3.
阿尔茨海默症(Alzheimer’s disease,AD)基因表达谱数据具有高维性、高噪声、高冗余性等特点,使得AD特异性基因的搜索空间巨大,搜索算法时间长,降低了算法的挖掘性能及其生物学分析。因此对其基因表达谱数据进行去噪和降维预处理是十分必要的。文中首先利用小波包变换-SAM方法对数据进行降维去噪,实验结果证明了小波包方法能较好地提取基因表达谱有用信息;然后应用快速独立成分分析(FastICA)算法对预处理后的数据进行矩阵分解分析,并根据独立分量选取特异性基因。在此基础上的样本分类实验表明,FastICA提取的特异性基因具有较高的显著性,能够提高样本的分类结果。同时,通过所提取特异性基因的富集性分析,文中给出了这些基因在阿尔茨海默症数据集中聚类情况及其基因表达情况,为AD的生物学及医学病理分析提供有利的依据。  相似文献   

4.
目的:探讨诊断性基因表达谱模式提取方法,为疾病的诊断打下基础。方法:基于正常人、骨髓增生异常综合征和原发性急性髓系白血病3种情况的基因表达谱数据,利用可信区间方法描述表达变化趋势,从而建立表达谱的模式;同时利用差异性比较的可信区间方法,得到差异表达基因的图示法。结果:得到了基因表达谱模式;建立了多组差异表达基因的示意图...  相似文献   

5.
近年来,随着肿瘤医院就诊人数的不断增多,特征基因提取已成为中内外学者研究的热门,研究成果也为临床癌症的分析诊断及预测提供了极大的便利。然而,由于基因表达谱数据具有维度高、样本少、复杂多样的特点,准确地挖掘基因数据中所蕴含的肿瘤信息基因成为当前的首要挑战。文章阐述了在Matlab2010b编程环境下开发的肿瘤基因数据选择系统,介绍了改进后信噪比与支持向量机回归特征消去(SVM-RFE)的基因选择方法相结合对于基因选择的优异性,对于筛选出对分类有益的特征基因具有良好的效果。  相似文献   

6.
由于基因表达谱数据的高噪声、高维性、高冗余以及数据分布不均匀等特点使得在分析过程中仍然有很多挑战性问题。基于该目的,将一种无监督学习方法--非负矩阵分解方法,应用到基因表达谱数据中,挖掘出与AD相关的信息基因。然而标准NMF算法其效率较低,并且在基因表达数据的应用有效性低。为了适应该领域的需求,采用了Alpha-NMF算法。该算法能够有效的克服标准NMF算法的缺陷,获得较好的实验结果。多次运行Alpha-NMF算法,选取分类准确率和稳定性最优的实验结果,对其集合基因设定一阈值,筛选出集合基因中大于该阈值的信息基因。最后通过基因功能分类以及生物功能结构图来验证所提炼出的特异性基因的有用性和可靠性。  相似文献   

7.
基于目前肿瘤基因表达谱数据在医学相关结合行业的广泛普及,运用特征选择算法对其处理成了如今大量学者们的重点研究方向.基于此,提出了一种FCBF-Lasso结合算法.首先,采用FCBF算法对各基因数据集进行特征选择,通过删除冗余的和不相关的特征,得到特征子集;然后,再利用Lasso方法对得到特征子集进行特征选择,进一步地删...  相似文献   

8.
基因表达数据通常具有维数高、样本少、类别分布不均等特点,如何提取基因表达数据的有效特征是基因分类研究的关键问题。该文借助相关分析理论,构建鉴别敏感的视角内相似度顺序保持散布并且约束鉴别敏感的视角间相似度相关,从而形成了一种新的基因特征提取方法,即相似度顺序保持跨视角相关分析(SOPACA)。该文方法在保持不同视角间特征类内聚集性和相似度顺序的同时具有较大的类间离散性。在癌症基因表达数据集上的良好实验结果显示了该文方法的有效性。  相似文献   

9.
利用基因表达谱对肿瘤进行分子水平的检测和预测已经成为生物信息学的一个研究热点.如何从超高维基因序列中剔除噪声基因是该类问题的关键之一.本文提出一种基于欧氏中心距和标准差(SDEC)的可分性准则来衡量基因的相似性对噪声基因进行滤波和有效基因的选择,并结合K-L变换进行二次特征提取,进而利用机器支持向量机(SVM)进行分类检测.利用文中的方法对白血病基因表达谱进行测试,实验结果表明,利用从7129个基因中选出的105个基因进行分类可获得者100%的分类精度.  相似文献   

10.
马春霞 《电子技术》2014,(6):20-21,19
稀疏方法有一个重要的优点就是能减少基因表达数据的复杂度,故它具有很好的可解释性。在这篇文章中,我们利用稀疏控制的非负矩阵分解(NMFSC)来提取特征基因,因为稀疏控制的非负矩阵比其他稀疏方法更具有可解释性。在实验部分,将NMFSC应用在植物基因表达数据集上,并将其与传统的稀疏方法(SPCA)进行对比。实验证明我们的方法要比其他方法能提出更多的基因。  相似文献   

11.
This paper proposes a dynamic-model-based method for selecting significantly expressed (SE) genes from their time-course expression profiles. A gene is considered to be SE if its time-course expression profile is more likely time-dependent than random. The proposed method describes a time-dependent gene expression profile by a nonzero-order autoregressive (AR) model, and a time-independent gene expression profile by a zero-order AR model. Akaike information criterion (AIC) is used to compare the models and subsequently determine whether a time-course gene expression profile is time-independent or time-dependent. The performance of the proposed method is investigated on both a synthetic dataset and a real-life biological dataset in terms of the false discovery rate (FDR) and the false nondiscovery rate (FNR). The results show that the proposed method is valid for selecting SE genes from their time-course expression profiles.   相似文献   

12.
13.
一种肿瘤基因表达数据的知识提取方法   总被引:7,自引:2,他引:7       下载免费PDF全文
李颖新  刘全金  阮晓钢 《电子学报》2004,32(9):1479-1482
本文以多发性骨髓瘤的基因表达数据为例,利用数据挖掘技术,提出了一种针对基因表达数据进行知识发现的方法.该方法通过计算基因的信息增益,结合神经网络,找出了特征基因集合,最后利用决策树进行特征规则的提取,给出了基于多发性骨髓瘤数据样本的产生式规则,为生物医学研究提供了一种分析和研究基因表达数据的参考方法.实验结果表明了该方法的有效性.  相似文献   

14.
In this paper, we study a multi-mode quantized precoding multiple-input multiple-output (MIMO) system with per-substream adaptive modulation and coding under a maximal throughput target. An analytical throughput expression is firstly presented by recurring to Gaussian mixed approximation for block error rate of Turbo codes. An optimal mode-MCS (modulation and coding scheme) selection algorithm is then developed to achieve maximal throughput performance based on throughput criterion. Further, a complexity-reducing selection algorithm with negligible performance loss is proposed by making full use of the information provided by singular value decomposition of the instantaneous channel matrix at the receiver side. Simulation results show that both selection algorithms can achieve good throughput performance in the above mentioned MIMO system.  相似文献   

15.
In this paper, we investigate feature extraction and feature selection methods as well as classification methods for automatic facial expression recognition (FER) system. The FER system is fully automatic and consists of the following modules: face detection, facial detection, feature extraction, selection of optimal features, and classification. Face detection is based on AdaBoost algorithm and is followed by the extraction of frame with the maximum intensity of emotion using the inter-frame mutual information criterion. The selected frames are then processed to generate characteristic features using different methods including: Gabor filters, log Gabor filter, local binary pattern (LBP) operator, higher-order local autocorrelation (HLAC) and a recent proposed method called HLAC-like features (HLACLF). The most informative features are selected based on both wrapper and filter feature selection methods. Experiments on several facial expression databases show comparisons of different methods.  相似文献   

16.
针对软件纠错性维护问题,文章提出了一种基于程序切片和专家系统相结合的软件故障诊断策略。软件故障诊断策略是首先详细分析故障信息,了解系统功能缺陷的特征;其次进行粗诊断,确定最有可能出现故障的模块;在此基础上进行细诊断,详细分析故障代码,以确定最可能存在故障的程序语句集合;最后排除故障后确认修改的语句对相关模块没有影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号