首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到11条相似文献,搜索用时 62 毫秒
1.
针对传统差异表达基因识别方法不能处理异质性数据集以及分析结果偏差较大的问题,提出了一个基于元分析及标准差过滤技术的差异表达基因识别算法标准差排序分析(RS-DM)。对来自于不同实验平台的数据进行整合分析,过滤掉伪差异表达基因PDEGs,并找出遗失的真正的差异表达基因TDEGs。经实验验证,算法简单有效。  相似文献   

2.
隐Markov模型的基本原理及其在基因识别中的应用   总被引:1,自引:0,他引:1  
隐Markov模型(Hidden Markov model,HMM)用于基因识别研究是生物信息学研究的新领域,剪接位点的识别是基因识别中的一个重要环节。本文中作者主要介绍了隐Markov模型的基本原理,讨论了HMM在生物信息学中的应用以及HMM用于识别基因的模型。HMM用于识别剪接位点的实验结果表明,该方法可以很好的提取剪接位点附近保守序列的统计特征.对剪接位点的识别率达到90%以上。  相似文献   

3.
从GEO芯片数据集中挖掘与正常结肠组织具有表达差异且与肿瘤病理特征相关的结肠癌关键基因。在GEO数据库中获取并处理GSE41258和GSE39582芯片数据集,筛选差异表达基因,利用DAVID、STRING等数据分析工具对差异表达基因进行KEGG分析、GO分析以及蛋白质相互作用(PPI)网络构建。利用Cytoscape 3.9.1软件与UALCAN数据库筛选枢纽(Hub)基因,并分析其与结肠癌临床病理的相关性。从两个GEO数据集中共筛选出108个差异表达基因,其中上调基因36个、下调基因72个。KEGG分析和GO分析显示差异表达基因主要富集于类固醇激素生物合成、视黄醇代谢、胆汁分泌、IL-17信号通路、PPAR信号通路并参与细胞葡萄糖醛酸化、类固醇代谢、胶原分解代谢、视黄醇代谢等生物过程。最终筛选出排名前五的Hub基因,分别是SPP1、COL1A1、CXCL8、MMP1和FABP1,其中SPP1和COL1A1表达与结肠癌肿瘤分期呈正相关,FABP1、MMP1和CXCL8在结肠癌早期就表现出显著差异性。通过生物信息学分析发现,在5个结肠癌关键基因中,SPP1和COL1A1与结肠癌进展相关...  相似文献   

4.
提出一种简单有效的步态识别算法.对于每个步态序列,首先,通过背景减差检测运动目标的轮廓;再计算轮廓质心与边缘的距离,并对其进行归一化;用PCA方法获取归一化距离信号的特征空间;使用时空相关进行相似性度量;最后通过最近邻法进行分类识别,在自己建立的样本数据库中取得了满意的效果.  相似文献   

5.
对经典隐马尔可夫模型(HMM)的状态转移和输出观测值的假设条件进行改进,提出了一个基于二阶隐马尔科夫模型(second-order HMM:HMM2)的基因识别系统的模型,论述了用该模型和扩展的Viterbi算法发现基因的方法.  相似文献   

6.
利用生物信息学方法筛选与胶质瘤预后相关的衰老基因,并进行相关预后风险模型的构建与验证。首先,从中国脑胶质瘤基因组图谱数据库中获取胶质瘤患者的表达谱和临床信息,通过单因素回归、拉索回归、多因素回归的方法构建相关预后模型;其次使用外部数据集进行验证;再使用箱线图表明各临床亚型的风险评分差异;最后使用富集分析(GSEA)探讨可能涉及的机制。结果筛选出4个用于预后的基因。训练集和验证集的生存曲线显示,高风险组的总生存率显著低于低风险组(p<0.001)。受试者工作特征曲线分析结果显示,训练集在1、3和5 a的曲线下面积分别为0.91、0.95和0.95,验证集在1、3和5 a的曲线下面积分别为0.73、0.80和0.80,说明该模型对患者的预后预测具有很强的预测效能。临床亚型箱线图显示多种临床亚型分组的风险得分具有显著差异。GSEA分析富集的通路主要涉及JAK-STAT信号路径、P53信号通路、泛素介导的蛋白水解、长期电位富集等通路。以上结果表明这4个衰老相关基因可能为胶质瘤预后潜在的生物标志物。  相似文献   

7.
研究数据差异(DISSIM)方法在多变量统计过程控制中的应用.为检测过程数据分布变化来监视操作条件变化,并且定量地评价两组数据之间的差异,DISSIM方法定义一种差异指标D.计算D时运用时间窗口,时间窗口对指标D具有平滑作用,与MSPC的统计指标T2或Q相比,D变化平稳.针对多变量自回归过程和TE过程,分别应用MSPC和DISSIM两种方法做仿真试验.仿真结果表明:与MSPC相比,适当选择时间窗口时,DISSIM善于检测过程中小的、缓慢的变化,而且能够检测操作条件的变化,明显改善了监视性能.  相似文献   

8.
针对传统差异表达基因分析方法使用单一数据集,不能处理异质性特性数据集、分析结果偏差大的问题,提出了联合驱动排除的概念,设计实现一种使用多研究数据集的元分析算法。应用公共数据库GEO中GDS2490和GDS2491数据集对设计的算法与微芯片显著性分析方法进行了对比。实验结果表明:设计的算法可以对数据集实行联合驱动排除,与微芯片显著性分析方法相比,可以有效分析异质性特性的数据集,准确找到差异表达的基因,验证了算法的有效性。该方法为差异表达基因识别提供了新思路。  相似文献   

9.
在对家蚕蛹cDNA文库进行分析时,发现一条与脂多糖诱导肿瘤坏死因子α的转录激活因子LITAF的保守结构域同源的保守序列。基因序列全长为981 bp,由97 bp的5端非翻译区序列(5 UTR)、390 bp的开放读码框(ORF)和494 bp的3端非翻译区序列(3 UTR)组成。利用生物信息学方法对BmLITAF进行基因结构分析发现,此基因由3个外显子和2个内含子组成,编码129个氨基酸残基;其预测理论分子量为13.9 kDa,预测等电点6.47;在90~100位氨基酸残基区域具有较高的疏水性,具有跨膜结构域;定位细胞内的可能性较大。根据BmLI-TAF的cDNA序列进行PCR扩增获得目的基因,将其克隆到质粒pGEX-4T-3中,测序验证克隆正确。经IPTG诱导,结果发现目的蛋白主要以包涵体的形式存在。  相似文献   

10.
随着P2P技术的发展,单纯地依靠IP加固定端口、应用层特征匹配进行流量识别的方法已不能满足实际需求。本文基于P2P网络结点既下载数据内容又将其进行转发的事实,建立了P2P网络的内容转发模型,并在此基础上设计实现了基于P2P网络内容转发模型的流量识别算法。该算法不依赖于端口号或应用层特征等与特定应用相关的信息,而是充分利用了结点具有内容转发的内在特性,具有较好的扩展性和鲁棒性。同时,理论分析和实验结果表明:本文算法具有较好的识别精度和鲁棒性,对检测P2P流媒体应用及热门资源共享产生的流量更具适应性。  相似文献   

11.
针对microRNA靶基因预测中出现的敏感性与特异性的矛盾、阳性阈值与测试结果优劣的矛盾和预测范围缩小的问题,提出种子区域上的能量标定、元素比例、靶标作用体上的惩罚3种特征提取新方法,以上特征提取方法涵盖了统计信息、结构信息和能量信息。结合传统特征和新特征,本文利用神经网络构建分类模型并测试。结果显示:新特征能使阴性、阳性数据各自的聚集度有效提高,在高阳性阈值下,评估效果良好;并且靶基因预测范围未缩小,预测开销未增加。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号