排序方式: 共有11条查询结果,搜索用时 15 毫秒
2.
随着高通量测序成本的不断降低,基于DNA测序技术的肿瘤基因组研究已经成为揭示肿瘤分子机制的主流方法,并在临床诊断和治疗中逐渐得到应用。肿瘤体细胞单核苷酸突变变异 (single nucleotide variant, SNV) 作为最简单的一种基因变异类型,其检测会受到家系多态性、肿瘤异质性、测序和分析误差等多个因素的影响,从而导致一些假阳性的结果。目前,已有一些基于肿瘤基因组测序数据的体细胞 SNV 检测软件,如 Varscan2,Mutect2,Strelka,SomaticSniper 等。本文选取四种典型的检测方法,对每种方法的检测原理进行研究,并使用 ICGC-TCGA 提供的全基因组数据,对上述四种变异检测软件进行测试。参照每种方法的分析流程,获得每种方法识别的候选变异位点集,并与真实的变异位点集合进行比较,分析每种算法的优缺点,从而为研究人员使用这些方法提供指导。 相似文献
3.
分子空间结构相似性比较的指标函数可以定量地描述两个分子空间结构相似性大小,但难题在于如何确定分子初始相对位置,以保证得到全局最优叠合.由于以往都是利用程序随机生成初始相对位置,所以没有规则也不确定.为保证得到全局最优叠合,需要大量的初始相对位置优化计算.利用“均匀设计”的实验设计手段,在空间规则地筛选部署分子初始相对位置,使其具有代表性和均匀分布性,这样只需少数确定数目的初始相对位置,便可以稳定地得到指标函数的全局最优解.而后利用并行处理方法,把初始相对位置集合部署在Np个处理器上同时工作,大幅度地减少了运行时间,并输出与串行执行相同的运算结果. 相似文献
4.
5.
6.
一种基于"基因表达谱"的并行聚类算法 总被引:7,自引:0,他引:7
跨物种的生物序列比较已经被广泛应用于基因功能预测,而越来越多的实验表明序列相似性并不足以保证基因功能相似.为了精确确定基因功能,不仅需要考虑序列性质,还需探索基因表达信息的特性,因为基因表达的改变往往伴随着基因功能的改变.通过聚类分析基因表达谱,可以直观判断协同表达基因及其规律,这是考察基因功能的重要一步.由于生物组织基因表达的复杂性,以及识别表达的microarray技术和理念的不断更新,表达数据的规模也呈指数规律递增,聚类分析遭遇了巨大瓶颈--过高的时空复杂度.根据"基因表达谱"的数据特征,对处理表达谱数据的分层聚类提出了一种并行分层聚类算法--PHCA,主要解决了并行设计的负载平衡问题,并实现了MPI平台的并行程序设计.并行程序性能分析表明,PHCA算法较大幅度降低了分层聚类算法的时空复杂度. 相似文献
7.
Motif在转录和后转录水平的基因表达调控中起着重要的作用。目前,识别Motif的算法和相应的软件已有不少,但是却鲜有对各种算法及软件性能共同评测的研究和报告。介绍了算法的分类以及三种常见的Motif识别算法Wordup,MM和Gibbs采样,并对AlignACE,MEME,MotifSampler,Weeder等13种Motif寻找软件进行性能比较分析。通过生物学意义的研究和性能比较结果可以得出:由于唯有Weeder算法考虑了Motif保守核心位置,因而它在各种软件中识别效果较好;大部分算法只考虑简单而 相似文献
8.
9.
10.
超大规模序列比对计算的并行优化 总被引:1,自引:0,他引:1
针对生物信息学研究中的超大规模序列比对计算问题进行了研究,解决了现有的e-PCR软件包在处理小麦基因引物扩增比对任务中存在的内存瓶颈、I/O瓶颈和计算时间瓶颈问题,利用数据和任务分割的基本方法,使其最关键的引物与模板的比对计算能够大规模并行,进而采用基于主从通信模式的MPI通信框架进行编程实现,并从任务的缩减、负载平衡、容错和多作业并发等方面进行了优化,最终在百万亿次超级计算机上顺利实现了千核级大规模并行计算,在数十日内即可完成原本预期需要数年的小麦序列扩增比对计算. 相似文献