首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
目前基因拼接软件中应用最广泛的技术是基于De Bruijn图的基因拼接算法,需要对长达数十亿BP长度的基因组测序数据进行处理.针对海量的基因测序数据,快速、高效和可扩展的基因拼接算法非常重要.虽然已出现一些并行拼接算法(如YAGA)开始研究这些问题,但是拼接过程中时间、空间消耗较大的构图和单链化简这两大步骤在海量数据的挑战下仍然是最主要的计算瓶颈.这是因为现有工作在处理这几个步骤时通常使用了并行的表排序(list ranking),而该方法需要多次对De Bruijn图的海量顶点信息进行分布式的排序,产生了大量的计算节点间的通信.单链化简可由1次De Bruijn 图深度优先遍历完成而不再需要表排序,于是提出一种基于分布式海量图遍历方法对单链化简进行优化,极大地减少了处理器间的通信和计算节点之间的数据移动,因而取得较好的扩展性,其算法复杂度为O(g/p),通信复杂度为O(g),这里g为参考序列的长度,p为处理器的核数.当对E.coli和Yeast数据集进行测试,处理器的核数从8个增加到512个时,算法可以得到13倍和10倍的加速比;当对C.elegans和人类1号染色体(chr1)数据集进行测试,处理器的核数从32个增加到512个时,算法可以得到7倍和10倍的加速比.  相似文献   

2.
基因组测序是生物信息学中最基本的研究方向之一,然而大多数生物的基因组都不可能一次性获得,需要利用序列拼接技术对实验中获得的DNA片段进行拼接操作.目前,测序过程中获得的DNA片段越来越短,基于Euler路径的拼接算法在处理这种短片段拼按时具有优势.在Euler路径算法中,一个关键的步骤是de Bruijn图的构建,一直以来,构建de Bruijn图的方式总是让后一个k-mer与前一个k-mer 之间有k-1个碱基的交叠,相邻的两个k-mer之间相互错开一位.但文中的研究发现,如果有边连接的两个k-mer之间有k-2个或者更少的碱基相交叠,会对de Bruijn图结构复杂性产生重要影响.针对这些影响进行详细分析,并设计实验进行验证,实验结果表明,k-mer之间的错位数变化对de Bruijn图结构复杂性有显著影响.  相似文献   

3.
在De Bruijn网络中进行并行矩阵乘法运算,算法简单,容易实现。首先介绍了De Bruijn网络结构,然后提出了一种基于De Bruijn网络结构的矩阵乘法的并行算法,分析了它的加速比、效率等性能及可扩展性,通过与Cannon算法的比较,证明它的时间复杂度等效于Cannon算法,最后通过实验验证了这个结论的正确性。  相似文献   

4.
针对软件性能测试的难点一直是快速、准确地得到有效信息,并使性能评价贯穿整个开发周期.利用UML多图组合的方式来进行系统描述,以期充分利用UML的扩展来携带所需的性能信息,避免单一UML图描述系统的片面性;以消息走向为主线,采用多图组合的方式提供完整的系统架构.给出了不同角度下的UML图组合规则,主要研究了根据工作流程进行划分组合或者根据对象的状态来进行图组合两种方式,并给出了各个图例在组合中的作用以及各个图例之间的信息交互.  相似文献   

5.
6.
基于Web软件的性能测试   总被引:6,自引:0,他引:6  
基于Wed的软件相对于传统的应用程序具有很多新的特点,这对软件测试提出了新的要求。文章对软件的性能测试进行了研究,分析了软件性能的内涵、性能评测等。这些对于提高和改善基于Wed软件的性能具有很好的指导意义。  相似文献   

7.
针对新型超高通量测序仪Solexa测序仪所产生的测序片段read的比对与组装问题,提出一种短序列比对与组装算法SRMA,采用对参考序列进行hash的方法,将测序片段read分3段快速、准确地定位于参考序列,对不能定位的read采取从头(Denovo)组装的方法进行组装。测试结果表明SRMA算法具有较高的性能和敏感度,以及良好的应用前景。  相似文献   

8.
阮利  王永吉  王青  曾海涛 《软件学报》2009,20(6):1499-1510
提出了一种基于数据包络分析的软件任务性能基准评价新方法——TaskBeD.介绍了TaskBeD的任务基准评价模型和核心算法(挖掘高性能的软件任务,建立参考任务集和结果的敏感度分析).实验结果显示,TaskBeD能够高效处理多变元和可变规模收益任务数据.  相似文献   

9.
HPCC(High Performance Computing Challenge)基准较Linpack能够更全面反映高性能系统性能。但是HPCC测试结果是若干个指标项,缺少一个整体的,直观而统一的评价结果,一直未能被广泛地接受。使用HPCC测试集对两个高性能平台进行了性能评测,并在此基础上提出了一种简单易行的HPCC测试数据分析处理方案对HPCC测试结果进行分析,得到一个直观而统一的HPCC的测试结果。该结果清晰地反映出每个系统的优势和不足,并且依据该分析结果对两个高性能计算平台的性能进行了比较。  相似文献   

10.
邹茁 《网友世界》2013,(4):12-13
随着网路技术的发展,软件Agent、Web Service、CCM、云计算等技术非常流行。用户在不断追求在Internet环境下的新体验,相对传统的软件运行平台逐渐由静态封闭走向开放、动态和多变。本文针对网构软件这一概念的提出,对相应的新的软件开发方法进行具体详细分析,全面分析了软件发展的全新模式。基于构件的可复用操作组装技术的开发应用,较好的适应这种模式的转变。面向构件的网构软件组装技术是目前软件研究的热点,通过对于这种技术的深刻分析,将对网构软件的开发具有重要意义。  相似文献   

11.
徐魁  陈科  徐君  田佳林  刘浩  王宇凡 《计算机科学》2015,42(9):235-239, 245
基因组测序的目的是获取一个生物体完整的DNA序列信息,而DNA信息是进行遗传学研究和疾病诊断的基础。通常而言,完整的基因组测序分为两个步骤:第一步通过实验手段测定DNA序列片段,第二步通过计算方法把DNA片段拼接为完整的基因组。尽管桑格测序技术成功解析了包括人类在内的多个基因组,但其由于成本过高,目前逐渐被新一代测序技术所取代。新一代测序技术的特点为高通量、高覆盖率、低成本,随之而来的缺点体现为短读长、更多类型的错误。这些特点也给基因拼接算法带来了更大的挑战。鉴于目前的数十种基因拼接算法中并没有一种算法显著优于其它算法,且一些分析表明不同算法的拼接结果具有互补性,提出了CGDNA算法框架,它把不同算法的拼接结果整合到一起,使得整合的结果超越任何单个算法的结果。提出了一种基于簇图的基因组序列集成拼接算法,它通过构建索引、读长映射、重叠群聚簇、构建簇图等步骤将重叠群拼接成更长的序列。实验结果表明,相对于目前最优的算法Velvet、ABySS、SOAPdenovo,CGDNA在N50与最长拼接序列这两项指标上的增长比例高达50%以上,并且达到了较高的覆盖度。当更多的基本算法集成到本算法时,性能可进一步提高。提出的方法大幅提高了基因拼接的长度,为下一步的遗传分析降低了难度,并加快了生物基因组研究的步伐。  相似文献   

12.
Koorde是一种常数度分布式哈希表(DHT),但它的定位策略有待改进以减少逻辑路由跳数,而且它存在着逻辑拓扑和物理拓扑失配的问题。在定位过程中采用最短路径路由策略以减少定位跳数.同时提出一种利用IP地址的特性来增强拓扑一致性的路由模型SKoorde。实验仿真表明,SKoorde的平均查询率和平均跳转比两项指标均优于改进前的Koorde,能够较好地提高路由效率。  相似文献   

13.
武思文  李静  张少强 《计算机科学》2018,45(12):308-312
转录组拼接是基因组测序与功能注解问题的一个重要组成部分。为了提高转录组拼接的精度和效率,文中提出了一种新的转录组从头拼接算法StepLink。该算法的主要创新点是提出了最左k-mer(长度为k的短序)和右k-mer的概念,并运用双重哈希表来存储相邻的每对k-mer,使得拼接更加迅速、准确。应用该算法对SRA数据库中人、狗和老鼠的测序数据分别进行拼接,结果表明该算法比其他已有算法更高效。  相似文献   

14.
基于门限方案的动态图软件水印算法   总被引:2,自引:2,他引:2       下载免费PDF全文
针对动态图水印鲁棒性和恢复率较低的问题,提出基于门限方案的动态图水印算法——AB算法。在软件水印中引入密钥共享思想,实验结果证明,该算法能有效弥补CT算法的缺陷,阻止攻击者通过透彻分析运行时的堆栈获取原始水印。  相似文献   

15.
随着科技数据量的不断增长,各科技部门积累了大量科技项目的科技管理数据.对于大量结构化数据,需要针对分散数据进行整理、分析,最终按需求提供数据查询与抽取服务.由于在关系数据库中关联关系的分析效果不佳,为了提高分析效率,文中引入了关系图谱进行数据处理.首先,提出了一种基于词频的实体搜索与定位算法来提取实体和关系,并构建关系...  相似文献   

16.
企业流程是指为完成企业战略目标而进行的一系列逻辑相关的活动的有序集合,是企业经营活动的表现形式,也是现代信息系统建立的基础。然而传统的需求分析技术并没有体现出企业流程这一概念。论文在分析企业流程特点的基础上,建立了基于企业流程的需求分析方法的图形描述机制,重点叙述了企业流程建模的方法。  相似文献   

17.
基于缺陷度量的软件质量成本分析模型   总被引:2,自引:0,他引:2       下载免费PDF全文
针对软件项目的质量成本效益无法直接度量的这一难题,提出了建立组织级质量成本度量基线的解决方案。设计了基于缺陷度量的软件质量成本分析模型,实现了对软件质量成本及其效益的定量度量与分析,为评价软件质量保证活动绩效、指导质量投资决策提供了试用方法。  相似文献   

18.
李娜  谢冬青 《计算机科学》2006,33(8):271-274
基于项重写的安全风险分析的抽象规约模型在代数签名的基础上直接得到结果,没有提供相关攻击步骤明确描述,没有提供决策和攻击之间关系的统一视图,容易导致威胁的传播。为此,本文首先将图重写方案引入模型中,证明了引入图重写规则以后的风险分析系统仍然是终止的。然后利用图重写规则,提出了一种可以获得更优决策集合的方法,在改进的求带权二分图最小覆盖的方法的基础上,获得了一种具有相同时间复杂度和更高代价利益比的方法。整个模型高效、易于管理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号