首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
在生物基因多序列比对过程中,早期的方法仅计算了单一的Spark集群参数,导致算法的并行效果较差。为此,设计了基于Spark云计算的生物基因多序列比对方法。基于获得的生物遗传序列数据,对其进行了优化,并通过计算不同序列间的匹配度,对生物基因多序列比对任务进行动态规划。利用Spark云计算技术,构建Spark集群,并对多个Spark集群的参数进行计算。利用多种生物基因序列之间的相似性与差异性来选择最佳的匹配路径,在此基础上,建立多个生物基因序列比对的并行计算模型,并对其进行求解,得到对应的多个序列对比对的并行算法。实验结果表明:该方法具有更好的并行性,能够有效提高多序列比对的性能。  相似文献   

2.
3.
生物信息学是以计算机为工具对生物信息进行储存、检索和分析的科学。序列比对是生物信息学中的一个基本问题,设计快速而有效的序列比对算法是生物信息学研究的一个重要内容,通过序列比较可以发现生物序列中的功能、结构和进化的信息,序列比较的基本操作是比对。本文介绍了序列比对算法的发展现状,描述了常用的各类序列比对算法,并分析了它们的优劣。  相似文献   

4.
5.
在介绍生物信息学中多序列比对定义和原理的基础上,给出了序列结构信息集的表示形式和基于序列结构信息的度量函数,该函数只与参加比对序列自身信息有关,不受主观因素的影响,能更客观、有效地反映生物序列之间的进化距离.通过利用该函数计算序列间的进化距离,在渐进比对的基础上,采用迭代策略,不断修正指导树,进而提高比对的准确性,避免了局部最优问题.最后,通过实验模拟,本算法在保证不提高计算时间复杂度的基础上,提高了序列比对的准确性,同时也很好地反映了生物学意义.  相似文献   

6.
超大规模序列比对计算的并行优化   总被引:1,自引:0,他引:1  
针对生物信息学研究中的超大规模序列比对计算问题进行了研究,解决了现有的e-PCR软件包在处理小麦基因引物扩增比对任务中存在的内存瓶颈、I/O瓶颈和计算时间瓶颈问题,利用数据和任务分割的基本方法,使其最关键的引物与模板的比对计算能够大规模并行,进而采用基于主从通信模式的MPI通信框架进行编程实现,并从任务的缩减、负载平衡、容错和多作业并发等方面进行了优化,最终在百万亿次超级计算机上顺利实现了千核级大规模并行计算,在数十日内即可完成原本预期需要数年的小麦序列扩增比对计算.  相似文献   

7.
董改芳  付学良  李宏慧 《计算机科学》2017,44(10):55-58, 84
多序列星比对算法在确定中心序列时需要计算任意两个输入序列的距离及分数,其较高的时间复杂度 耗费了大量时间,因此提出了通过综合计算每个序列产生的k-mers及各个k-mer在各序列中出现的次数来确定k-mers的拼接选择,由k-mers进行拼接从而 得到中心序列。进而,在双序列比对过程中采用搜索两个序列最大相似子串的思想,改进的星比对算法的精度在一定程度上得到了明显提升。接着, 将改进的星比对算法在Spark中进行并行化设计与实现。采用Spark的Yarn-Client运行模式,对正常人线粒体的多组数据进行实验,分析了算法性能上的不足及改进方向。  相似文献   

8.
两序列比对是一种基本序列分析方法,广泛用于序列之间的相似性分析和数据库同源性搜索。现今,用于两序列的软件有上百种,它们应用不同的算法或针对不同的序列类型,在比对速度和比对质量等方面也有很大的差异。根据要比对的序列情况以及要达到的目的选择合适的比对软件是非常有必要的。对现有两序列比对的算法和常用软件进行归类和比较,为研究人员了解现今序列比对情况,筛选合适的比对算法和软件提供参考。  相似文献   

9.
基于遗传算法与星比对的多序列比对混合算法   总被引:1,自引:0,他引:1  
胡桂武  郑启伦  彭宏 《计算机应用》2004,24(5):90-91,112
多序列比对(MSA)是一个典型的NP完全问题,星比对是一种有效的多序列比对算法。文章针对MSA问题提出了将遗传算法与星比对算法结合在一起的混合算法,该算法充分发挥了遗传算法和星比对算法的优越性,可提高求解MSA问题的计算精度和计算速度,整个算法模拟了自然界进化的周期性,较好的解决了群体的多样性和收敛深度的矛盾。实验表明,该算法是有效的。  相似文献   

10.
基于遗传算法的一种生物序列比对方法   总被引:1,自引:0,他引:1  
敖友云  迟洪钦 《计算机工程与设计》2006,27(19):3647-3648,3651
生物序列比对是对DNA(或RNA,蛋白质)序列,寻找和确定它们的相似部分或稳定区域.二重序列比对问题可采用动态规划方法求得其最优解;多重序列比对问题是一个NP完全的组合优化问题,有待进一步探索与研究.通过合理的编码表示,采用相应的遗传算子,设计了一种求生物序列比对的遗传算法.并对几组DNA序列进行了测试.  相似文献   

11.
月度机组组合是电力系统运行方式安排的重要内容。随着电网规模的不断扩大,月度机组组合计算规模快速增加。传统的月度机组组合计算方法在计算效率上已不能满足当前系统要求。为此,介绍了分布式计算基本概念,提出了一种基于混合维度粒子群算法的分布式计算方法。根据月度机组组合模型实际,设计了面向月度机组组合问题的分布式高效计算方法,通过将传统串行计算转换为并行计算,提升了整体计算效率。最后基于某电网实际构造算例,验证了本文所提出方法的有效性。  相似文献   

12.
刘仲  周兴铭 《计算机学报》2006,29(10):1757-1763
提出一种支持权重分布数据的可伸缩分布式动态区间映射算法.该算法能够在存储节点发生变化时,根据可用的资源情况立即重新均衡数据对象分布,从所有存储节点中并行迁移数据对象,且迁移的数据对象数目是最少的.在此基础上提出分布式节点地址计算算法,支持计算节点通过视图校正算法自主学习,自动适应新的系统规模,消除了现有的集中式访问性能瓶颈,使系统具有高可伸缩性.  相似文献   

13.
TDCE:基于Tspaces的分布并行计算系统   总被引:1,自引:0,他引:1       下载免费PDF全文
Tspaces是一种新型的网络中间件。它为网络环境中各进程提供一种强大的共享存储机制来处理相互之间通信和同步。在Tspaces的基础上,构造了一个用于群机环境的并行计算系统TDCE。TDCE支持SPMD模式的并行程序,实验结果表明TDCE能以较小的系统配置和管理开销构建分布式计算平台,为并行程序的开发运行提供有效的支持,给出了系统MPI的对比测试结果并作了分析。  相似文献   

14.
In this paper, a new hybrid parallelisable low order algorithm, developed by the authors for multibody dynamics analysis, is implemented numerically on a distributed memory parallel computing system. The presented implementation can currently accommodate the general spatial motion of chain systems, but key issues for its extension to general tree and closed loop systems are discussed. Explicit algebraic constraints are used to increase coarse grain parallelism, and to study the influence of the dimension of system constraint load equations on the computational efficiency of the algorithm for real parallel implementation using the Message Passing Interface (MPI). The equation formulation parallelism and linear system solution strategies which are used to reduce communication overhead are addressed. Numerical results indicate that the algorithm is scalable, that significant speed-up can be obtained, and that a quasi-logarithmic relation exists between time needed for a function call and numbers of processors used. This result agrees well with theoretical performance predictions. Numerical comparisons with results obtained from independently developed analysis codes have validated the correctness of the new hybrid parallelisable low order algorithm, and demonstrated certain computational advantages.  相似文献   

15.
针对单个JVM的性能缺陷问题,分析了实现分布式JVM的关键技术,提出了一个基于Spaces的分布式虚拟机集成模型,该模型将执行代码和数据分离,通过异步协作机制和动态装载类技术,将多个Java作业透明地调度到不同的JVM资源上并行执行,实现了单一系统映象。  相似文献   

16.
JDCS:实现高性能计算的分布式计算系统   总被引:2,自引:0,他引:2  
分布对象计算技术提供了充分利用现有网络资源的有效途径。JavaRMI是当前比较成熟的一种分布对象技术,它提供了使用Java对象的简单和直接的方法。该文建立基于JavaRMI方法的适用于高性能计算的分布式计算系统JDCS。在JDCS中由网络上的计算结点构成服务器池,为用户提供高性能的计算服务。实现结果表明该系统可以获得较高的加速比。  相似文献   

17.
In order to improve the efficiency of storing files to disks and meet the demands of,high availability and scalability on distributed heterogeneous computing environment, two new file assignment strategies are proposed. One is named the available percent decision-making, and the other is the combination of subsection select and awailable percent decision-making. Experimental results show the advantages of new algorithms.  相似文献   

18.
基于XML—RPC的分布式地理信息系统计算模型   总被引:4,自引:0,他引:4       下载免费PDF全文
分布式异构 GIS系统集成与互操作是 GIS应用发展的趋势和方向 .在 WMS(Web Map Service)和 GML研究的基础上 ,采用 XML 技术和客户机 /服务器通用分布式计算模型 ,提出了一种基于 XML RPC的分布式 GIS计算模型 ;基于 XML- RPC模型 ,设计了分布式 GIS系统中基本 GIS操作和 GIS数据资源的 XML 抽象与表达 ;抽象出了 L og In、L og Out、Get Capability、Get Map、Get Ftr Info、Get Sel Ftrs、Get Them e Map、Get Stat Map 等 8个Geo Processing元操作 ;定义了各个元操作的 XML- RPC请求与响应的 XML 数据格式协议 ,并实现了一个简化的原型系统从而验证了该模型的技术可行性、实用性 ,为第 2代 Web GIS的产品化奠定了理论模型和技术基础  相似文献   

19.
刘杰  吴强  赵全伟 《计算机工程》2012,38(3):276-279,283
为消除重构时间对可重构计算系统性能的影响,针对多重构模块,提出一种基于动态部分可重构技术的顺序型应用程序模块映射算法。利用动态可重构技术的高效性和灵活性,通过隐藏重构时间,达到减少程序执行时间和提高系统性能的目的。基于JPEG编码测试实例的实验结果表明,运用该算法实现的模块映射方案其程序执行速度是软件实现方式的3.31倍,是硬件方式的2.59倍。  相似文献   

20.
网格计算为用户处理很多复杂问题提供了新方法,用网格实现大规模分布并行计算是必然的趋势。文章给出了基于网格中间件Globus Toolkit来实现分布并行计算的两种策略:紧密耦合并行程序和松散耦台并行服务,并给出实现这两种策略的实现方法,为实现分布并行计算提供了新方法。最后根据所提出的并行计算策略,在网格计算环境下实现了一个分布并行计算实例,并给出了相应的试验结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号