共查询到20条相似文献,搜索用时 109 毫秒
1.
在生物基因多序列比对过程中,早期的方法仅计算了单一的Spark集群参数,导致算法的并行效果较差。为此,设计了基于Spark云计算的生物基因多序列比对方法。基于获得的生物遗传序列数据,对其进行了优化,并通过计算不同序列间的匹配度,对生物基因多序列比对任务进行动态规划。利用Spark云计算技术,构建Spark集群,并对多个Spark集群的参数进行计算。利用多种生物基因序列之间的相似性与差异性来选择最佳的匹配路径,在此基础上,建立多个生物基因序列比对的并行计算模型,并对其进行求解,得到对应的多个序列对比对的并行算法。实验结果表明:该方法具有更好的并行性,能够有效提高多序列比对的性能。 相似文献
2.
3.
生物信息学是以计算机为工具对生物信息进行储存、检索和分析的科学。序列比对是生物信息学中的一个基本问题,设计快速而有效的序列比对算法是生物信息学研究的一个重要内容,通过序列比较可以发现生物序列中的功能、结构和进化的信息,序列比较的基本操作是比对。本文介绍了序列比对算法的发展现状,描述了常用的各类序列比对算法,并分析了它们的优劣。 相似文献
4.
5.
6.
超大规模序列比对计算的并行优化 总被引:1,自引:0,他引:1
针对生物信息学研究中的超大规模序列比对计算问题进行了研究,解决了现有的e-PCR软件包在处理小麦基因引物扩增比对任务中存在的内存瓶颈、I/O瓶颈和计算时间瓶颈问题,利用数据和任务分割的基本方法,使其最关键的引物与模板的比对计算能够大规模并行,进而采用基于主从通信模式的MPI通信框架进行编程实现,并从任务的缩减、负载平衡、容错和多作业并发等方面进行了优化,最终在百万亿次超级计算机上顺利实现了千核级大规模并行计算,在数十日内即可完成原本预期需要数年的小麦序列扩增比对计算. 相似文献
7.
多序列星比对算法在确定中心序列时需要计算任意两个输入序列的距离及分数,其较高的时间复杂度 耗费了大量时间,因此提出了通过综合计算每个序列产生的k-mers及各个k-mer在各序列中出现的次数来确定k-mers的拼接选择,由k-mers进行拼接从而 得到中心序列。进而,在双序列比对过程中采用搜索两个序列最大相似子串的思想,改进的星比对算法的精度在一定程度上得到了明显提升。接着, 将改进的星比对算法在Spark中进行并行化设计与实现。采用Spark的Yarn-Client运行模式,对正常人线粒体的多组数据进行实验,分析了算法性能上的不足及改进方向。 相似文献
8.
9.
两序列比对是一种基本序列分析方法,广泛用于序列之间的相似性分析和数据库同源性搜索。现今,用于两序列的软件有上百种,它们应用不同的算法或针对不同的序列类型,在比对速度和比对质量等方面也有很大的差异。根据要比对的序列情况以及要达到的目的选择合适的比对软件是非常有必要的。对现有两序列比对的算法和常用软件进行归类和比较,为研究人员了解现今序列比对情况,筛选合适的比对算法和软件提供参考。 相似文献
10.
基于遗传算法的一种生物序列比对方法 总被引:1,自引:0,他引:1
生物序列比对是对DNA(或RNA,蛋白质)序列,寻找和确定它们的相似部分或稳定区域.二重序列比对问题可采用动态规划方法求得其最优解;多重序列比对问题是一个NP完全的组合优化问题,有待进一步探索与研究.通过合理的编码表示,采用相应的遗传算子,设计了一种求生物序列比对的遗传算法.并对几组DNA序列进行了测试. 相似文献
11.
12.
提出一种支持权重分布数据的可伸缩分布式动态区间映射算法.该算法能够在存储节点发生变化时,根据可用的资源情况立即重新均衡数据对象分布,从所有存储节点中并行迁移数据对象,且迁移的数据对象数目是最少的.在此基础上提出分布式节点地址计算算法,支持计算节点通过视图校正算法自主学习,自动适应新的系统规模,消除了现有的集中式访问性能瓶颈,使系统具有高可伸缩性. 相似文献
13.
14.
In this paper, a new hybrid parallelisable low order algorithm, developed by the authors for multibody dynamics analysis,
is implemented numerically on a distributed memory parallel computing system. The presented implementation can currently accommodate
the general spatial motion of chain systems, but key issues for its extension to general tree and closed loop systems are
discussed. Explicit algebraic constraints are used to increase coarse grain parallelism, and to study the influence of the
dimension of system constraint load equations on the computational efficiency of the algorithm for real parallel implementation
using the Message Passing Interface (MPI). The equation formulation parallelism and linear system solution strategies which
are used to reduce communication overhead are addressed. Numerical results indicate that the algorithm is scalable, that significant
speed-up can be obtained, and that a quasi-logarithmic relation exists between time needed for a function call and numbers
of processors used. This result agrees well with theoretical performance predictions. Numerical comparisons with results obtained
from independently developed analysis codes have validated the correctness of the new hybrid parallelisable low order algorithm,
and demonstrated certain computational advantages. 相似文献
15.
针对单个JVM的性能缺陷问题,分析了实现分布式JVM的关键技术,提出了一个基于Spaces的分布式虚拟机集成模型,该模型将执行代码和数据分离,通过异步协作机制和动态装载类技术,将多个Java作业透明地调度到不同的JVM资源上并行执行,实现了单一系统映象。 相似文献
16.
JDCS:实现高性能计算的分布式计算系统 总被引:2,自引:0,他引:2
分布对象计算技术提供了充分利用现有网络资源的有效途径。JavaRMI是当前比较成熟的一种分布对象技术,它提供了使用Java对象的简单和直接的方法。该文建立基于JavaRMI方法的适用于高性能计算的分布式计算系统JDCS。在JDCS中由网络上的计算结点构成服务器池,为用户提供高性能的计算服务。实现结果表明该系统可以获得较高的加速比。 相似文献
17.
分布式异构 GIS系统集成与互操作是 GIS应用发展的趋势和方向 .在 WMS(Web Map Service)和 GML研究的基础上 ,采用 XML 技术和客户机 /服务器通用分布式计算模型 ,提出了一种基于 XML RPC的分布式 GIS计算模型 ;基于 XML- RPC模型 ,设计了分布式 GIS系统中基本 GIS操作和 GIS数据资源的 XML 抽象与表达 ;抽象出了 L og In、L og Out、Get Capability、Get Map、Get Ftr Info、Get Sel Ftrs、Get Them e Map、Get Stat Map 等 8个Geo Processing元操作 ;定义了各个元操作的 XML- RPC请求与响应的 XML 数据格式协议 ,并实现了一个简化的原型系统从而验证了该模型的技术可行性、实用性 ,为第 2代 Web GIS的产品化奠定了理论模型和技术基础 相似文献
18.
19.
ZENG Biqing CHEN Zhigang TAN Lu XIONG Ce 《通讯和计算机》2005,2(3):51-55
In order to improve the efficiency of storing files to disks and meet the demands of,high availability and scalability on distributed heterogeneous computing environment, two new file assignment strategies are proposed. One is named the available percent decision-making, and the other is the combination of subsection select and awailable percent decision-making. Experimental results show the advantages of new algorithms. 相似文献