首页 | 本学科首页   官方微博 | 高级检索  
     

多序列星比对算法的改进及其在Spark中的并行化研究
引用本文:董改芳,付学良,李宏慧.多序列星比对算法的改进及其在Spark中的并行化研究[J].计算机科学,2017,44(10):55-58, 84.
作者姓名:董改芳  付学良  李宏慧
作者单位:内蒙古农业大学计算机与信息工程学院 呼和浩特010018,内蒙古农业大学计算机与信息工程学院 呼和浩特010018,内蒙古农业大学计算机与信息工程学院 呼和浩特010018
基金项目:本文受国家自然科学基金(61063004,61363006),内蒙古自然科学基金(2015MS0605,2015MS0626,2015MS0627),内蒙古教育厅高校研究项目(NJZC059),教育部留学人员基金([2014]1685),内蒙古自治区科技计划项目:穿透降水量GSM网络在线监测与数据传输系统的研制资助
摘    要:多序列星比对算法在确定中心序列时需要计算任意两个输入序列的距离及分数,其较高的时间复杂度 耗费了大量时间,因此提出了通过综合计算每个序列产生的k-mers及各个k-mer在各序列中出现的次数来确定k-mers的拼接选择,由k-mers进行拼接从而 得到中心序列。进而,在双序列比对过程中采用搜索两个序列最大相似子串的思想,改进的星比对算法的精度在一定程度上得到了明显提升。接着, 将改进的星比对算法在Spark中进行并行化设计与实现。采用Spark的Yarn-Client运行模式,对正常人线粒体的多组数据进行实验,分析了算法性能上的不足及改进方向。

关 键 词:多序列比对  星比对算法  K-mer  Spark  RDD
收稿时间:2017/7/5 0:00:00
修稿时间:2017/8/15 0:00:00

Improvement of Multiple Sequence Center Star Method and Its Parallelization in Spark
DONG Gai-fang,FU Xue-liang and LI Hong-hui.Improvement of Multiple Sequence Center Star Method and Its Parallelization in Spark[J].Computer Science,2017,44(10):55-58, 84.
Authors:DONG Gai-fang  FU Xue-liang and LI Hong-hui
Affiliation:College of Computer and Information Engineering,Inner Mongolia Agricultural University,Hohhot 010018,China,College of Computer and Information Engineering,Inner Mongolia Agricultural University,Hohhot 010018,China and College of Computer and Information Engineering,Inner Mongolia Agricultural University,Hohhot 010018,China
Abstract:
Keywords:Multiple sequence alignment  Center star method  K-mer  Spark  RDD
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号