首页 | 本学科首页   官方微博 | 高级检索  
     

基于CUDA的生物序列数据算术编码并行压缩
作者单位:;1.上海大学计算机工程与科学学院;2.上海众恒信息产业股份有限公司
摘    要:随着下一代生物序列测序技术的发展,大文件生物序列数据越来越常见。虽然压缩序列数据能减少数据存储空间,但是传统的数据压缩的方法很难快速完成大规模的序列压缩,因此如何缩短数据压缩时间是当前压缩技术研究的一个重要方向。采用CUDA技术实现算术编码,分析核苷酸生物序列数据特性,给出不同物种及数据库生物序列数据集中核苷酸的分布概率,提出并比较三种并行压缩方法,指出先验概率的并行压缩方法具有更好的压缩性能。实验结果表明,先验概率的并行压缩方法不仅具有较高的时间效率,而且也能保持较高的数据压缩率,能较好地解决大规模生物序列文件的高效快速压缩问题。

关 键 词:算术编码  生物序列  数据压缩  CUDA

PARALLEL COMPRESSION FOR ARITHMETIC CODING OF BIOLOGICAL SEQUENTIAL DATA BASED ON CUDA
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号