首页 | 本学科首页   官方微博 | 高级检索  
     

基于码书索引变换的高通量DNA序列数据压缩算法
引用本文:谭丽,孙季丰. 基于码书索引变换的高通量DNA序列数据压缩算法[J]. 电子学报, 2015, 43(5): 1007. DOI: 10.3969/j.issn.0372-2112.2015.05.026
作者姓名:谭丽  孙季丰
作者单位:华南理工大学电子与信息学院,广东广州,510641
基金项目:国家自然科学基金青年科学基金(No .61202292);广东省自然科学基金
摘    要:提出一种高通量DNA序列数据的压缩算法。该算法先采用码书索引变换模型,将传统码书索引值的表示方法变换成由四个标准碱基字符替代的四进制数值方式,并采用一种界定替换串与非替换串的简明编码方法,接着通过信息熵的大小来决定是否进行块排序压缩变换(BWT ),最后进行前移编码变换和Huffman熵编码。在多种测序数据集上的实验结果表明,CITD在大多数情况下可以获得比本文所对比的高通量DNA专用压缩方法更优的压缩性能。

关 键 词:高通量DNA序列  码书索引变换模型  块排序压缩变换  前移编码  信息熵  数据压缩算法
收稿时间:2014-01-07

High-Throughput DNA Sequence Data Compression Method Based on Codebook Index Transformation
TAN Li,SUN Ji-feng. High-Throughput DNA Sequence Data Compression Method Based on Codebook Index Transformation[J]. Acta Electronica Sinica, 2015, 43(5): 1007. DOI: 10.3969/j.issn.0372-2112.2015.05.026
Authors:TAN Li  SUN Ji-feng
Abstract:
Keywords:high-throughput DNA sequence  codebook index transformation (CIT )model  burrow wheeler transfarmation (BWT)  move to front(MTF)  information entropy  data compression algorithm
本文献已被 万方数据 等数据库收录!
点击此处可从《电子学报》浏览原始摘要信息
点击此处可从《电子学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号