首页 | 本学科首页   官方微博 | 高级检索  
     

基于字典的DNA序列压缩算法研究及应用*
引用本文:林毅申,林丕源,彭宏.基于字典的DNA序列压缩算法研究及应用*[J].计算机应用研究,2007,24(6):265-267.
作者姓名:林毅申  林丕源  彭宏
作者单位:1. 华南理工大学,计算机科学与工程学院,广东,广州,510641
2. 华南农业大学,信息学院,广东,广州,510642
基金项目:国家自然科学基金 , 广东省科技攻关计划
摘    要:在现有DNA序列数据压缩算法的基础上,以DNA序列数据的存储效率及生物学解释综合考虑,设计并实现了基于字典的DNA序列压缩算法DNADCompress.算法核心包括重复子串字典建立、字典项筛选、字串压缩编码三方面.实验数据表明,数据压缩算法压缩效果达到常用DNA序列压缩算法水平,并为序列生物学解释提供了基础.

关 键 词:数据压缩  生物信息学  DNA序列数据  字典  序列压缩  算法研究  应用  Algorithm  Compression  Implementation  水平  压缩效果  数据表  实验  压缩编码  字串  筛选  心包  设计  综合  生物学解释  存储效率  压缩算法
文章编号:1001-3695(2007)06-0265-03
修稿时间:2005-12-23

Research and Implementation of Dictionary based DNA Compression Algorithm
LIN Yi shen,LIN Pi yuan,PENG Hong.Research and Implementation of Dictionary based DNA Compression Algorithm[J].Application Research of Computers,2007,24(6):265-267.
Authors:LIN Yi shen  LIN Pi yuan  PENG Hong
Abstract:With the existing DNA compression algorithms based on dictionary,a new algorithm called DNADCompress based on dictionary was proposed and it achieved a balance between the store space and biology knowledge.The core of this algorithm includes the building dictionary of repeat strings,the selecting of dictionary items and the encoding of compression strings.The advantages of this algorithm were demonstrated by its good compression ratio and its explanation to the DNA sequences in bioinformatics.
Keywords:data compression  bioinformatics  DNA sequences data
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号