首页 | 本学科首页   官方微博 | 高级检索  
     

基于平均交互信息量的DNA序列相似性分析
引用本文:詹青,王亚东. 基于平均交互信息量的DNA序列相似性分析[J]. 电脑学习, 2011, 1(4)
作者姓名:詹青  王亚东
作者单位:哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001
摘    要:序列相似性分析是生物信息学中一个重要问题,对于研究物种的进化起源有着重要的意义.序列相似性算法包括基于序列比对的方法及非比对方法两种.基于比对的方法对于序列整体的衡量略有欠缺;非比对算法中有DNA曲线化方法以及比较序列各自整体碱基分布间的信息量差异的方法,只是考虑了序列整体信息间的差异,但未考虑序列各个位点间的差异.因此,提出了一种基于信息熵的相似性度量模型,把序列比对与信息量差异结合起来,将两条比对后的序列间的平均交互信息量与其联合熵之比作为两条序列的相似性度量.使用该度量构建了11个物种的相似性矩阵,对各物种间的相似性进行了分析,结果在一定程度上与生物分类学相契合.通过距离矩阵所构建的进化树,也反映了各物种间的进化关系,表明该模型的设计具有合理性.

关 键 词:生物信息学  DNA序列相似性  信息熵  平均交互信息量  进化树

Similarity Analysis of DNA Sequences based on Average Mutual Information
ZHAN Qing,WANG Yadong. Similarity Analysis of DNA Sequences based on Average Mutual Information[J]. Computer Study, 2011, 1(4)
Authors:ZHAN Qing  WANG Yadong
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号