首页 | 本学科首页   官方微博 | 高级检索  
     

生物序列模体的混合Gibbs抽样识别算法
引用本文:刘立芳,霍红卫,王宝树.生物序列模体的混合Gibbs抽样识别算法[J].电子学报,2008,36(4):750-755.
作者姓名:刘立芳  霍红卫  王宝树
作者单位:西安电子科技大学计算机学院,陕西西安 710071
基金项目:国家自然科学基金,陕西省自然科学基金
摘    要:针对生物序列模体的识别问题,提出了一个新的混合Gibbs抽样识别算法.算法基于混合模体模型学习,采用贪心策略,通过似然度最大化,逐次将新的模体加入到混合模型中.算法中设计了位点抽样和模体抽样两种抽样方法,这两种抽样方法交替进行.为了加速搜索过程,对输入数据集采用了基于kd-trees的分层划分策略.实验结果表明,该算法对序列家族大量模体特征的识别具有显著优势,并且可建立更具统计特征的模体模型,从而提高序列分类的准确性.

关 键 词:生物信息学  模体识别  Gibbs抽样  混合模体模型  
文章编号:0372-2112(2008)04-0750-06
收稿时间:2005-08-16
修稿时间:2005年8月16日

Multiple Motif Discovery in Biological Sequences by Mixture Gibbs Sampling
LIU Li-fang,HUO Hong-wei,WANG Bao-shu.Multiple Motif Discovery in Biological Sequences by Mixture Gibbs Sampling[J].Acta Electronica Sinica,2008,36(4):750-755.
Authors:LIU Li-fang  HUO Hong-wei  WANG Bao-shu
Affiliation:School of Computer Science and Technology,Xidian University,Xi’an,Shaanxi 710071,China
Abstract:For the motif discovery problem of biological sequences,a mixture Gibbs sampling algorithm is presented.Based on mixture motifs model learning through likelihood maximization,a greedy strategy that adds sequentially new motif to a mixture model is employed.Two sampling methods are designed,site sampling and motif sampling,the two sampling methods are applied by turns.In order to speed up the searching procedure,a hierarchical partitioning scheme based on kd-trees is used for partitioning the input dataset.E...
Keywords:bioinformatics  motif discovery  Gibbs sampling  mixture motifs model  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《电子学报》浏览原始摘要信息
点击此处可从《电子学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号