首页 | 本学科首页   官方微博 | 高级检索  
     

基于相邻模式段组合的生物序列模式挖掘算法
引用本文:王淼,尚学群,薛贺.基于相邻模式段组合的生物序列模式挖掘算法[J].计算机工程与应用,2008,44(2):190-193.
作者姓名:王淼  尚学群  薛贺
作者单位:西北工业大学 计算机学院,西安 710072
基金项目:西北工业大学研究生创新实验室资助
摘    要:传统的序列模式挖掘算法应用在生物序列上有其局限性,根据生物序列的特点,提出了基于相邻频繁模式段的模式挖掘算法-JPS。首先产生相邻频繁模式段,然后对这些频繁模式段进行组合,产生新的频繁模式。通过实验分析,该方法在相似性很强的序列数据库中比传统的PrefixSpan算法效率高。通过对真实的蛋白质序列家族库的处理,证明该算法能有效处理生物序列数据。

关 键 词:前缀  频繁集  相邻频繁模式段  模式组合  
文章编号:1002-8331(2008)02-0190-04
收稿时间:2007-06
修稿时间:2007年6月1日

Joined pattern segment-based sequential patternmining algorithm for biological datasets
WANG Miao,SHANG Xue-qun,XUE He.Joined pattern segment-based sequential patternmining algorithm for biological datasets[J].Computer Engineering and Applications,2008,44(2):190-193.
Authors:WANG Miao  SHANG Xue-qun  XUE He
Affiliation:School of Computer,Northwestern Polytechnical University,Xi’an 710072,China
Abstract:Traditional algorithms for sequential pattern mining have limits when dealing with biological datasets.Biology sequence has its own characters.Based on these characters,the author develops Joined frequent Pattern Segment approach,JPS,for mining biological sequences.First,the joined frequent pattern segments are produced.Then,longer frequent patterns can be obtained by combining the above segments.The experiment shows JPS has better performance than PrefixSpan.Through dealing with the real protein family database,it is proved that the algorithm can deal with biology sequence data efficiently.
Keywords:prefix  frequent set  joined frequent pattern segment  pattern combination
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号