一种基于位置信息的高效DNA序列挖掘算法 AN EFFICIENT POSITION-BASED DNA SEQUENCE MINING ALGORITHM期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

一种基于位置信息的高效DNA序列挖掘算法

作者单位：	;1.中央财经大学信息学院

摘要：	类Apriori算法在产生频繁模式时需要多次扫描数据库,并且产生大量的候选集;Free Span和Prefix Span等基于投影数据库的算法在产生频繁模式时会产生大量的投影数据库,占用很多内存空间,这些都造成了很大的冗余。针对以往序列挖掘算法存在的不足,提出一种高效的序列挖掘算法——基于位置信息的序列挖掘算法PBSMA(Position-Based Sequence Mining Algorithm)。PBSMA算法通过记录频繁子序列的位置信息来减少对数据库的扫描,利用位置信息逐渐扩大频繁模式的长度,并且借鉴关联矩阵的思想和Prefix Span算法中前缀的概念,深度优先去寻找更长的关键模式。实验结果证明,无论在时间还是空间上,PBSMA算法都比Prefix Span算法更高效。
关键词：	序列挖掘 DNA序列位置信息关联矩阵前缀
AN EFFICIENT POSITION-BASED DNA SEQUENCE MINING ALGORITHM

Abstract:

Keywords: