首页 | 本学科首页   官方微博 | 高级检索  
     

基于整体和局部相似性的序列聚类算法
引用本文:戴东波,汤春蕾,熊赟.基于整体和局部相似性的序列聚类算法[J].软件学报,2010,21(4):702-717.
作者姓名:戴东波  汤春蕾  熊赟
作者单位:复旦大学,计算机科学技术学院,上海,200433
基金项目:Supported by the National High-Tech Research and Development Plan of China under Grant No.2006AA02Z329 (国家高技术研究发展计划(863))
摘    要:现有的很多序列聚类算法是基于“局部特征可以表征整个序列”的假设来进行的,即不区分实际应用中序列的整体相似性和局部相似性.这对存在保守子模式的序列,如DNA和蛋白质序列是适用的,但对一些注重整体序列相似性的应用领域,如:在交易数据库中用户购买行为的比较,时间序列数据中全局模式的匹配等,由于难以产生频繁子模式,用基于全局相似性的度量方法进行聚类显得更为合理.此外,在基于局部相似性的序列聚类算法中,选取的局部子模式表征序列的能力也有待进一步提高.由此,针对不同应用领域,分别提出基于整体相似性的序列聚类算法GSClu和基于局部相似性的序列聚类算法LSClu.GSClu和LSClu分别利用带剪枝策略的二分k均值算法和基于有gap约束的强区分度子模式方法对各自领域的序列数据进行聚类.实验采用交易序列数据和蛋白质序列数据,实验结果表明,GSClu和LSClu对各自领域的序列数据具有较快的处理速度和良好的聚类质量.

关 键 词:序列数据  相似性  聚类
收稿时间:7/9/2008 12:00:00 AM
修稿时间:2009/2/24 0:00:00

Sequence Clustering Algorithms Based on Global and Local Similarity
DAI Dong-Bo,TANG Chun-Lei and XIONG Yun.Sequence Clustering Algorithms Based on Global and Local Similarity[J].Journal of Software,2010,21(4):702-717.
Authors:DAI Dong-Bo  TANG Chun-Lei and XIONG Yun
Affiliation:DAI Dong-Bo,TANG Chun-Lei,XIONG Yun (School of Computer Science , Technology,Fudan University,Shanghai 200433,China)
Abstract:
Keywords:sequence data  similarity  clustering
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号