首页 | 本学科首页   官方微博 | 高级检索  
     

频繁子图挖掘算法gSpan的设计与实现
引用本文:郭玉林,刘勇.频繁子图挖掘算法gSpan的设计与实现[J].电脑学习,2011,1(5).
作者姓名:郭玉林  刘勇
作者单位:黑龙江大学计算机科学技术学院,哈尔滨,150080
基金项目:国家自然科学基金资助项目(60973081); 黑龙江省自然科学基金项目(F201011); 黑龙江省教育厅科学技术研究面上项目(11551352,12511401)
摘    要:由于大部分图挖掘算法都需要利用频繁子图,频繁子图挖掘逐渐成为了数据挖掘领域中的热点研究内容。目前,很多高效的频繁子图挖掘算法已经被提出。其中,gSpan算法是目前公认的最好的频繁子图挖掘算法。然而,在化合物数据集上,还可以利用化合物的特殊结构进一步优化gSpan算法的性能。文献利用了化合物分子结构的对称性和原子类型分布的不均衡性,提出了一些新的优化策略,进一步改进了gSpan的性能。鉴于gSpan算法在图挖掘领域乃至整个数据挖掘领域的重要性,设计并实现gSpan算法。同时,采用文献4]中的优化策略,进一步提高gSpan算法在化合物数据集上的运行效率。

关 键 词:gSpan  频繁子图  DFS编码  词典序  

Design and Implementation of A Frequent Subgraph Mining Algorithm gSpan
GUO Yulin,LIU Yong.Design and Implementation of A Frequent Subgraph Mining Algorithm gSpan[J].Computer Study,2011,1(5).
Authors:GUO Yulin  LIU Yong
Affiliation:GUO Yulin,LIU Yong(School of computer science and technology,Hei Longjiang University,Harbin 150080,China)
Abstract:Since most of the graph mining algorithms are needed to make frequent subgraph,frequent subgraph mining is gradually becoming the hot spot in the field of research.At present,many efficient frequent subgraph mining algorithms have been proposed.Among them,gSpan algorithm is currently accepted as the best frequent subgraph mining algorithm.However,in the compound datasets,the performance of gSpan algorithm based on the special structure could be further optimized.The paper uses the symetry of the molecular s...
Keywords:gSpan  Frequent Subgraphs  DFS Code  Dictionary Order  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号