首页 | 本学科首页   官方微博 | 高级检索  
     

基于DBSACN聚类算法的XML文档聚类
引用本文:张鑫. 基于DBSACN聚类算法的XML文档聚类[J]. 电子测试, 2017, 0(15). DOI: 10.3969/j.issn.1000-8519.2017.15.036
作者姓名:张鑫
作者单位:江南机电设计研究所,贵州贵阳,550000
摘    要:为了满足对XML文档集合进行数据挖掘需求,本文提出了根据XML文档树的语义信息和结构信息来计算其结构相似度,通过结构相似度构造其结构相似度矩阵,在此基础上应用DBSCAN算法来对XML文档集合进行聚类.与其他聚类算法相比,其聚类的速度得到了很大的提高.

关 键 词:XML文档  文档聚类  DBCSAN聚类算法  结构相似度

XML document clustering based on the DBSACN clustering algorithm
Zhang Xin. XML document clustering based on the DBSACN clustering algorithm[J]. Electronic Test, 2017, 0(15). DOI: 10.3969/j.issn.1000-8519.2017.15.036
Authors:Zhang Xin
Abstract:In order to meet the demand for data mining to the XML document collection, is proposed in this paper, based on the semantic information and structure of the XML document tree information to calculate the structural similarity, the structural similarity matrix, the structural similarity based on the DBSCAN algorithm, is applied to clustering XML document collection. Compared with other clustering algorithms, the speed of clustering is greatly improved.
Keywords:XML documents  Document clustering  DBCSAN clustering algorithm  Structural similarity
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号