首页 | 本学科首页   官方微博 | 高级检索  
     

不确定树数据库中的动态聚类算法
引用本文:郭鑫,颜一鸣,徐洪智,董坚峰.不确定树数据库中的动态聚类算法[J].小型微型计算机系统,2013,34(6).
作者姓名:郭鑫  颜一鸣  徐洪智  董坚峰
作者单位:1. 吉首大学软件服务外包学院,湖南张家界,427000
2. 吉首大学软件服务外包学院,湖南张家界427000;武汉大学信息资源研究中心,武汉430072
基金项目:湖南省教育厅科学研究项目,吉首大学校级科研计划项目
摘    要:针对现有的树聚类算法不能适应数据的动态变化和不确定性等问题,研究不确定数据的聚类问题,提出一种在不确定树数据库中的动态聚类算法,有效地解决了因数据的动态变化而导致的无法聚类的问题.首先,提出转变树集、相似分组和树类集等概念来描述一个不确定树数据库的聚类模型.其次,为了更加准确的度量子树之间的相似性,考虑到子树即具有结点语义特征,又具有结构化特性,提出了一种语义相似度计算方法与结构相似度计算方法,同时对两者赋予一定比例的权值并求和得到最终的相似度.再次,设计了一个动态聚类过程,采用自适应获取聚类阈值,较大程度上减少了人为干扰导致聚类结果不准确的影响,使得具有相似结构的子树聚集在同一个相似分组中,不同分组之间的子树相似度达到最小化,同时对每个相似分组,定义一个提取代表性子树的公式,将其作为树类组成树的类集.最后,通过模拟数据和真实环境两部分实验可以表明,算法有效可行,聚类结果较准确且具有较好的运行效率.

关 键 词:数据挖掘  有序树  频繁子树  相似度  不确定树  聚类

Dynamic Clustering Algorithm in Uncertain Tree Database
GUO Xin , YAN Yi-ming , XU Hong-zhi , DONG Jian-feng.Dynamic Clustering Algorithm in Uncertain Tree Database[J].Mini-micro Systems,2013,34(6).
Authors:GUO Xin  YAN Yi-ming  XU Hong-zhi  DONG Jian-feng
Abstract:
Keywords:data mining  ordered tree  frequent subtree  similarity  uncertain tree  cluster
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号