首页 | 本学科首页   官方微博 | 高级检索  
     

基于树编辑距离的层次聚类算法
作者姓名:乔少杰  唐常杰  陈瑜  彭京  温粉莲
作者单位:四川大学,计算机学院,成都,610065;新加坡国立大学,计算机学院,新加坡,117590;四川大学,计算机学院,成都,610065;北京大学,信息科学技术学院,北京,100871
基金项目:国家自然科学基金 , 中国博士后科学基金 , 四川省青年科技基金
摘    要:为了识别犯罪嫌疑人伪造和篡改的虚假身份,利用树编辑距离计算个体属性相似性,证明了树编辑距离的相关数学性质,对属性应用层次编码方法,提出了一种新的基于树编辑距离的层次聚类算法HCTED(Hi-erarchical Clustering Algorithm Based on Tree Edit Distance)。新算法通过树编辑操作使用最少的代价计算属性相似性,克服了传统聚类算法标称型计算的缺陷,提高了聚类精度,通过设定阈值对给定样本聚类。实验证明了新方法在身份识别上的准确性和有效性,讨论了不同参数对实验结果的影响,对比传统聚类算法,HCTED算法性能明显提高。新算法已经应用到警用流动人口分析中,取得了良好效果。

关 键 词:树编辑距离  层次聚类  属性相似性  数据挖掘
修稿时间: 
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机科学与探索》浏览原始摘要信息
点击此处可从《计算机科学与探索》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号