基于树编辑距离的层次聚类算法 |
| |
作者姓名: | 乔少杰 唐常杰 陈瑜 彭京 温粉莲 |
| |
作者单位: | 四川大学,计算机学院,成都,610065;新加坡国立大学,计算机学院,新加坡,117590;四川大学,计算机学院,成都,610065;北京大学,信息科学技术学院,北京,100871 |
| |
基金项目: | 国家自然科学基金
,
中国博士后科学基金
,
四川省青年科技基金 |
| |
摘 要: | 为了识别犯罪嫌疑人伪造和篡改的虚假身份,利用树编辑距离计算个体属性相似性,证明了树编辑距离的相关数学性质,对属性应用层次编码方法,提出了一种新的基于树编辑距离的层次聚类算法HCTED(Hi-erarchical Clustering Algorithm Based on Tree Edit Distance)。新算法通过树编辑操作使用最少的代价计算属性相似性,克服了传统聚类算法标称型计算的缺陷,提高了聚类精度,通过设定阈值对给定样本聚类。实验证明了新方法在身份识别上的准确性和有效性,讨论了不同参数对实验结果的影响,对比传统聚类算法,HCTED算法性能明显提高。新算法已经应用到警用流动人口分析中,取得了良好效果。
|
关 键 词: | 树编辑距离 层次聚类 属性相似性 数据挖掘 |
修稿时间: | |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《计算机科学与探索》浏览原始摘要信息 |
|
点击此处可从《计算机科学与探索》下载全文 |
|