基于相似度计算公式改进的K-中心点算法 |
| |
作者姓名: | 韩冰 姜合 |
| |
作者单位: | 齐鲁工业大学(山东省科学院)计算机科学与技术学院,山东 济南,250353;齐鲁工业大学(山东省科学院)计算机科学与技术学院,山东 济南,250353 |
| |
基金项目: | 山东省自然科学基金资助项目(ZR2012FM032) |
| |
摘 要: | 在传统K-中心点聚类算法中,相似性一般仅仅用距离来进行度量,这种度量方法均基于对象属性之间是独立同分布的,但大多数真实数据对象属性之间都相关联的,因此,本文将引用非独立同分布计算公式,对传统距离计算相似度方法进行替换。同时,由于此公式会依据属性值的频率来进行计算,但数值型数据对于频率并不敏感,因此,本文在引入公式之前,将数值型数据按属性列进行聚类与替换。实验结果表明,本文方法可以提高算法的聚类精度。
|
关 键 词: | 聚类 PAM算法 相似度 |
收稿时间: | 2019-05-14 |
本文献已被 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机与现代化》浏览原始摘要信息 |
|
点击此处可从《计算机与现代化》下载全文 |
|