WEKA数据挖掘平台及其二次开发 |
| |
作者姓名: | 陈慧萍 林莉莉 王建东 苗新蕊 |
| |
作者单位: | 1.河海大学 计算机信息工程学院,江苏 常州 213022 2.南京航空航天大学 信息学院,南京 210016 |
| |
基金项目: | 国家重点基础研究发展计划(973计划) |
| |
摘 要: | 在开源数据挖掘平台WEKA上进行了挖掘测试和分析;并分析了其存在的主要问题。为了克服WEKA系统在聚类方面的薄弱性;在WEKA的开源环境下进行二次开发;扩充了聚类算法。介绍了将k-中心点轮换算法嵌入到WEKA平台的过程;充分利用了开源WEKA中的类和可视化功能;并对嵌入的算法和原有聚类算法进行了对比分析。该算法改进了传统的k-中心点算法;避免陷入局部最优;而且它对初始点不太敏感;可以获取更好的聚类效果。
|
关 键 词: | 数据挖掘 WEKA平台 聚类 k-中心点轮换算法 |
收稿时间: | 2007-09-03 |
修稿时间: | 2008-2-22
|
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《计算机工程与应用》浏览原始摘要信息 |
|
点击此处可从《计算机工程与应用》下载全文 |
|