首页 | 本学科首页   官方微博 | 高级检索  
     

可拓K近邻算法在数据聚类分析中的应用
引用本文:杨仪,向长城,魏代俊. 可拓K近邻算法在数据聚类分析中的应用[J]. 计算机工程与应用, 2010, 46(21): 156-159. DOI: 10.3778/j.issn.1002-8331.2010.21.044
作者姓名:杨仪  向长城  魏代俊
作者单位:湖北民族学院,理学院,湖北,恩施,445000
基金项目:湖北省教育厅青年基金,湖北民族学院博士基金,湖北民族学院青年基金 
摘    要:针对区间值数据的数据聚类问题,根据可拓学关联函数的定义,提出可拓距离的概念来度量数据之间的距离,利用K近邻的思想,根据可拓距离的大小对数据集的目标属性进行投票选择进行分类,设计了可拓K近邻算法(Extension K Nearest Neighbor,EKNN)。最后利用UCI的两个基准数据集Iris植物样本数据和糖尿病数据库PIDD进行验证,首先通过免疫网络约简算法对条件属性进行最小属性约简,然后利用EKNN算法分析和比较不同最小约简属性下的分类准确率。

关 键 词:数据聚类  可拓距离  可拓K近邻算法  属性约简
收稿时间:2009-01-06
修稿时间:2009-3-23 

Data cluster based on extension K nearest neighbor algorithm
YANG Yi,XIANG Chang-cheng,WEI Dai-jun. Data cluster based on extension K nearest neighbor algorithm[J]. Computer Engineering and Applications, 2010, 46(21): 156-159. DOI: 10.3778/j.issn.1002-8331.2010.21.044
Authors:YANG Yi  XIANG Chang-cheng  WEI Dai-jun
Affiliation:(College of Science,Hubei University for Nationalities,Enshi,Hubei 445000,China)
Abstract:For the data cluster problem of interval data,the extension distance is proposed by extension conjunction function. The Extension K Nearest Neighbor(EKNN) algorithm is designed by the idea of K nearest neighbor and extension distance. Finally,the experiment of Iris datasets and PIDD datasets is verified by the EKNN,and the classification accuracy is analysed and compared under the different minimal reduction attribute.
Keywords:data cluster  extension distance  extension K nearest neighbor  attribute reduction
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号