首页 | 本学科首页   官方微博 | 高级检索  
     

基于语义距离的K-最近邻分类方法
作者姓名:杨立  左春  王裕国
作者单位:中国科学院,软件研究所,北京,100080;中国科学院,研究生院,北京,100049;中国科学院,软件研究所,北京,100080
基金项目:Supported bythe National High-Tech Research and Development Plan of China under Grant No.2003AA112050(国家高技术研究发展计划(863));the Key Science-Technology Project of the National'Tenth Five-Year-Plan'of China under Grant No.2001BA102A05-02(国家"十五"科技攻关计划)
摘    要:最近邻分类方法中对距离机制的研究大都集中在根据何种计算方法将不同属性取值的差异集中起来,而未考虑到同一属性间取值的语义差异所带来的影响;而且传统算法的分类准确率对于不同抽象层次描述的数据集带来的数据不完整性相当敏感.针对这两个问题,提出一种基于语义距离的最近邻分类方法SDkNN(semantic distance based k-nearest neighbor).该方法分析了同一属性内取值的语义差异,说明了如何基于领域本体计算语义距离,并将其应用到kNN算法中.经过在UCI数据集以及实际应用数据集中验证,SDkNN的整体性能要优于传统方法,在数据不完整的情况下效果更为明显,实践证明,SDkNN有较好的应用价值.

关 键 词:本体  语义距离  最近邻  分类
文章编号:1000-9825/2005/16(12)2054
收稿时间:2004-04-09
修稿时间:2005-01-24
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号