首页 | 本学科首页   官方微博 | 高级检索  
     

基于K-近邻算法的Deep Web数据源的自动分类
引用本文:张智,顾韵华. 基于K-近邻算法的Deep Web数据源的自动分类[J]. 信息技术, 2011, 0(5): 108-111
作者姓名:张智  顾韵华
作者单位:南京信息工程大学计算机与软件学院,南京,210044
摘    要:针对Deep Web的查询需求,提出了一种基于K-近邻算法的Deep Web数据源的自动分类方法。该算法在对Deep Web网页进行表单特征提取及规范化的基础上,基于距离对Deep Web网页所属的目标主题进行判定。实验结果表明:基于K-近邻分类算法可以较有效地进行DeepWeb数据源的自动分类,并得到较高的查全率和查准率。

关 键 词:深网  查询接口  K近邻算法  网页分类

Automatic classification of Deep Web sources based on KNN algorithm
ZHANG Zhi,GU Yun-hua. Automatic classification of Deep Web sources based on KNN algorithm[J]. Information Technology, 2011, 0(5): 108-111
Authors:ZHANG Zhi  GU Yun-hua
Affiliation:(School of Computer and Software,Nanjing University of Information Science & Technology,Nanjing 210044,China)
Abstract:To meet the need of Deep Web query,an algorithm for classification of Deep Web sources based on KNN is put forward.The algorithm extracts the form features from Web pages,and makes the form features vector normal.Then the algorithm classifies Deep Web pages by computing distance.The experimental results show that the algorithm has improved in precision and recall.
Keywords:Deep Web  query interface  KNN  classification
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号