首页 | 本学科首页   官方微博 | 高级检索  
     

基于查询接口文本的Deep Web数据源分类
引用本文:华慧,伏玉琛,周小科.基于查询接口文本的Deep Web数据源分类[J].计算机工程,2010,36(12):66-68.
作者姓名:华慧  伏玉琛  周小科
作者单位:苏州大学计算机科学与技术学院,苏州,215006
基金项目:国家自然科学基金资助项目(60673092);2007质检公益项目科研专项基金资助项目(10-60);江苏省高校自然科学基金资助项目(07KJD520187);江苏省现代企业信息化应用支撑软件工程技术研究开发中心开放基金资助项目(SX200902)
摘    要:根据Deep Web数量的爆炸性增长特点,提出一种基于查询接口文本的Deep Web数据源分类算法,对于分类的查询接口,采用 2种方法:基于向量空间的TF-IDF方法和基于知网的语义相似度方法。综合2种方法获得接口之间的相似度。借鉴K-NN算法,提出WDB分类算法,从而实现Deep Web数据源的分类。实验结果表明,该算法在熵和F-measure 2种评价标准上均能获得较高质量,具有一定实用价值。

关 键 词:深层网  数据源分类  知网  K-NN算法  语义分类

Deep Web Data Source Classification Based on Query Interface Context
HUA Hui,FU Yu-chen,ZHOU Xiao-ke.Deep Web Data Source Classification Based on Query Interface Context[J].Computer Engineering,2010,36(12):66-68.
Authors:HUA Hui  FU Yu-chen  ZHOU Xiao-ke
Affiliation:(College of Computer, Jiangsu University, Zhenjiang 212013)
Abstract:To annotate extracted data accurately and comprehensively in Deep Web, this paper proposes an automatic semantic annotation method based on wrapper. Several annotators are combined to improve accuracy. To settle annotation incomplete problem, complementary relationship of data sources is used. A wrapper which can annotate extracted data in high efficiency is generated. Experimental result shows that the method achieves higher accuracy and efficiency.
Keywords:Deep Web  semantic annotation  synchronous annotation  wrapper
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号