首页 | 本学科首页   官方微博 | 高级检索  
     

基于搜索引擎的Deep Web数据源发现技术
引用本文:李文骏,;崔志明.基于搜索引擎的Deep Web数据源发现技术[J].微机发展,2008(8):58-60.
作者姓名:李文骏  ;崔志明
作者单位:苏州大学智能信息处理及应用研究所 江苏苏州215006
基金项目:网家自然科学基金项目(60673092);2005年度教育部科研重点项目(205059);教育部“高校博士学科点科研基金项目”(20040285016);江苏省高技术研究计划项目(BG2005019)
摘    要:随着Web数据库的广泛应用,Web正在不断“深化”。传统搜索引擎只能检索浅层网络,却不能直接索引到深层网络(Deep Web)的资源。为了有效地利用Deep Web资源,必须要对Deep Web数据进行大规模集成。其中,数据源发现是整合Deep Web资源的首要工作,能否高效地发现Deep Web站点是Deep Web数据获取的关键。提出了一种基于传统搜索引擎的Deep Web数据源发现方法,该方法通过分析返回结果来扩展查询,从而进一步提高了数据源发现的效率。实验证明该方法能得到较好的结果。

关 键 词:搜索引擎  Deep  Web  网页表单  查询扩展

Deep Web Source Discovery Based on Search Engine
LI Wen-jun,CUI Zhi-ming.Deep Web Source Discovery Based on Search Engine[J].Microcomputer Development,2008(8):58-60.
Authors:LI Wen-jun  CUI Zhi-ming
Affiliation:LI Wen-jun,CUI Zhi-ming (Institute of Intelligent Information Processing and Application, Suzhou University, Suzhou 215006, China)
Abstract:With the prevalence of Web database,Web is continuously deepened.Traditional search engines are only able to reach surface Web except for deep Web source.To make use of deep Web source efficiently,must perform scalable integration on deep Web data.In this case,data source discovery is a chief task.It's crucial to obtain deep Web data that whether or not locates the deep Web efficiently.Describes a deep Web source discovery method based on traditional search engine.It further improves the efficiency of data source discovery by query expansion via result analysis.The test gets good result.
Keywords:search engine  Deep Web  HTML form  query expansion
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号