基于搜索引擎的Deep Web数据源发现技术 |
| |
引用本文: | 李文骏,崔志明.基于搜索引擎的Deep Web数据源发现技术[J].计算机技术与发展,2008,18(8). |
| |
作者姓名: | 李文骏 崔志明 |
| |
作者单位: | 苏州大学,智能信息处理及应用研究所,江苏,苏州,215006 |
| |
基金项目: | 国家自然科学基金项目
,
2005年度教育部科研重点项目
,
教育部"高校博士学科点科研基金项目"
,
江苏省高技术研究计划项目 |
| |
摘 要: | 随着Web数据库的广泛应用,Web正在不断"深化".传统搜索引擎只能检索浅层网络,却不能直接索引到深层网络(Deep Web)的资源.为了有效地利用Deep Web资源,必须要对Deep Web数据进行大规模集成.其中,数据源发现是整合DeepWeb资源的首要工作,能否高效地发现DeepWeb站点是DeepWeb数据获取的关键.提出了一种基于传统搜索引擎的Deep Web数据源发现方法,该方法通过分析返回结果来扩展查询,从而进一步提高了数据源发现的效率.实验证明该方法能得到较好的结果.
|
关 键 词: | 搜索引擎 Deep'Web 网页表单 查询扩展 |
Deep Web Source Discovery Based on Search Engine |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 万方数据 等数据库收录! |
|