面向混合类型关键词查询的非合作结构化深网数据源选择 |
| |
引用本文: | 万常选,邓松,刘德喜,江腾蛟,刘喜平.面向混合类型关键词查询的非合作结构化深网数据源选择[J].计算机研究与发展,2014(4). |
| |
作者姓名: | 万常选 邓松 刘德喜 江腾蛟 刘喜平 |
| |
作者单位: | 江西财经大学信息管理学院;江西财经大学数据与知识工程江西省高校重点实验室; |
| |
基金项目: | 国家自然科学基金项目(61173146,61363010,61363039);江西省高等学校科技落地计划项目(产学研合作)(KJLD12022);江西省教育厅科技研究项目(GJJ12733,GJJ13249) |
| |
摘 要: | 为有效地利用深网中的资源,深网集成应运而生.为了提高深网集成的效率和返回结果的质量,数据源选择成为深网集成的关键技术.深网数据源大多数是结构化和非合作型的.当前已有的非合作结构化深网数据源选择的研究分为2类:一类是面向离散型关键词查询的源选择;另一类是面向字符型关键词查询的源选择,而未见面向混合类型关键词查询的结构化数据源选择的相关研究.基于此,将用户查询关键词分为检索型关键词和约束型关键词,基于主题词与主题词、主题词与特征词和直方图与直方图的关联特征构建了面向检索型、约束型混合关键词查询的层次化数据源摘要,有效地反映了非合作结构化深网数据源选择中检索型关键词的检索意图和约束型关键词的约束相关性,并依据此摘要给出了相应的数据源选择策略.实验结果表明,该方法在面向混合类型关键词查询的非合作结构化深网数据源选择时具有较好的记录召回率及准确率.
|
关 键 词: | 检索 非合作 结构化 深网 数据源选择 |
本文献已被 CNKI 等数据库收录! |
|