首页 | 本学科首页   官方微博 | 高级检索  
     

基于结点权重模型的XML片段检索策略
引用本文:刘德喜,万常选,刘喜平,钟敏娟,江腾蛟.基于结点权重模型的XML片段检索策略[J].计算机学报,2013,36(8):1729-1744.
作者姓名:刘德喜  万常选  刘喜平  钟敏娟  江腾蛟
作者单位:江西财经大学信息管理学院 南昌 330013;江西财经大学数据与知识工程江西省高校重点实验室 南昌 330013
基金项目:国家自然科学基金,国家社会科学基金,江西省高等学校科技落地计划项目,江西省教育厅科学技术研究项目,This work is a part of our projects mainly supported by the National Natural Science Foundation of China under Grant Nos.60803105 and 61173146,National Social Science Foundation of China under Grant No.12CTQ042,the Science & Technology Project of Department of Education of Jiangxi Province under Grant No.11731
摘    要:当用户向XML检索引擎提交查询后,返回的结果通常远远多于用户的期望,返回结果中难免有一些不相关的文档或结点.对于以文档为中心的XML文档集合,XML片段检索是根据用户的查询,从XML检索引擎返回的XML文档或结点中抽取出仅包含数百字节的片段,用户可以通过该片段判断片段所在的XML文档或结点与查询的真实相关性,以决定是否有必要进一步阅读,从而有效地提高从XML文档中获取信息的效率.该文提出了基于结点权重模型的XML片段检索策略.该策略先利用结点权重模型ATG(平均主题概括强度)对XML文档集中的标签或路径设置权重,再将该权重用于BM25模型,得到BM25NW检索模型.在利用BM25NW检索出XML结点后,对结点中定长窗口进行评分,考察其是否适合作为片段内容.最后在保证信息冗余较小的条件下,选择得分较高的窗口内容组成片段返回给用户.INEX 2011片段检索任务上的评测结果显示,基于结点权重模型ATG的XML片段检索策略具有很强的竞争力,性能明显优于其它参赛系统.

关 键 词:XML片段检索  结点权重模型  平均主题概括强度  窗口

A Snippet Retrieval Strategy Based on Element Weighting Model
LIU De-Xi , WAN Chang-Xuan , LIU Xi-Ping , ZHONG Min-Juan , JIANG Teng-Jiao.A Snippet Retrieval Strategy Based on Element Weighting Model[J].Chinese Journal of Computers,2013,36(8):1729-1744.
Authors:LIU De-Xi  WAN Chang-Xuan  LIU Xi-Ping  ZHONG Min-Juan  JIANG Teng-Jiao
Affiliation:LIU De-Xi WAN Chang-Xuan LIU Xi-Ping ZHONG Min-Juan JIANG Teng-Jiao(School of Information Technology,Jiangxi University of Finance and Economics,Nanchang 330013)(Jiangxi Key Laboratory of Data and Knowledge Engineering,Jiangxi University of Finance and Economics,Nanchang 330013)
Abstract:
Keywords:XML snippet retrieval  element weighting model  average topic generalization  window
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号