首页 | 本学科首页   官方微博 | 高级检索  
     

一种用于结构化文档检索的贝叶斯网络
引用本文:徐建民,陈振亚.一种用于结构化文档检索的贝叶斯网络[J].计算机工程,2011,37(13):43-45.
作者姓名:徐建民  陈振亚
作者单位:1. 天津大学系统工程研究所,天津,300072;河北大学数学与计算机学院,河北,保定,071002
2. 河北大学数学与计算机学院,河北,保定,071002
基金项目:中国博士后科学基金资助项目
摘    要:分析结构化文档的表示方法及检索特点,对一种用于结构化文档检索的贝叶斯网络进行研究。讨论该贝叶斯网络的构造方法、概率估计及推理过程。用网络节点表示文档索引术语和结构单元,用弧表示术语和结构单元的隶属关系,根据TF-IDF方法估计各节点的先验概率,当给定一个查询时,通过计算每个结构单元的条件概率得到该结构单元的相关值。实例验证了该贝叶斯网络的有效性。

关 键 词:贝叶斯网络  结构化文档  信息检索  先验概率估计
收稿时间:2010-12-07

Bayesian Network for Structured Document Retrieval
XU Jian-min,CHEN Zhen-ya.Bayesian Network for Structured Document Retrieval[J].Computer Engineering,2011,37(13):43-45.
Authors:XU Jian-min  CHEN Zhen-ya
Affiliation:1.Institute of Systems Engineering,Tianjin University,Tianjin 300072,China;2a.College of Mathematics and Computer Science;2b.Library,Hebei University,Baoding 071002,China)
Abstract:This paper analyzes the representation method and characteristics of retrieval,studies a Bayesian network for structured document retrieval.It discusses the construct method and probability estimates of Bayesian network,and the retrieval process.Index terms and structural units can be represented by nodes,relationship among nodes can be described by arcs,and prior probability of nodes can be estimated according to TF-IDF.The relevance of each structural unit can be computed and ranked by its conditional probability when a user query is given.Example proves the effectiveness of the Bayesian network
Keywords:Bayesian network  structured document  information retrieval  prior probability estimate
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号