首页 | 本学科首页   官方微博 | 高级检索  
     

全文检索系统的数据预处理研究
引用本文:韩升,刘广志.全文检索系统的数据预处理研究[J].微机发展,2006,16(3):208-210.
作者姓名:韩升  刘广志
作者单位:北京交通大学软件学院 北京100044
摘    要:全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索引库结构设计、文本标引技术等数据预处理技术,以及全文检索系统索引数据库的数据处理流程。最后,在此基础上研究了全文检索系统索引库索引生成算法,给出了单个文档和批处理两种情况下的索引库索引生成算法。

关 键 词:全文检索  预处理  文本标引  索引数据库
文章编号:1005-3751(2006)03-0208-03
修稿时间:2005年6月22日

Study of Data-Pretreatment for Full-Text Search System
HAN Sheng,LIU Guang-zhi.Study of Data-Pretreatment for Full-Text Search System[J].Microcomputer Development,2006,16(3):208-210.
Authors:HAN Sheng  LIU Guang-zhi
Abstract:The application of full-text search has caused a revolution of the information retrieval field.It is the core that the file database researches and develops.In a full-text search system,the setting-up of the index database of full text is a systematic foundation.Its project organization influences the final search efficiency of searching algorithm and system of the full-text search engine directly.This paper introduces such data-pretreatment technology as index database structural design,text index technology,etc.Also introduces that in the fulltext retrieval system mainly,and the data processing procedure of index database of full-text retrieval system.Finally,studied the produce-algorithms of index database of full-text retrieval system on this basis,provided produce-algorithm of index database under two kinds of situations: individual file and batch processing.
Keywords:full-text search  pretreatment  document indexing  index database
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号