首页 | 本学科首页   官方微博 | 高级检索  
     

中文分词对中文信息检索系统性能的影响
引用本文:曹桂宏,何丕廉,吴光远,聂颂. 中文分词对中文信息检索系统性能的影响[J]. 计算机工程与应用, 2003, 39(19): 78-80,90
作者姓名:曹桂宏  何丕廉  吴光远  聂颂
作者单位:天津大学计算机科学与技术系,天津,300072;天津大学计算机科学与技术系,天津,300072;天津大学计算机科学与技术系,天津,300072;天津大学计算机科学与技术系,天津,300072
基金项目:国家自然科学基金(编号:69783004),天津市自然科学基金(编号:993800111)
摘    要:中文分词作为中文信息处理最重要的预处理手段被广泛应用,该文从两个方面(检索精度和召回率)深入研究了中文分词精度和分词算法对中文信息检索性能的影响。此外,提出了两个假设,并在此基础上给出了一种提高中文信息检索系统性能的方法。实验表明,新方法能够取得很好的结果,证实了这两个假设。

关 键 词:中文分词  中文信息检索  Smart系统  向量空间模型
文章编号:1002-8331-(2003)19-0078-03

Impact of Chinese Segmentation to Chinese Information Retrieval
Cao Guihong He Pilian Wu Guangyuan Nie Song. Impact of Chinese Segmentation to Chinese Information Retrieval[J]. Computer Engineering and Applications, 2003, 39(19): 78-80,90
Authors:Cao Guihong He Pilian Wu Guangyuan Nie Song
Abstract:As one of the most important preprocessing,Chinese segmentation is used widely.In this paper,an extensive research is conducted on the impact of segmentation precision and segmentation algorithm to the retrieval precision and recalls of Chinese information retrieval system.The paper puts forward two hypotheses,and a novel method is worked out to improve the information retrieval system based on them.The novel method works fairly well and these hypotheses are proved by experimental results.
Keywords:Chinese Segmentation  Chinese Information Retrieval  Smart System  Vector Space Model
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号