首页 | 本学科首页   官方微博 | 高级检索  
     

单汉字检索中的集合索引方法
引用本文:范志新,施伯乐,高卫国.单汉字检索中的集合索引方法[J].计算机工程,1998,24(7):5-7,49.
作者姓名:范志新  施伯乐  高卫国
作者单位:1. 复旦大学计算机系,上海,200433
2. 复旦大学数学系,上海,200433
摘    要:根据汉字在文献中使用的频度和分布规律,利用图书分类的原则,提出了基于汉字在成组(连续索引号)文献中出现的集合索引方案。与基于单值表达的常规索引方案作了比较,并对一类短语料进行了实验,给出了部分比较结果以及索引调整的一些分析结果。模拟图书分类中汉字非均匀分布的特点,从理论上分析文献索引各参量间的关系。分析表明,集合索引法与单值表达索引相比,能够显著提高索引效率,减少索引空间,还可进行随机动态调整。

关 键 词:集合索引  文献检索  单汉字检索

Set-based Index Method in Chinese Word Retrieval
FAN Zhixin,Shi Baile,Gao Weiguo.Set-based Index Method in Chinese Word Retrieval[J].Computer Engineering,1998,24(7):5-7,49.
Authors:FAN Zhixin  Shi Baile  Gao Weiguo
Affiliation:Fan Zhixin; Shi Baile; Gao Weiguo(Dept.of Computer of Fudan Univ. Shanghai 200433) (Dept.of Mathematics of Fudan Univ. Shanghai 200433)
Abstract:Chinese word has its own usage frequency rule in the text, slightly different from English word.According to the classification of text, this paper proposed the set-based approach on Chinese word index.Following the results of some experimenis on comparing with the single-value method, the set-based method can reduce index space and accelerate retrieve speed, its efficiency can be enhanced later.In this paper, an analytical model was established for study purpose.
Keywords:Set-based index  Chinese word index  Succession degree  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号