西安市数字方志全文检索系统的设计与实现 |
| |
引用本文: | 吴代文,詹海生.西安市数字方志全文检索系统的设计与实现[J].微机发展,2011(10):121-124. |
| |
作者姓名: | 吴代文 詹海生 |
| |
作者单位: | [1]渭南师范学院传媒工程系,陕西渭南714000 [2]西安电子科技大学计算机学院,陕西西安710071 |
| |
基金项目: | 教育部特色专业建设点(TS11772) |
| |
摘 要: | 通过LuceneAPI实现对PDF文档的一次全文检索,为了更精确地定位搜索关键词,设计并实现了一种新的二次索引算法,该二次索引带有关键词的页码、坐标及其上下文等信息。利用该二次索引可将检索结果定位到PDF文档的具体页,然后在页面上标示出关键字的具体位置,使对PDF文档的二次检索达到了类似GoogleBook的图书检索效果。系统测试结果说明系统具有良好检索性能,有较高的查全率和查准率,能够满足用户快速检索的需求。系统作为西安市数字方志全文检索平台投入使用已有2年,取得了较好的应用成果。
|
关 键 词: | 全文检索 二次索引 二次检索 查全率 查准率 |
本文献已被 维普 等数据库收录! |
|