首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
Unicode全文检索技术的研究与实现   总被引:6,自引:0,他引:6  
傅哲  王晓波  杨秀霞 《计算机工程》2001,27(10):110-113
根据实际的开发经验,详细阐述了一个全文检索系统中采用的主要技术,并提出了具体实现,基本构造了一个使用的基于Unicode和词表的全文检索系统。  相似文献   

2.
在新疆应用的全文检索系统中,需要区分文本的语种。由于国际编码规则的原因,新疆的维吾尔文、哈萨克文、柯尔克孜文借用了阿拉伯语系的部分字母,三种文字的字符集编码有大部分的重叠。本文通过研究三种文字的字符集编码,结合文字组词规则,设计了区分三种语种的算法,为进一步建立索引提供基础。  相似文献   

3.
全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于互关联后继树模型的动态索引技术,该技术在不影响查询效率等性能的情况下,很好地解决了索引的更新问题,提高了索引的动态性能。  相似文献   

4.
全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于互关联后继树模型的动态索引技术,该技术在不影响查询效率等性能的情况下,很好地解决了索引的更新问题,提高了索引的动态性能。  相似文献   

5.
一种高效的全文检索索引技术   总被引:7,自引:0,他引:7  
针对目前比较流行的基于词的倒排文档索引模型,结合全文检索数据的特点,提出了变长编码的索引压缩算法。利用该压缩编码,研究了基于内存缓存的快速创建索引的流程。通过实验,对索引膨胀率、创建时间和检索响应速度进行了对比分析,表明该技术提高了索引的空间与时间效率。  相似文献   

6.
Lucene是一个优秀的开源全文搜索技术框架,Lucene全文检索技术是信息检索领域广泛使用的基本技术.它能非常方便地为各种应用程序加入全文索引和搜索功能,快速有效地索引企业累积的大量信息资源.文中阐述了建立全文检索系统的必要性,介绍了全文检索系统的概念并分析了Lucene的系统结构和实现机制,最后结合实际应用背景从系统设计、文挡抽取、索引的建立及执行检索等方面介绍了全文检索系统的实现过程.实践证明,该系统的查准率、查询速度等均达到了设计要求.  相似文献   

7.
全文检索系统的重心是全文索引,全文检索的动态性取决于全文索引创建和更新的动态性.本文在对互关联后继树模型研究的基础上,借用操作系统和数据库的实现思想,对互关联后继树模型的存储结构进行优化,提高了索引更新的灵活性.文中给出了该结构的详细设计并提出了基于该结构的操作算法.实验证明,独特的结构很好地解决了索引的更新问题,较好地满足了数据频繁变化的应用需求.  相似文献   

8.
中文Web文档库全文检索技术研究与实现   总被引:13,自引:0,他引:13  
全文检索是一种非常有效的信息检索技术,本文结合国家863项目《WWW文档协同写作系统》的设计与开发,研究对中文Web文档库实现全文检索的主要技术,着重讨论了字表法全文检索技术细节,最后介绍了一个实用的全文检索系统的实现。  相似文献   

9.
Lucene的全文检索的研究与应用   总被引:7,自引:0,他引:7  
为了改善传统全文检索方法在检索效率上的不足,结合Lucene构建了一个全文检索系统模型。介绍了全文检索的基本过程、Lucene源码结构和逻辑结构,分析了Lucene的索引组成,对比了Lucene全文检索和其它全文检索的区别。该模型可用于中小型的全文检索系统的实现,同时可基于此模型开发定制个性化的搜索引擎。最后通过实验对比了其与传统检索方式的响应时间,利用Lucene的全文检索具有更快的响应速度。  相似文献   

10.
为了改善传统全文检索方法在检索效率上的不足,结合Lucene构建了一个全文检索系统模型。介绍了全文检索的基本过程、Lucene源码结构和逻辑结构,分析了Lucene的索引组成,对比了Lucene全文检索和其它全文检索的区别。该模型可用于中小型的全文检索系统的实现,同时可基于此模型开发定制个性化的搜索引擎。最后通过实验对比了其与传统检索方式的响应时间,利用Lucene的全文检索具有更快的响应速度。  相似文献   

11.
一种全文检索系统的设计与实现   总被引:4,自引:0,他引:4  
在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统核心接口层。最后给出了该系统的一种分布式部署方案。  相似文献   

12.
基于全文检索技术的商业信函处理系统的设计与实现   总被引:4,自引:0,他引:4  
分析了现有商业信函处理系统检索方式存在的缺点和全文检索的有关技术,利用全文检索技术与数据库技术的有机结合实现了商业信函处理系统,介绍了商业信函处理系统中全文检索的实现过程。系统的成功应用提高了企业的服务质量和经济效益。  相似文献   

13.
基于Web的网络爬虫的设计与实现   总被引:2,自引:0,他引:2  
无论是站内信息检索还是特定的Web信息搜集,都离不开全文搜索引擎系统的核心模块--网络爬虫,本文详细介绍了一种设计及实现方案,包括页面搜集器和页面索引器的基本工作流程、数据存储结构、核心算法及主要的技术难点.该系统经实际运行,效果良好,最后给出了有待进一步改进的地方.  相似文献   

14.
当前信息技术不断发展,人们对于信息系统的应用日益广泛,对于信息管理系统的要求也越来越高。利用当前最流行编程语言JAVA设计全文检索系统可以有效解决当前信息系统面临的问题。首先通过对Lucene架构的原理进行有效的分析,其次在其基础上设计出全文检索系统的框架,最后给出具体的检索模块的实现,并给出部分代码。对于信息管理人员来说具有积极的推动作用。  相似文献   

15.
基于Lucene对文件全文检索的研究与应用   总被引:1,自引:0,他引:1  
分析了Lucene的原理,针对Lucene的IndexReader、IndexSearcher、IndexWriter、Directory的各种不足,研究了不同优化方案,并通过重写源码中的QueryParser限制效率低下的通配符查询及模糊查询,提高了搜索响应速度,最后,文章研究了Lucene的多个应用领域.  相似文献   

16.
基于电子教材的特殊应用的需求,在传统的web页面全文检索技术基础上,设计了电子教材的全文检索系统。它包含教材文档处理模块、索引服务模块和检索服务模块。根据电子教材的结构需求,定义了索引文件数据结构、文本文件数据结构、索引条目数据结构及结果排序的分数模型。通过系统的实现,为电子教材学习者提供了快速准确的检索服务,提高学习者学习效率。  相似文献   

17.
分析并采用J2EE中轻量级框架组合SSH(Spring+Struts+Hibernate),结合信息检索领域广泛使用的Lu-cene技术,研究并实现了一个适合用于海量数据的全文检索系统,为政府和企事业单位的门户网站信息搜索提供了一种有效的思路和实现方法。  相似文献   

18.
As a important application of the Full-Text retrieval system, document relevancy has powerful function. In this paper, a document relevancy method based on the Full-Text retrieval system is presented, which is deeply discussed from two aspects, content relevancy and properties relevancy. This system is proved to have good response time and precision by tests. It has great prospects in application area.  相似文献   

19.
一种中文词句的快速检索算法   总被引:1,自引:0,他引:1  
刘国华  程蕾  祈晓园 《计算机工程》2003,29(19):70-71,94
介绍了一种中文词句快速检索算法,该算法将中文文献正文转换成文献中每个汉字的位置索引列表。根据位置索引列表信息能够快速查找出用户关心的某个词句在文献中出现的位置,并将该词句所在的句子或者上下文信息提交给用户。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号