首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
TRS公司推出新一代全文数据库系统TRS Database Server5系列产品,包括T R S全文数据库服务器(T R SDatabase Server)、TRS数据处理工具(TRS DP)、TRS关系数据库内容检索引擎(TRS Gateway)、TRS内容发布应用服务器(TRS WAS)等。TRS DatabaseServer5采用企业搜索引擎技术,融合数据管理、信息智能、集群分布等功能,全面支持Native XML,实现全息检索以及非结构化和结构化信息的统一管理和联合检索。TRS Database Server5全文数据库服务器的核心功能是实现对非结构化信息的全文检索和统一存储。所谓全文检索是指在海量非结…  相似文献   

2.
XML数据库已经成为数据库领域的重要成员,但是在商业数据库产品中它主要构建在关系数据库基础之上,这自然引入很多难题.针对XML的关系数据库存储,提出一种新的XML索引编码,解决了在关系数据库中集成全文检索技术和XML结构连接查询算法的问题,同时借助全文检索技术达到XML查询加速的效果.该方案应用于实际软件开发项目中.很好地解决了XML文档的关系数据库存储管理工作,并且具有很高的查询效率.  相似文献   

3.
Lucene在数据库全文检索中的性能研究   总被引:2,自引:0,他引:2  
通过Lucene API实现对MYSQL数据库的全文检索,并将Lucene全文检索的性能和查全率同数据库全文检索和Like子句检索作对比.通过对比发现Lucene全文检索在性能上接近数据库全文检索,检索耗时约为Like子句检索的1/5.在对中文检索方面能达到77.2%的查全率,大大高于数据库全文检索.因此对于数据量较大的MYSQL数据库,Lucene全文检索将是一个很好的选择.  相似文献   

4.
基于Lucene的站内搜索设计与实现   总被引:2,自引:0,他引:2  
简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势.该模型引入更好的中文分词技术,可自定义最终结果的排序.能够保证检索的前100条记录最符合检索者的需要.  相似文献   

5.
基于数据库的Internet化学资源导航系统与用户的交互   总被引:7,自引:6,他引:1  
针对基于文件方式管理的Internet化学化工资源导航系统的问题,结合ChIN的发展需求,在第二版ChIN中采用了关系数据库来管理整个导航系统,本文介绍了第二版ChIN的数据库设计和模块设计,着重对导航系统与用户的交互性进行分析设计,建立了Web用户资源提交、用户对资源投标及评价信息的提交、信息订阅与发送、全文检索与关系数据库检索相结合的站点检索等系统,极大地提高了ChIN与用户的交互能力,既有助  相似文献   

6.
采用合作缓存技术的并行全文检索   总被引:8,自引:0,他引:8  
全文检索是一种资源消耗型操作,并行全文检索可以缩短全文检索的响应时间,以前的并行检索研究主要集中在磁盘资源和CPU资源的优化利用方面,本文提出一种采用合作缓存技术的并行全文检索模型,以优化对内存资源的利用,并对该模型进行了分析和评价,说明该模型可以有效地提高检索性能。  相似文献   

7.
在经历了层次型数据库和关系型数据库的时代以后,现在我们站在了混合型数据库时代的门口。关系数据库中的第一代XML支持是切分(或分解)文档,以适应关系表格或将文档原封不动地存储为字符或二进制对象。这两个方法中的任一种都尝试将XML模型强制转换成关系模型。然而,这两种方法在功能和性能上都有很大的局限性。混合型模型将XML存储在类似于DOM(文档对象模型)中。  相似文献   

8.
随着信息化水平不断提高,如何从海量信息中快速查找到所需内容成为当前研究的热点。在分析了全文检索基本原理及Lucene系统结构的基础上,提出了MVC模式的全文检索模型,并实现了一套基于SSH框架技术和Lucene搜索引擎的全文检索系统。该系统扩展了检索文档支持的类型,不仅可以对TXT、MS Office各类文档进行检索,还能对PDF、HTML、RTF等文档进行检索;改进了中文分词器,提高了中文分词效率与精确度;改善了人机交互方式,实现了类似百度、谷歌搜索显示功能,对搜索关键字进行高亮显示。系统应用情况表明,该系统创建索引效率高,具有较快的检索速度以及较全的检索结果。  相似文献   

9.
基于Lucene的全文检索系统研究与开发   总被引:27,自引:0,他引:27  
郎小伟  王申康 《计算机工程》2006,32(4):94-96,99
提出了一种基干Jakarta Lucene的全文检索系统模型。该模型相对于Google的站内检索,以及传统的数据库检索都有较为明显的优势。其关键字的拆分比对技术、信息检索的速度以及最终结果的排序都有独到之处。能够保证检索的前100条记录虽符合检索者的需要。  相似文献   

10.
崔光范  许利杰  刘杰  叶丹  钟华 《计算机科学》2018,45(9):104-112, 145
随着信息化的深入,大数据在各个领域产生了巨大的价值,海量数据的存储和快速分析成为新的挑战。传统的关系型数据库由于性能、扩展性的不足以及价格昂贵等方面的缺点,难以满足大数据的存储和分析需求。Spark SQL是基于大数据处理框架Spark的数据分析工具,目前已支持TPC-DS基准,成为大数据背景下传统数据仓库的替代解决方案。全文检索作为一种文本搜索的有效方式,能够与一般的查询操作结合使用,提供更加丰富的查询和分析操作。目前,Spark SQL仅支持简单的查询操作,不支持全文检索。为了满足传统业务迁移和现有业务的使用需求,提出了分布式全文检索框架,涵盖了SQL文法、SQL翻译转换框架、全文检索并行化、检索优化4个模块,并在Spark SQL上进行了实现。实验结果表明相比于传统的数据库,在两种检索优化策略下,该框架的索引构建时间、查询时间分别减少到传统数据库的0.6%/0.5%和1%/10%,索引存储量减少为传统数据库的55.0%。  相似文献   

11.
韩升  刘广志 《微机发展》2006,16(3):208-210
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索引库结构设计、文本标引技术等数据预处理技术,以及全文检索系统索引数据库的数据处理流程。最后,在此基础上研究了全文检索系统索引库索引生成算法,给出了单个文档和批处理两种情况下的索引库索引生成算法。  相似文献   

12.
针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器,通过扩展其词典来实现中文地名的有效分词。其次,利用内存索引和多线程并行处理技术提高Lucene创建倒排索引效率,并依据地名类别和显示优先级属性优化了检索结果相关度排序策略。最后,开发了一套具有快速搜索和地图定位展示的Web地名检索系统,使用500万条真实地名数据测试了其检索性能,查询平均耗时不到1秒,比MySQL数据库模糊检索效率提高了15倍,匹配结果也更加准确,能够提供高效灵活的海量地名公共检索服务。  相似文献   

13.
为了改善传统全文检索方法在检索效率上的不足,结合Lucene构建了一个全文检索系统模型。介绍了全文检索的基本过程、Lucene源码结构和逻辑结构,分析了Lucene的索引组成,对比了Lucene全文检索和其它全文检索的区别。该模型可用于中小型的全文检索系统的实现,同时可基于此模型开发定制个性化的搜索引擎。最后通过实验对比了其与传统检索方式的响应时间,利用Lucene的全文检索具有更快的响应速度。  相似文献   

14.
SEEKER:基于关键词的关系数据库信息检索   总被引:20,自引:3,他引:20  
文继军  王珊 《软件学报》2005,16(7):1270-1281
传统上,SQL是存取关系数据库中数据的主要界面.但是,对于没有经验的用户来说,学习复杂的SQL语法是一件困难的事情.实现基于关键词的关系数据库信息检索,将使用户不需要任何SQL语言和底层数据库模式的知识,用搜索引擎的方式来获取数据库中的相关数据.描述了一个基于关键词的关系数据库信息检索系统SEEKER的设计和实现.现有的关系数据库关键词查询系统只能检索关系数据库中的文本属性,而SEEKER还可以检索数据库元数据以及数字属性.并且,SEEKER采用了更合理的排序公式,支持Top-k查询.实验结果显示,SEEKER具有良好的查询性能.  相似文献   

15.
站内搜索引擎是针对某个网站内部的全文检索服务,具备信息检索的核心技术。提出在文件系统上构建的解决方案,使用全文检索开发工具包——Lucene,实现站内搜索引擎系统。不仅针对关系数据库的数据,还对服务器文件系统上的各种非结构化文档数据进行加工、信息抽取,并创建索引文件进行搜索,最终实现对站内被检索数据的导航浏览,关键字高亮提示,筛选排序等。经过测试,检索效率较高,效果良好。  相似文献   

16.
一个带有Cache的检索系统的设计与性能研究   总被引:1,自引:0,他引:1  
为了对短信息进行高效地检索,设计了一个C/S检索系统,实现对英文和日语片假名的高效混合检索。通过分析缓冲区配置参数对数据载入的影响,给出了衡量缓冲区规模合理性的指标。  相似文献   

17.
对比研究了多种全文检索模型,实现了相应的系统原型,并通过实验对模型的检索性能进行了验证,为检索模型的选择与检索性能优化提供参考。  相似文献   

18.
ISIS Base化学数据库向关系数据库的迁移   总被引:2,自引:2,他引:0  
雷静 《计算机与应用化学》2005,22(11):1044-1046
ISIS Base是MDL公司提供的一个基于桌面的化学信息管理系统。利用ISIS Base用户可以对化学结构及相关的科学数据进行存储、搜寻和检索等管理工作。ISIS/Base基于表格的搜寻功能,可以让用户根据不同的需要将化学结构、文本及数字等类型的检索要求组合在一起,对相关的数据库进行检索和管理。但是它需要其它软件系统才能实现局域网和Internet应用。为了实现ISIS Base数据库中的数据在网络中的应用,本文介绍了一种ISIS Base数据向关系数据库迁移的方法。  相似文献   

19.
一种基于Lucene的中文全文检索系统   总被引:2,自引:0,他引:2       下载免费PDF全文
在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检索效率。该系统增加了加密模块,实现对建立的全文索引进行加密处理,增强了信息的安全性。  相似文献   

20.
Chabot: retrieval from a relational database of images   总被引:5,自引:0,他引:5  
Ogle  V.E. Stonebraker  M. 《Computer》1995,28(9):40-48
Selecting from a large, expanding collection of images requires carefully chosen search criteria. We present an approach that integrates a relational database retrieval system with a color analysis technique. The Chabot project was initiated at our university to study storage and retrieval of a vast collection of digitized images. These images are from the State of California Department of Water Resources. The goal was to integrate a relational database retrieval system with content analysis techniques that would give our querying system a better method for handling images. Our simple color analysis method, if used in conjunction with other search criteria, improves our ability to retrieve images efficiently. The best result is obtained when text-based search criteria are combined with content-based criteria and when a coarse granularity is used for content analysis  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号