首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
赵珂  逯鹏  李永强 《计算机工程》2011,37(16):39-41
针对目前教育网庞大的FTP资源检索困难的问题,提出一种基于EdtFTPJ和Lucene的FTP搜索引擎的设计和实现方案。该方案整体上采用基于Struts1.2框架的模型-视图-控制器设计模式,数据采集模块利用基于正则表达式的有限状态自动机抓取数据,索引模块应用倒排索引方法,系统的分词算法使用基于字典的正向最大匹配中文分词法。实验结果表明,该方案具有较高的资源检索率,同时能够保证检索结果的准确性。  相似文献   

2.
结合网格索引和R树索引的特点,提出了一种基于网格与R树的多级混合索引.该方案首先将矩形地理空间进行粗网格划分建立多级网格索引.然后针对每个小网格建立基于R树的空间索引.详细讨论了该索引的结构、建立算法、删除算法以及应用该索引的检索算法,并进行了算法分析.与网格索引和R树索引相比,该索引以略大的空间开销换取了更高的查找性能.  相似文献   

3.
《软件工程师》2017,(6):12-14
如今互联网上藏文信息也不断的扩充,藏文搜索引擎作为常用的信息检索的工具和渠道,倒排索引又是搜索引擎的核心技术之一,倒排索引直接影响搜索引擎检索的结果和响应的速度。之所以文章详细介绍了一个自主开发的藏文网页倒排索引系统,它以XML文档的标签内容作为索引对象,定义了文档和文档属性等概念,采用C#语言对文藏文网页正文构建倒排索引的关键技术和实现方法进一步的阐述,实现了基于XML文档的藏文网页倒排索引数据库的底层实现,提供了技术参考。利用这种方法藏文搜索引擎中信息检索的速度和准确率有所提高。  相似文献   

4.
一种动态安全的密文数据库检索方法   总被引:10,自引:0,他引:10  
密文数据库检索是当前密文数据库的关键技术之一.针对密文数据库中的密文属性列,提出了一种有效的、动态安全的密文索引方案,并给出了其检索算法.  相似文献   

5.
针对海量数据下的全文检索遇到的索引时间过长、I/O过高的时间较长、检索响应时间较长的问题进行了分析.提出了一种以索引类型分解、索引分块、多索引联合检索以及使用RMI提供远程检索服务相结合的解决方案.实验和生产环境中的应用表明,此方案能解决上述问题并能够提供稳定、高效的搜索服务.  相似文献   

6.
一种支持快速相似检索的多维索引结构   总被引:9,自引:4,他引:5  
冯玉才  曹奎  曹忠升 《软件学报》2002,13(8):1678-1685
基于内容的图像检索是一种典型的相似检索问题,对于尺度空间上的图像相似匹配问题,一般认为距离计算费用很高.因此,需要建立有效的索引结构,以减少每个查询中的距离计算次数.为此,基于数据空间的"优化划分",并且使用"代表点",以层次结构方式划分数据,提出了一种新的基于距离的相似索引结构opt-树及其变种(-树.为了更有效地支持基于内容的图像检索,在(-树索引结构中采用了"(-最优化划分"和"(-对称冗余存储"策略,以提高相似检索的效率.详细讨论了这种索引结构的建立与检索等问题,并给出了相应的算法.实验结果显示了这种索引技术的有效性.  相似文献   

7.
李迎新  张明  陆鹏 《现代计算机》2007,(2):94-97,100
在基于图像内容的图像检索(CBIR)系统中,搜索引擎检索图像类似于按照相似标准来查询图像,它应该有足够快的速度并且有较高的检索准确率.索引用来提高系统响应,而相关反馈用于帮助提高检索准确率.在本文中,主要说明基于人感知的相似性度量,以及讨论综合相关反馈的索引方案.该索引方案通过分析特征熵而得出的主从键,而相关反馈是根据Mann-Whitnev检验而提出的,该检验通常用来识别来自同一搜索集中相关图像和不相关图像之间不同特征,并利用不同特征的特点提高检索性能.相关反馈方案针对两不同相似标准来执行,检验判定了这个方法的有效性.最后,把索引机制和相关反馈机制结合起来建立搜索引擎.  相似文献   

8.
针对传统集中式索引处理大规模数据的性能和效率问题,提出了一种基于文本聚类的检索算法。利用文本聚类算法改进现有的索引划分方案,根据查询与聚类结果的距离计算判断查询意图,缩减查询范围。实验结果表明,所提方案能够有效地缓解大规模数据建索引和检索的压力,大幅提高分布式检索性能,同时保持着较高的准确率和查全率。  相似文献   

9.
数据加密是确保云存储数据安全的主要技术,高效的密文检索技术对于提高密文检索效率和减小存储开销起到了决定性作用。大多数已有的基于密文检索的中文数据加密方案需要上传密钥,增加了密钥泄漏的风险。在密文检索过程中,对于关键字的匹配,一些方案需要多次对密文解密,严重降低了密文检索的效率;另一些方案构建了大量的索引文件,浪费了云存储空间。文中提出了一种能兼顾检索效率和存储开销的中文数据加密方案,其在数据加密阶段利用了数据分块随机排序和标号向量加密技术,在密文检索阶段配合构建的索引向量文件对密文进行类明文检索。在整个过程中不需要将密钥上传至云服务器,建立索引向量文件所消耗的存储空间也小于其他基于索引的方案。实验表明,本方案在检索效率和存储开销上优于其他两种方案,并且能在耗费较少时间和存储空间的情况下准确地找到用户存储的数据。  相似文献   

10.
为实现安全高效的云端数据密文检索,提出基于Huffman树的密文索引构建及检索方案。将Huffman树形结构及其编码的思想引入密文索引结构的构建方案中,改进基于知识理解的中文分词算法提取明文关键词,通过改进的TF-IDF规则对检索结果集进行排序以返回最符合用户需求的Top-K个结果,并增加伪造的索引结点以增强索引结构的抗统计分析攻击能力。通过实验测试和性能对比分析可得出结论:方案在保证密文和索引信息安全性的同时,可以提高密文检索的效率。  相似文献   

11.
基于电子教材的特殊应用的需求,在传统的web页面全文检索技术基础上,设计了电子教材的全文检索系统。它包含教材文档处理模块、索引服务模块和检索服务模块。根据电子教材的结构需求,定义了索引文件数据结构、文本文件数据结构、索引条目数据结构及结果排序的分数模型。通过系统的实现,为电子教材学习者提供了快速准确的检索服务,提高学习者学习效率。  相似文献   

12.
搜索引擎的诞生,给信息搜集带来了极大的方便与好处。一套完备、成熟的搜索引擎的开发需要耗费大量资源,本文围绕如何快速搭建一个简易的搜索引擎展开。基于各开源组织独立研发并对外提供的搜索引擎组件与框架,本文在JBuilder开发平台上调用各组件对外提供的Java API,快速地搭建起由数据抓取、建立索引及执行搜索3大部分组成的简易的全文搜索引擎,实现网页文档类数据的抓取与保存、文本提取、索引文档及索引库的建立、基本关键词的检索等功能,并描述搜索引擎实现及运行的一般过程。  相似文献   

13.
基于语料库的藏文字属性分析系统设计   总被引:1,自引:1,他引:0       下载免费PDF全文
通过对藏语语料库的统计和现代藏文字结构的分析,研究现代藏文字属性分析系统的模型,设计基本构件字表库、组合构件字表库、粗粒度结构字表库及细粒度结构字表库,并阐述各字表库的结构特征,介绍藏文字属性分析算法.运用该算法及藏文字属性分析系统模型,解析现代藏文字的使用频度、结构、字长、构件分解、各构件的位置及频度等属性,从而为藏...  相似文献   

14.
基于Lucene.Net的分布式全文检索系统   总被引:1,自引:0,他引:1  
随着互联网的发展,现代信息量急剧增加,人们对于信息的检索要求越来越高,一个好的检索系统必须具有较快的检索速度和较高的查准率.针对海量文本数据提出一种基于Lucene.Net全文检索引擎构建的分布式全文检索系统,使用.NET Remoting实现分布式的全文索引与全文检索,具有较好的扩展性和很快的索引与检索速度,并成功地将该技术应用于军队某部信息管理系统,取得了很好的效果.  相似文献   

15.
韩升  刘广志 《微机发展》2006,16(3):208-210
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索引库结构设计、文本标引技术等数据预处理技术,以及全文检索系统索引数据库的数据处理流程。最后,在此基础上研究了全文检索系统索引库索引生成算法,给出了单个文档和批处理两种情况下的索引库索引生成算法。  相似文献   

16.
XQuery作为由W3C组织提出的一种XML查询语言,正在成为当前应用于XML数据库中对XML数据操作的一个规范。为了提高对XML中文本内容的查询支持,W3C又进一步设计了支持全文检索功能的语法规范。针对最新的XQuery及全文检索语法特征,文章提出了支持全文检索功能XQuery的解析与查询执行策略,为XQuery的查询处理提供解决方案。在此基础上,针对全文检索功能的查询执行计划,提出了适用于窗口查询,距离查询,是否排序查询的优化方案,以减少查询执行的代价,提高XQuery查询的效率。  相似文献   

17.
互联网文本数量持续爆炸式增长,用户通过互联网查找信息变得更加困难,响应时间得不到满足。针对藏文本身的语言学特点,探讨一种面向信息搜索的藏文文本索引建立策略,建立一种高效的藏文文本索引,以提高藏文信息检索速度。  相似文献   

18.
乐嘉锦  姚岚 《计算机工程》2012,38(24):269-273
为解决体育网络视频搜索问题,提出一种基于Solr技术的体育视频信息全文搜索系统。收集和处理原始体育视频信息,使用Solr建立索引进行搜索,对搜索结果进行处理和呈现,给出应用系统的系统架构,介绍原始数据信息收集、Solr全文搜索服务、搜索结果预处理的过程。实验结果表明,该系统的命中率和正确率较高,当采用多类聚集方法时搜索效果更优。  相似文献   

19.
基于后继区间的互关联后继树搜索算法   总被引:1,自引:0,他引:1       下载免费PDF全文
全文检索领域的关键问题是索引模型以及该模型之上的高效搜索算法,基于一种优秀的全文索引模型互关联后继树提出了基于后继区间的搜索算法,大大提升了全文的检索速度,从而更加充分地体现了互关联后继树模型在全文领域的优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号