首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
密文全文检索系统在不解密的情况下对密文进行检索,索引分词密文必须与检索的分词密文一致.基于对系统安全性的要求,如果每个分词使用不同的密钥进行加密是最安全的,但这会带来密钥数量庞大且不利于管理的问题.本文在此基础上,提出一种使用组合密钥的方案解决这一问题.  相似文献   

2.
随着信息技术的发展,很多单位累积了海量的科研和生产数据,其中部分是涉密数据.如何从这些海量数据中安全且快速找到所需的涉密信息是用户面临的难题.密文索引是密文全文检索系统的核心模块,为保证在密文状态下进行高效的全文检索,提出了一种密文动态后继树精简索引模型.该索引模型支持密文子串查询、潜在分词查询和索引动态更新,具有较高的查全率和查准率;给出该模型密文索引的创建、检索、和索引密文更新算法,并对其安全性和效率进行分析.实验表明,与其他已有的索引模型相比,该模型具有较好的时间效率,更适合应用于密文全文检索领域.  相似文献   

3.
对业界使用的网站站内全文检索技术进行了分析,描述了网站搭建检索平台的方法和技术特点,并对新闻网站全文检索系统的发展趋势进行了展望。建立站内全文检索系统是提高网站的搜索服务能力及数据利用的有效手段。高效实用的站内搜索,能有效帮助用户快速准确地找到目标信息,激活网站沉淀信息,让网站的核心价值充分体现,增强网站的实用功能。  相似文献   

4.
Lucene2.0是一个高性能的、可扩展的、开源的全文检索工具库,它可以方便地融入到各种应用系统中实现全文索引和搜索功能:在搜索引擎中,Lucene是充当索引的建立工具和索引的查找工具的角色.文章详细分析了Lucene分析器、索引包、搜索包以及Lucene中评分排序、中文分词、索引优化等关键技术点,然后将其引入具体应用,给出了一个基于Lucene2.0的电子文献全文检索系统的实现、  相似文献   

5.
一种基于Lucene的中文全文检索系统   总被引:2,自引:0,他引:2       下载免费PDF全文
在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检索效率。该系统增加了加密模块,实现对建立的全文索引进行加密处理,增强了信息的安全性。  相似文献   

6.
7.
基于Lucene的中文全文检索系统的研究与设计   总被引:4,自引:0,他引:4  
提出了一种基于Lucene的中文全文检索系统模型.通过分析Lucene的系统结构,系统采用了基于统计的网页正文提取技术,并且加入了中文分词模块和索引文档预处理模块来提高检索系统的效率和精度.在检索结果的处理上,采用文本聚类的办法,使检索结果分类显示,提高了用户的查找的效率.实验数据表明,该系统在检索中文网页时,在效率,精度和结果处理等方面性能明显提高.  相似文献   

8.
为实现安全高效的云端数据密文检索,提出基于Huffman树的密文索引构建及检索方案。将Huffman树形结构及其编码的思想引入密文索引结构的构建方案中,改进基于知识理解的中文分词算法提取明文关键词,通过改进的TF-IDF规则对检索结果集进行排序以返回最符合用户需求的Top-K个结果,并增加伪造的索引结点以增强索引结构的抗统计分析攻击能力。通过实验测试和性能对比分析可得出结论:方案在保证密文和索引信息安全性的同时,可以提高密文检索的效率。  相似文献   

9.
电子病历包含病人的隐私信息,如何在保密情况下进行电子病历内容搜索是医院电子病历数据有效利用的难点.针对电子病历密文搜索,提出一种基于布隆过滤器(BF)和B+树的快速搜索方法.该技术对电子病历建立BF,按照倒排索引方式组织起来并建立B+树,能够支持在不泄露用户搜索关键词的前提下,对电子病历密文直接进行查询,安全级别达到I...  相似文献   

10.
一种实现知识库站内中文全文检索的方法   总被引:1,自引:0,他引:1  
比较了全文检索方法与常规的数据库搜索的不同之处,提出应用DotLucene技术实现知识库站内中文全文检索的方法。事实表明,索引和查找的时空效率都很高。  相似文献   

11.
为了解决云存储技术带来的数据安全和高效检索问题,在深入研究可搜索加密技术基础上,提出一种基于云存储的密文全文检索模型,给出基于可搜索加密技术的密文全文索引构建和检索策略,并对方案的安全性进行分析。实验表明,云存储环境下基于可搜索加密技术的密文全文检索方案既保证了数据的安全性,又具有很好的检索效率,可适用于海量数据的加密存储与高效安全检索。  相似文献   

12.
为了改善常规存储方式模糊查询性能较低的问题,提出一种针对大文本文档数据的高效模糊查询方法。通过对文档建立倒排索引,将索引以及部分文档信息提取到内存中以降低磁盘输入和输出(Input/Output, I/O)。根据内存中的倒排索引和数据库中主键形成的映射查询数据,然后通过相关度算法对这些数据进行排序,并以字典树作为搜索提示,实现高效的全文检索。实验结果表明:与ElasticSearch使用相同词集时,随着测试数据量的变化,所设计的全文检索引擎的查询效率是ElasticSearch效率的80~1 200倍,其效率优势随着数据量增加呈现反比例关系变化,并且在17 919条文档数据下,其内存占用不超过2.5 GB,适合用于海量文档数据检索。  相似文献   

13.
全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于互关联后继树模型的动态索引技术,该技术在不影响查询效率等性能的情况下,很好地解决了索引的更新问题,提高了索引的动态性能。  相似文献   

14.
全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于互关联后继树模型的动态索引技术,该技术在不影响查询效率等性能的情况下,很好地解决了索引的更新问题,提高了索引的动态性能。  相似文献   

15.
针对云存储环境下的密文检索问题,面向精确密文检索需求设计了一种新型的精确密文全文索引方案D RD I (Different Rationality for Dual‐Indexing)。该方案在密文检索技术和传统全文检索技术的研究基础上,对传统的倒排索引结构进行了改造,建立多属性双索引,可高效检索出包含对应关键字的文件目录信息。实验结果表明该方案具有可行性和高效性的特点。  相似文献   

16.
一种高效的全文检索索引技术   总被引:7,自引:0,他引:7  
针对目前比较流行的基于词的倒排文档索引模型,结合全文检索数据的特点,提出了变长编码的索引压缩算法。利用该压缩编码,研究了基于内存缓存的快速创建索引的流程。通过实验,对索引膨胀率、创建时间和检索响应速度进行了对比分析,表明该技术提高了索引的空间与时间效率。  相似文献   

17.
M+树:一种新型、高效的动态哈希算法   总被引:1,自引:0,他引:1  
张旺光  庄毅 《计算机工程》2004,30(16):94-95,120
通常哈希函数只支持等值查找,这给哈希函数的应用带来了很大的限制。该文提出了一种新型的哈希索引算法——M 树索引。该算法能够支持等值和范围查找,实验表明,该算法无论在查询效率还是可维护性方面都优于同类索引算法。  相似文献   

18.
一种密文数据库的查询方法   总被引:3,自引:0,他引:3  
本文在密文索引的基础上,提出了一种“分散索引机制”及其查询方法,并对分散索引查询和集中索引查询作了详尽的比较和分析,说明了“分散索引机制”及其查询方法的优越性。  相似文献   

19.
一种动态安全的密文数据库检索方法   总被引:10,自引:0,他引:10  
密文数据库检索是当前密文数据库的关键技术之一.针对密文数据库中的密文属性列,提出了一种有效的、动态安全的密文索引方案,并给出了其检索算法.  相似文献   

20.
Lucene是一个优秀的开源全文搜索技术框架,Lucene全文检索技术是信息检索领域广泛使用的基本技术.它能非常方便地为各种应用程序加入全文索引和搜索功能,快速有效地索引企业累积的大量信息资源.文中阐述了建立全文检索系统的必要性,介绍了全文检索系统的概念并分析了Lucene的系统结构和实现机制,最后结合实际应用背景从系统设计、文挡抽取、索引的建立及执行检索等方面介绍了全文检索系统的实现过程.实践证明,该系统的查准率、查询速度等均达到了设计要求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号