首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为在云计算环境下实现具有隐私保护的数据检索,设计支持词频和用户喜好的多关键词模糊搜索方案.该方案采用布隆过滤器,在文件索引的建立过程中嵌入词频信息,在查询向量的生成过程中嵌入用户喜好信息,并基于局部敏感哈希函数实现关键词的模糊检索.在数据搜索过程中,该方案允许授权用户输入多个关键词,并对每个关键词设定相应的权重,即使关键词存在误差,也可准确地返回相关数据.安全性分析表明,该方案在已知密文模型的条件下是安全的,可保护查询关键词和陷门信息不被云存储服务器获取.  相似文献   

2.
为了实现海量地图数据的分级多尺度显示,在地图数据库上构建HH-GAP-tree索引,并引入了拓扑算子。首先,确定显示比例尺级数,再生成多级Hilbert-R-tree索引,确定查询窗口。其次,对其建立GAP-tree索引,查询获取满足用户要求比例尺的初级数据,在此基础上检索GAP-tree并采用拓扑算子进行处理。最后,动态生成新的比例尺数据。实验结果表明,该索引在多尺度显示中是有效的,避免了单纯使用一种索引的缺点。  相似文献   

3.
针对各检索词在整个查询中的权重不同和由检索词组合顺序不同而导致的暗含语义差异的问题,利用正排索引和倒排索引的结构特点,在基于倒排索引和向量空间检索模型的基础上加入相应的预处理算法,提出了查询步进和文档步进的概念,并分析了由此对检索带来的影响,给出了与检索词排列顺序相关的全文检索方法.  相似文献   

4.
搜索引擎是对资源的检索机器,是网络工具的代表。要实现对信息资源的智能检索,我们要处理的问题有信息预处理、查询检索、动态知识库的构造。首先要在网络中建立全面的网页文档信息,然后建立索引库,最后当有用户进行查询时,匹配器根据关键字在索引库中进行搜索。在经过了搜索引擎的过程,面对更复杂的对象我们又开发出了智能信息检索系统。可以利用动态知识库来扩展更复多的查询对象。  相似文献   

5.
搜索引擎是对资源的检索机器,是网络工具的代表.要实现对信息资源的智能检索,我们要处理的问题有信息预处理、查询检索、动态知识库的构造.首先要在网络中建立全面的网页文档信息,然后建立索引库,最后当有用户进行查询时,匹配器根据关键字在索引库中进行搜索.在经过了搜索引擎的过程,面对更复杂的对象我们又开发出了智能信息检索系统.可以利用动态知识库来扩展更复多的查询对象.  相似文献   

6.
在归纳现有密文检索技术的基础上,提出一种针对字符型数据的加密存储与检索方案。采用两阶段查询法,通过构造索引字段存储敏感数据的结构信息,可使第一阶段的模糊查询过滤掉大部分无关记录,从而提高密文查询速率。实验结论显示,所提方案安全可用。  相似文献   

7.
WebGIS是一门发展迅速的GIS软件方法 ,它包括模型的建立、空间数据组织、数据维护及数据检索工具等多方面技术。目前WebGIS系统的查询通常是通过输入关键字或点击地图中的某个可视化对象获取地理信息 ,给需要信息统计或比较的用户带来许多不便。通过对传统GIS的分析和比较 ,提出一种实用的区域数据检索WebGIS解决方案 ,详细地介绍了数据模型的建立、数据组织及检索工具的实现方法。对在开发过程中所遇到的技术问题进行了较详细的分析并给出了解决方法。此方案用JAVA实现并在实际应用中取得较好的效果 ,本软件适用于企业产品分析、市场销售统计分析  相似文献   

8.
分析了基于常规QR-树建立空间数据索引的数据结构,常规四叉树在数据量特别大时.导致其QR-树深度特别深,占用空间大,查询效率低,并且平面区域分割极限的确定很不灵活。提出了一种改进QR-的数据模型来建立高效的空间数据索引,通过检测水平和垂直相交区域以确定图元所属节点,从而实现海量数据的快速检索。  相似文献   

9.
时间序列的研究已经被应用到越来越多的领域中.越来越多的领域应用需要索引和分析海量的时间序列,代表性的比如金融,电力,生物信息等等.这类应用往往面临数以亿计的时间序列的处理,然后从中识别出一些隐藏的模式来.然而目前对时间序列的索引技术都是单机版本,需要用漫长的时间来对大量的时间序列进行索引,限制了时间序列分析的产出率.提出了一种基于Isax表达的分布式时间序列索引算法,并在Spark分布式计算框架下实现算法.首先,给出了基于Isax的分布式索引算法的朴素实现想法,指明了其存在的问题.然后提出一种先建立索引结构,再将时间序列哈希到相应叶子节点的分布式索引算法.最终,构建了一个完整的电力时间序列的近邻近似查询系统,再保证查询精确率的前提下大大提高了计算效率.并在实验数据集上证明了算法的正确性、高效性和可扩展性.  相似文献   

10.
一个基于WebGIS的区域数据检索工具的设计及JAVA实现   总被引:3,自引:0,他引:3  
WebGIS是一门发展迅速的GIS软件方法,它包括模型的建立、空间数据组织、数据维护及数据检索工具等多方面技术。目前WebGIS系统的查询通常是通过输入关键字或点击地图中的某个可视化对象获取地理信息,给需要信息统计或比较的用户带来许多不便。通过对传统GIS的分析和比较,提出一种实用的区域数据检索Web GIS解决方案,详细地分析了数据模型的建立、数据组织及检索工具的实现方法。对在开发过程中所遇到的技术问题进行了较详细的分析并给出了解决方法。此方案用JAVA实现并在实际应用中取得较好的效果,本软件适用于企业产品分析、市场销售统计分析。  相似文献   

11.
为了提高文本信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的修正的向量空间模型(MVSM).该模型重新定义了查询索引项的内容,将修饰词与中心词组成的合成短语引入到查询语句及传统的向量空间检索模型的信息表示中,并重新计算作为特征索引项的合成短语的权重值.在此基础上,又对查询索引项使用了基于同义词词典的查询扩展策略.实验结果表明:用合成短语作为查询索引项进行检索,使检索能够在相对精确的范围内进行,提高检索查准率;对查询进行同义扩展,能够使更多的语义相关的文本被检索出来,提高检索查全率.因此,在信息检索系统中应用修正的向量空间模型能够较好地改善检索性能.  相似文献   

12.
随着XML应用的发展,利用XML发布网上信息已经逐渐成为一种趋势。如何快速、准确的获取所需的信息已经成为人们研究和关注的热点。该文在介绍XML查询及压缩索引机制的基础上,提出了基于XS树的新型压缩索引结构,并给出了XML索引更新机制的算法,该结构可有效的结合倒排索引和路径信息,实现对路径和文本内容更好的检索。实验表明查询效率高于当前的主流结构连接算法。  相似文献   

13.
一种基于双重距离尺度的高维索引结构   总被引:1,自引:0,他引:1  
为了提高高维数据相似查询的效率,提出一种基于双重距离尺度(DDM)的新型高维索引结构.通过建模得到该DDM的四元组数据结构, 对于高维空间中的数据点,通过k平均聚类算法将数据点聚成若干类,分别计算每个点对应的始点和质心距离,得到基于加权的质心距离, 并将加权的质心距离作为每个数据点的索引键值,且用基于分片的B+树建立索引,得到了该索引的创建算法.高维空间的查询就转变成对一维空间的检索,并研究了数据点的维数、数据量和查询请求参数对查询性能的影响.结果表明, 该DDM能更有效地缩小搜索空间,减少距离计算的开销,特别适合海量高维数据的查询.  相似文献   

14.
近似最短距离查询是图检索的基本模式.为了保护外包数据安全,通常对图数据进行加密.已有加密方案使用两跳覆盖模型构建加密图索引,导致索引结构复杂,降低了查询效率.本文提出了一种基于图压缩的加密机制,可以提高图的检索效率,并且支持加密图最短路径查询.该机制使用K-mediods聚类使得图中的节点按照距离分成K个簇,每个簇内的节点使用其中心节点代理,当查询2个点间最短距离时,对于相同簇内的点直接查询,对于簇间的点使用代理节点查询距离.实验结果表明该机制有效地减少了查询时间,提高了查询效率,且查询结果误差度在可接受范围内.  相似文献   

15.
针对搜索引擎搜索索引大小不同时的效率不一致问题,文中在Hadoop分布式计算平台上利用Map-Reduce框架搭建分布式的搜索引擎及查询子系统,生成一种改进的自适应性切换搜索算法,以索引文件实现了高效的检索,索引文件较小时将其直接存入内存,索引文件较大时建立二级索引并读取内存中的索引列表,进行分布式的查询,通过设置足够多的集群的节点数进行测试。测试结果表明:当索引大小达到1 000 MB,搜索时间由原始搜索算法的16.631 s缩短至7.259 s,文中方法对索引文件的搜索效率有显著提高。在索引文件更大的情况下,文中算法的优势也更明显,从而可以为网络论坛、网站以及其他用户提供高效的分布式搜索服务。  相似文献   

16.
针对大规模图像数据库的特点,用基于高斯混合模型的期望值最大(EM)算法对图像数据库进行聚类划分,为每个聚类建立索引项,且它所包含的原始特征数据在磁盘上连续存储.查询时,对于用户的查询范例首先确定最可能的候选聚类,然后在候选聚类范围内查询翔实图像.试验结果表明,该方法可提高图像检索速度.  相似文献   

17.
为了加强云计算数据查询的安全性,防止用户数据查询过程中过度访问和检索过程的数据泄露,提出一种云计算服务端的数据安全索引构建方法.对图状部署的云计算数据采用相似子图和哈希函数进行构造,通过特征子结构将被查询对象与索引图状数据进行对比,找出被查询对象.该方法可防止非查询对象的图状数据泄露,同时将哈希函数对节点进行了散列,提高了节点安全性.仿真结果表明,该方法数据查询效率高,耗费存储资源少,安全性好.  相似文献   

18.
提出一种快速的反向k近邻查找算法,该方法利用现代计算机具有外存便宜、运行速度快的特点,预先计算数据之间的距离,并组织为数据索引块存储于外存,由计算机在空闲时自动进行维护.在进行反向最近邻查询时,只需读入相应的索引块,就可进行直接查询,其时间复杂度为O(N),而且不受k的影响.为减少索引块的读取时间,提出一种改进方法来有效地压缩索引块,仅用必要的二进制位来存储对象之间的距离,并将冗余减少到最低水平,提高了算法的效率.最后通过实验分析评估算法的有效性和效率.  相似文献   

19.
目的设计基于网格索引的Top-k偏好查询算法,提高Top-k偏好查询问题的解决效率.方法利用网格索引,采用概念划分的方法,实现基于范围查询和NN查询两种方式的Top-k偏好查询算法.结果通过真实数据集测试结果表明算法能够结合网格索引的优点,与基于R树索引的传统算法相比,在k值不断增加的情况下,查询效率提高了50%,能适应多种空间特征数据对象集合.结论网格索引可以有效处理Top-k偏好查询.  相似文献   

20.
数字图书馆中文本信息检索技术的研究与实现   总被引:3,自引:0,他引:3  
介绍了一个并行数字图书馆原型系统PDL,和用于该系统的针对文本信息检索的一些数据结构,包括倒排索引,结构索引,RANK索引和词典等,并在此结构的基础上设计实现了基于内容和结构的查询算法。这些算法以计算机机群并行环境为基础.实验表明并行数据查询具有良好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号