首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
网格数据库是数据库技术和网格技术相结合后新的研究领域,网格的动态变化特性对数据库查询优化技术提出了适应性的要求。本文提出了基于Petri网描述的子查询计划模型TNSN,通过扩展子查询及其节点的数据关联关系的描述,建立了子查询进行适应性优化调度的查询计划模型;进一步提出了考虑变化的参数在内的耗费估算模型,并在TNSN和耗费模型的基础上提出了适应性优化算法,保证了查询处理过程中可以根据网格参数的变化情况对查询进行适应性调整,最后给出了实验验证。  相似文献   

2.
基于数据网格面向服务的查询算法   总被引:1,自引:0,他引:1  
面向服务的框架(SOA)为用户的服务提供了一个标准的平台,实现服务的提供、发现、配置和集成,以帮助用户查询和处理信息.数据网格是面向服务的架构,为用户进行分布式远程数据查询服务提供了保障.对网格环境下Hidden Web数据库的研究与开发逐渐成为人们关注的焦点问题.要回答用户的查询,数据集成系统需要解决网格上的需求语义分析和关键字查询、建立数据查询模型.将数据库抽象为无向图,节点对应数据库中的元组,边对应“主-外码”的关系.查询的结果是与元组连接的答案树,它与查询的关键字相匹配.针对以上这些问题提出了一个新的查询算法,将改进的动态规划算法用于查询模型,保证Top-1答案树最优,Top-K答案树近似最优;给出了实验测试和评估结果.  相似文献   

3.
AnyQuery是一种适用于网格环境、基于服务的分布式查询处理系统,使用统一的数据格式(可扩展标记语言)来表示和传输数据,所有组成模块以网格服务的形式实现,网格服务之间通过标准的接口进行通信.这种接口和实现分离技术屏蔽了不同数据库及其运行节点的差异,为用户提供一致的虚拟关系数据视图和分布式数据查询支持.在分析和研究已有的并行数据库和分布式数据库查询技术的基础上,AnyQuery提出和实现了一种适用于动态网格环境的分布式查询计划生成和执行算法,该算法能够根据网格环境中各节点及其连接网络的实际情况确定查询计划,支持跨数据库的连接查询.基于Globus 3.0开发了AnyQuery的原型系统,性能测试表明该系统具有较好的可扩展性,尤其适合计算密集型的复杂查询.  相似文献   

4.
时序相似性搜索是时序数据分析最基本的操作之一,具有广泛的应用场景.针对现有分布式算法无法应对维度增长、扫描范围过大和相似性计算耗时的问题,提出一种面向键值存储的分布式时序相似性搜索方法KV-Search.首先对时序数据分块,并设计其键值存入键值数据库,解决了时序数据维度高且不断增长的问题;其次,基于切比雪夫距离计算其下界,并利用键值范围扫描提前过滤无效数据,减少了数据传输;最后,利用基于分块的时序表示计算距离下界,避免了更高维度真实数据的计算,加快了查询效率.使用HBase实现了KV-Search,并利用真实的大规模数据集做了大量实验.实验结果表明, KV-Search算法在效率和扩展性方面均优于基准实验.  相似文献   

5.
基于CORBA的跨平台跨数据库通用查询设计   总被引:2,自引:0,他引:2  
梁寿愚 《计算机工程》2003,29(11):82-84,110
论述某电力部门异构分布式计算机系统集成接口软件数据库查询的解决方案。该方案是一个分布式异构系统跨平台、跨数据库、可扩展和可处理多用户请求的数据库查询的通用解决方案。文章给出了测试结果,为各大型企业的异构分布式计算机系统的数据集成提供一个很好的参考。  相似文献   

6.
数据查询操作是数据库应用系统中最常用的操作。在数据库结构比较复杂的情况下,为终端用户提供友好的数据查询平台尤为重要。设计了一种在PowerBuilerER环境下实现高效,灵活的万能查询的方法。该方法在珠海市公共汽车公司人事、户籍计算机管理系统的开发中得到了成功应用。  相似文献   

7.
处理分布式环境下高速数据的最大挑战在于如何利用少量网络资源输出高质量的查询结果。对面向分布式环境的最近邻查询问题进行了研究,提出了一种基于过滤器的新方法,不仅能计算精确查询结果,还能够处理五类近似查询。该方法在各个远程站点均安装了智能过滤器,并通过合理设置过滤器的范围来降低数据传输量。理论分析及基于模拟数据集合和真实数据集合的实验报告均表明新方法具有较高的性能。  相似文献   

8.
当海量RDF数据存储在分布式平台上时,数据划分的策略将直接影响海量数据的查询效率。为了提高分布式平台上的海量数据查询效率,提出一种基于分布式平台的有效数据划分方法。该方法根据RDF数据图的特征将数据分布在集群的各个节点上,并在此基础上对SPARQL查询语句进行分解,实现高效的分布式查询。算法在云平台上实现,并在真实的RDF数据集上对算法进行了测试。实验结果证明,与基准方法相比,该算法在查询效率上有很大的提高。  相似文献   

9.
最近邻查询在多个领域具有广泛的应用,如组合过滤、基于位置的服务、决策支持系统等。而且随着Web信息实体抽取、隐私保护信息转化、图像识别等技术的发展和普及,在诸多领域,不确定性文本数据普遍存在,基于信息论的TF-IDF算法,可以将文本型的相似匹配转化为数值型的向量的计算,具有严密性和有效性。但TF-IDF信息的余弦距离不属于度量空间,难于构建索引。为此主要研究了面向不确定文本数据基于余弦相似度的相似性查询方法。通过分析不确定性余弦相似度计算的特性,提出了快速相似度计算方法。通过对余弦距离的计算进行转换,构建改进的索引结构s MVP-tree(statistic multiple vantage point tree),并给出了基于余弦相似度面向不确定性数据的相似度计算方法。最后,结合该相似度计算方法提出了分布式环境下k NN查询和Rk NN查询算法。大量的基于真实数据的实验验证了算法的正确性和有效性。  相似文献   

10.
张霞  陆剑江  杨季文 《计算机工程与设计》2005,26(5):1259-1261,1273
Notes是用于开发和安装群件的软件平台。Notes中的数据库不但具备分布式丈档数据库等特点,而且还提供了强大的数据库检索功能;但在Notes中,如何对集中式多库查询和分布式多库查询返回的结果集进行整合以及显示则是一个难点。以架构在Notes平台上的OA系统为研究对象,从分布式多库查询、查询结果集整合以及整合数据的浏览等角度出发,通过研究提出了基于规则知识库的整合策略,并分别对Notes中基于文件夹和基于表单的结果集浏览方式提出相应的解决方案;讨论了Notes数据库查询中存在的一系列安全性问题。  相似文献   

11.
在收益半连接的研究基础上,对查询执行代价模型进行研究,提出一种包括数据副本选择、多连接查询次序、操作站点选择、数据传输及局部数据处理等因素的代价模型,能准确地描述当前分布式数据库查询执行计划的代价,更具有实际意义。  相似文献   

12.
基于循环神经网络的数据库查询开销预测   总被引:1,自引:0,他引:1  
数据库负载管理、性能调优中,开销预测模型是提高其效率的关键技术。首先,由于数据库系统的复杂性和计算机资源的竞争,很难精确地估计不同操作的开销。其次,由于查询计划结构的复杂性,现有研究更多使用笼统的查询信息,而很少利用查询计划中操作层面的信息,并依据这些信息来获得开销模型。另外,现有的研究大多没有真正预测查询的执行时间,而是预测了类似查询优化器中开销模型生成的开销。为了减少负载管理的复杂性,本文提出了基于循环神经网络的精细模型来预测查询开销,以查询计划中的操作行为和其实际运行时间作为特征提取的来源。特别地,考虑到查询计划结构的复杂性,本文采用一种特殊的循环神经网络,长短期记忆(Long-Short Term Memory,LSTM)。给一个特定的查询计划,在该计划实际执行之前,模型就能产生其预测的执行时间。这会比现有数据库的查询优化器产生的开销预估结果(任意单位)更具有参考性;也优于需要在执行开始之后才能预测的查询进度指示器。本文提出的这种创新方法来预测查询执行时间,可以用于解决数据库负载管理中的关键问题。通过实验验证,模型的正确率高于71%,一定程度上证明了方法的可行性。  相似文献   

13.
隐私问题受到越来越多的关注,基于计算的私有信息检索(CPIR)的隐私保护技术允许用户从服务提供商检索数据并且不会泄露查询信息。但是,对于大规模应用,隐私保护技术与可用性之间存在较大差距。针对CPIR算法计算量大、计算时间长而不适合应用于大规模数据隐私保护的问题,提出了基于Spark和Huffman编码的CPIR最近邻查询隐私保护算法(H-PCPIR-V)。H-PCPIR-V算法主要是在数据预处理阶段将最近邻矩阵使用Huffman编码进行压缩减少计算位数,然后通过压缩后矩阵中元素的最大位数对其他元素进行补位,在服务端使用Spark并行框架对查询网格进行并行计算。通过对比实验及实验结果分析发现,相比PCPIR-V算法,H-PCPIR-V算法在服务端的计算代价下降30%左右,客户端的计算代价下降10%左右,通信代价下降40%左右。  相似文献   

14.
在云计算环境中既能同时保护数据隐私和用户查询隐私,又能提供给用户满足需求的查询结果是云计算中面向隐私保护的查询处理的关键问题。对云计算中面向隐私保护的查询处理技术的若干关键问题进行了全面的调研,包括数据库索引技术与查询优化、基于加密的隐私保护技术、基于安全多方计算的隐私保护技术以及查询结果完整性验证技术。分析了云计算中面向隐私保护的查询处理技术的挑战性问题,指明了未来研究方向。  相似文献   

15.
View-objects are complex objects that are instantiated by delivering a query to a database and converting the query result into a nested structure. In relational databases, query results are conventionally retrieved as a single flat relation, which contains duplicate subtuples in its composite tuples. These duplicate subtuples increase the amount of data to be handled and thus degrade performance. In this article, we describe two new methods that retrieve a query result in structures other than a single flat relation. One method retrieves a set of relation fragments, and the other retrieves a single-nested relation. We first describe their algorithms and cost models, and then present the cost comparison results in a client-server architecture with a relational main memory database residing on a server.  相似文献   

16.
数据库数据量日益增多,造成了用户在使用数据库系统查询时费时费力,传统的查询优化方式已无法满足如今的数据查询要求,提高数据库系统优化的效率也成为计算机研究工作的热点。提出基于半连接算法的分布式查询处理技术对数据库系统进行查询优化,提出半连接操作的查询优化算法(SDD-1),并采用实验分析的方法进行验证,计算查询算法的代价。结果表明,基于半连接的研究策略的分布式数据库查询优化可以显著降低传输代价,使查询总效率得到有效提高。  相似文献   

17.
在MapReduce与数据库的混合架构中,数据划分是影响查询性能的重要因素。对于开销最大的连接和聚集操作,采用混合MapReduce的方式实现,需要大规模数据的跨结点传输,网络传输和I/O开销巨大。为了减少传输的数据量,并提高连接操作的查询效率,提出了划分建议器模型。实现了MapReduce和数据库混合架构上的划分建议器,并计算划分代价,生成最优的数据划分方案,提高了系统效率。为了减少查询时间,依据划分建议器模型,提出了基于代价优先的生成策略和空间搜索算法,减少了划分建议器生成最优方案的时间。通过实验验证了划分建议器的有效性,使系统的整体查询代价最小,显著提高了系统性能。  相似文献   

18.
胡罡  刘丽霞  周航军  黄震  彭宇行 《软件学报》2014,25(5):1113-1124
在无线认知网络的协作式频谱感知方案中,非授权用户(次要用户)将各自感知到的可用频谱信息转发给邻居节点,作为频谱分配的依据.而实际上,仅有部分数据影响着频谱分配的结果.无用信息的传递不仅产生了大量额外的通信开销,而且在频谱分配过程中浪费了计算资源.这种情况对于频谱资源稀缺的无线认知网络和能量有限的认知终端来说是无法接受的.因此,如何减少无用信息的传递是一个具有重大实际意义的问题.基于skyline查询处理,提出了多目标约束下skychannel查询处理方法,以减少冗余感知信息传递.其基本思想是:将数据空间划分为控制区域、被控区域和自由区域,按照信道的性能参数,将要查询的信道放入相应区域.传输时,直接忽略被控信道的信息而仅传输非被控信道的数据.在保证不影响频谱分配结果的前提下,可以大量降低网络开销,节约用户的计算资源.仿真结果显示,skychannel查询方法在节约查询时间、降低通信开销和计算开销等方面具有优势.  相似文献   

19.
安全查询是指参与查询的用户一方与拥有数据库的一方在各自的私有信息互不泄露的情况下,完成查询操作。该文描述了解决查询问题的2套方案:方案1基于两方的安全计算协议,尝试将Equijoin协议应用于安全查询问题。虽然该方案安全性能高,但是由于加密通信代价太大,因此很难适应对大型数据库的查询;方案2将软件作为可信第3方的协议,只要该软件不被破解,就可确保查询用户与数据库的信息不被泄漏,尽管其安全性低于方案1,但运行代价低,方案2是一个实用的解决方案。  相似文献   

20.
在数据库操作中查询操作所占比重最大,而查询操作又是代价最大的语句。在数据查询操作过程中,每种类型的操作发生的代价各不相同。本文结合实例,提出对查询过程中的诸如投影、选择、连接、分组与聚集等操作代价的估算方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号