首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
目前RDF数据上关键字查询转换为结构化语句的算法主要支持对于一般图元素的查询,而无法转换为包含聚合操作的结构化语句。关键字存在大量候选解释,且可能同时匹配聚合操作或图元素,这导致查询中聚合意图的理解非常困难。对此,提出将关键字查询自动转换为可能包含聚合操作的SPARQL语句的算法。算法对SPARQL所支持的聚合操作进行分类,获得关键字与聚合类别的匹配字典,进行关键字映射,计算关键字可能指示聚合意图的概率,确定候选查询解释,并利用模式图获得查询意图,设计意图分数计算方法和查询转换算法,得到对应的查询语句。LUBM和DBLP数据集上的实验验证了算法的有效性和准确性。  相似文献   

2.
基于Small-World网络的非结构化DHT算法   总被引:5,自引:0,他引:5  
目前,非结构化的P2P路由算法面临着搜索效率低下的严峻问题,这严重影响了非结构算法的应用领域.提出一种基于关键字聚类的分布式哈希表算法,主要思路是将环状关键字空间分成上下两层,下层(AUT层)负责关键字管理,上层(HUB层)负责节点路由.每个节点用一个随机数值作为它的聚类中心,从过往的路由消息中本地节点将抽取文件关键字和节点聚类中心,以聚类原则将这些数据记录到本地路由表中.除了改进非结构化算法的数据组织无序性,另一个目标是提高搜索效率.于是,上述算法的增强算法利用了small-world理论,在HUB层中加入远距离节点的聚类中心,将确定性聚类转化为概率性聚类,故能保证路由长度为O(log^2N).  相似文献   

3.
限于目录索引接口的查询能力.为了优化采用这种接口的信息查询系统.讨论了通用的基于目录索引的信息查询系统,提出一种优化算法通过对查询条件和查询结果进行分析、提取.构造出相关文档的关键字树.并基于关键字树对查询进行重写.生成由关键字组成的新的查询序列.使用生成的关键字序列重新搜索文档.比较两次查询结果并对其进行优先级排序.输出优化后的查询结果。实验结果证明本文提出的查询优化方法能够获得具有更高查全率(recall)和查准率(precision)的查询结果。  相似文献   

4.
基于Spark Streaming计算框架的分布式Top-K关键字查询是统计流数据中所有关键字的热点研究问题。多数研究通过限定存储空间来实现Top-K关键字查询,并假设关键字集合已知。针对这个问题,提出一种可应用于关键字集合未知情况的分布式Top-K关键字查询算法,根据监测到的关键字动态地调整存储空间,通过更新策略的优化提升其精度。实验结果表明,该算法的性能在关键字集合未知的情况下比现有算法更优。  相似文献   

5.
Dual-Chord:一种更加有效的分布式哈希表   总被引:9,自引:0,他引:9  
在基于分布式哈希表构造的对等网中,关键字的搜索效率一直是一个非常重要的指标.Chord提出在Chord环上构建结构化的分布式哈希表.Chord协议中查找的过程是单一的顺时针方向.Dual—Chord通过对路由表的扩展,使得系统的查找策略可以根据关键字在Chord环上位置离当前节点的远近来确定查找的方向,这样大大的提高了在对等网中的查找效率.同时,Dual-Chord综合考虑了网络延时对查找的影响.在设计中也根据节点间的网络延时来优化查找的性能.实验表明,在对等网中Dual—Chord协议定义的查找算法效率比Chord定义的查找算法要高.  相似文献   

6.
郑诗敏  秦小麟  刘亮  周倩 《计算机科学》2017,44(3):10-15, 35
基于Spark Streaming计算框架下的分布式突发关键字查询是监测流数据中关键字突发时间的热点研究问题。多数研究方法存储统计所有的关键字,并未考虑热点关键字。在数据呈爆炸式增长的背景下,获取热点关键字的突发时间更具有价值。针对这个问题,提出一种分布式突发关键字查询算法,该算法采用动态的更新策略,通过设置检查点的方法提取热点关键字,并在线性的时间内查询突发的时间范围。实验结果表明,该算法的性能比现有算法更优。  相似文献   

7.
本文以事务管理信息系统为基础,提出了一种映射排序算法。该算法的特点是把记录关键字值映射于数组下标用记数方式反映关键字值情况,数组元素下标自然把关键字值一次定好了位置,这样,可以不实施反复比较与交换操作。这种映射排序算法与比较交换排序法相比,有较高的效率,适宜在计算机大规模信息处理中广泛采用。  相似文献   

8.
一种基于的统计的排序算法   总被引:1,自引:0,他引:1  
本文提出了一种基于统计的快速排序算法,并对该算法的时间复杂度和空间复杂度进行了分析,该算法要求排序关键字满足一定的约束条件,其时间复杂度为O(n),对该算法做一些简单的修改,还可以将其推广到一般关键字的排序问题。  相似文献   

9.
该文结合哈希表提出一种多关键字的排序算法,该算法根据数据元素的关键字转换,利用哈希表的地址映射实现数据元素在有序序列中的位置,从而通过减少关键字比较及移动使排序算法得到优化。算法基于哈希表改进而来,在特殊多关键字排序中具有一定的应用。  相似文献   

10.
一个好的数据库逻辑设计目标是消除数据冗余以及插入、删除和更新异常.对于时态数据库也是如此.提出了时态初等函数依赖、时态初等关键字、时态简单关键字等概念,在此基础上利用具有多时间粒度的时态函数依赖(TFD)约束对时态数据库进行了规范化研究,提出了规范程度高于时态三范式低于时态Boyce—Code范式的时态初等关键字范式(TEKNF)及时态简单范式(TSNF),并研究了时态初等关键字范式和时态简单范式的分解问题,给出了相关分解算法,并对算法的可终止性、正确性进行了证明,对时间复杂度进行了分析.  相似文献   

11.
本文讨论了对象依赖集合和关键字的一些性质,首先给出有关对象依赖(OD)和关键字等的基本概念,然后讨论对象依赖的一些性质,最后给出并证明获取一个OD集合的所有关键字的JINGSI算法。  相似文献   

12.
确定候选关键字是关系数据库的理论研究和应用设计中非常重要的问题,求解候选关键字是一个NP-完全问题。文章提出了一种快速求解候选关键字的算法,该算法利用关键字本身的属性,采用特殊的剪枝策略,可大大减少非关键字的生成,并显著地降低I/O时间和CPU时间,尤其是当候选关键字的维数较小时,可以急剧降低算法的复杂度。  相似文献   

13.
在关系型数据库的设计过程中,在审查一个关系模式的规范化程度时,都必须求出关系模式的关键字,有时甚至需要找出所有的关键字。对给定的关系模式R(U)及R上的函数依赖集F,对属性子集X来说,如有F逻辑蕴涵X→U,或说X的属性闭包X+=U,则X为一个超关键字,若X上无冗余属性,X即为一个关键字。但选择哪个属性组来审查它能否满足以上条件并无特征可循,所以目标选择是盲目的。本文给出一个求关键字的算法以及分析证明。这个算法并不针对某个确定的属性组,而是面向属性全集,所以一定能选出关键字。  相似文献   

14.
本文以文献管理系统为基础,介绍了关键字映射索引算法和相似文献分类算法。关键字映射索引算法使关 键字与文献存贮地址直接映射,不实施反复比较操作,有较高效率;相似文献分类算法是智能检索的初步探讨。两算 法适宜今后在计算机信息处理中广泛应用。  相似文献   

15.
武继刚 《微机发展》1995,5(3):11-13
本文基于数排序的思想,从高位关键字开始,对m位关键字的n个记录进行扫描,给出了一个多元选择算法,算法的最坏复杂度为O(m(n+r)),但平均复杂度为O(n+r)。  相似文献   

16.
新的关键字提取算法研究   总被引:2,自引:0,他引:2  
传统的关键字提取算法往往是基于高频词提取的,但文档中的关键字往往并不都是高频词,因此还需要从非高频词集中找出关键字.把一篇文档抽象为一个图:结点表示词语,边表示词语的同现关系;并基于文档的这种拓扑结构,提出了一种新的关键字提取算法,并和传统的关键字提取算法作了比较,在精确率,覆盖率方面均有不错的效果.  相似文献   

17.
确定候选关键字是关系数据库的理论研究和应用设计中非常重要的问题,求解候选关键字是一个NP-完全问题。文章提出了一种快速求解候选关键字的算法,该算法利用关键字本身的属性,采用特殊的剪枝策略,可大大减少非关键字的生成,并显著地降低I/O时间和CPU时间,尤其是当候选关键字的维数较小时,可以急剧降低算法的复杂度。  相似文献   

18.
子域散列检索算法   总被引:1,自引:0,他引:1  
虽然现在有许多不同的检索算法,但可以把它们分成两类:一类建立在比较基础上,效率不高;另一类称为散列算法,由于考虑了关键字与信息记录存贮地址间的关系,故效率较高。但是,现有的散列算法必须在不同情况下分析关键字,才能构造出好的Hash函数,保证提高效率。本文提出一个新的Hash函数构造方法-子域散列检索算法,其特点是在不同关键字情况下可以用相同映射方法来建立索引。这一算法不仅提高了效率,而且解决了一…  相似文献   

19.
对于时态数据库的设计来讲,一个重要的约束就是候选关键字约束。在实际应用系统设计中,根据应用环境要设计时态模式,并对模式进行规范化处理。无论需要满足哪种范式,都涉及候选关键字问题。目前已提出的时态初等候选关键字,时态简单候选关键字都有其相对应的范式TEKNF和TSNF。在此基础上,在强全序模块模式下提出了时态强简单候选关键字的概念,给出明确的定义。并且给出了强全序候选关键字算法以及求取强简单候选关键字集算法,对算法的可终止性,正确性进行了证明。并对算法的复杂度进行了分析。同时初步定义了相对应的时态强简单范式。  相似文献   

20.
本文介绍了映射式排序算法,这种算法附加一定的存储开销,时间复杂性为O(N)。在此基础上,本文还提出了一个新的K路合并算法,关键字与数相下标作映射和链接处理,不实施反复比较和交换关键字的操作,时间复杂性达到O(N),适宜一类特殊问题的大规模信息处理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号