首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
一种高效的P2P环境中的窗口查询算法   总被引:1,自引:0,他引:1  
随着多媒体以及P2P网络的发展,针对高维数据基于属性的窗口查询已经成为一个重要研究课题.提出了一种在超级节点P2P网络中有效解决高维数据的窗口查询算法,在每个单独的网络节点上,数据通过一种降维算法映射到一维空间,在超级节点上,构造数据的统计信息表以及构造网络查询树,算法在每次查询时,按照查询树的规则来访问整个网络,并利用统计信息剪枝网络中的节点查询,避免网络的泛洪.实验中使用了不同的数据集来评测算法的查询效率,结果表明该算法具有很高的查询效率.  相似文献   

2.
对信息网络数据集进行面向主题、多维、多层次的在线分析处理(on-line analytical processing,OLAP)面临数据规模爆炸,问题复杂性剧增等技术难题,传统OLAP技术不再适用。提出了面向信息网络的在线图处理(on-line graphic processing,OLGP)模型,OLGP包含节点集合、边集合、信息维集合,每个节点包含拓扑维集合;设计并实现了OLGP模型的核心操作(信息维上卷、拓扑维上卷、异步上卷)算法。对含有17431位作者的12499篇ACM论文的真实合作者网络数据集进行了相关分析处理,结果表明,信息维上卷仅需要113ms,拓扑维上卷仅需要61ms。  相似文献   

3.
基于异构信息网络嵌入的推荐技术能够有效地捕捉网络中的结构信息,从而提升推荐性能.然而现有的基于异构信息网络嵌入的推荐技术不仅忽略了节点的属性信息与节点间多种类型的边关系,还忽略了节点不同的属性信息对推荐结果不同的影响.为了解决上述问题,提出一个自注意力机制的属性异构信息网络嵌入的商品推荐(attributed heterogeneous information network embedding with self-attention mechanism for product recommendation, AHNER)框架.该框架利用属性异构信息网络嵌入学习用户与商品统一、低维的嵌入表示,并在学习节点嵌入表示时,考虑到不同属性信息对推荐结果的影响不同和不同边关系反映用户对商品不同程度的偏好,引入自注意力机制挖掘节点属性信息与不同边类型所蕴含的潜在信息并学习属性嵌入表示.与此同时,为了克服传统点积方法作为匹配函数的局限性,该框架还利用深度神经网络学习更有效的匹配函数解决推荐问题.AHNER在3个公开数据集上进行大量的实验评估性能,实验结果表明AHNER的可行性与有效性.  相似文献   

4.
传统的犯罪查询的查询条件是文本信息,查询结果是有序的文档列表,这种方式无法展示结果之间的关系.基于异构信息网络以信息网络的形式重构假币犯罪信息数据,构建了假币犯罪信息网络,使用人名消歧的技术建立假币犯罪信息网络中嫌疑人之间的关系,并使用排序学习方法研究假币犯罪信息网络中的节点相关性问题,设计并实现了假币犯罪信息分析系统,通过以实体对象为查询项和网络图为查询结果的方式解决假币犯罪数据的查询问题.  相似文献   

5.
刘彬  程凯  于杰 《计算机系统应用》2018,27(12):210-215
针对传统单稀疏表存储模型存储空间利用率低以及块表存储模型重构租户逻辑关系时连接次数多的问题,提出了稀疏表与块表结合的存储模型.该存储模型中将租户基于SaaS应用服务商提供的逻辑表上定制的属性及自定义的逻辑表中的属性映射到列数合适的稀疏表中存储,而将租户一部分常见数据类型的自定义的属性存储到块表中,以此避免因扩展字段的列数超过稀疏表列数导致的数据迁移问题,最后通过定义查询重写器给出了从租户逻辑SQL请求到物理SQL请求的转换.实验结果表明,该存储模型在存储空间利用率及查询效率上相比传统的稀疏表存储模型都有所提升.  相似文献   

6.
吕刚  郑诚  胡春玲 《计算机应用》2011,31(5):1367-1369
为提高信息检索效率,提出基于路径的网络本体语言(OWL)存储模型,首先设计了转换和存储OWL数据的方法,实现构建包含有类和属性层次结构关系的数据图,然后通过深度优先搜索(DFS)算法建立从根节点的类和属性信息到每个节点的类和属性信息的路径,再将这些信息存储到设计的关系数据库表中。通过实验与现有方法进行了比较,在查询处理时间和本体更新时间性能方面都有改进,方案具有可行性。  相似文献   

7.
刘光明  任艳  李川  杨宁  唐常杰 《软件学报》2017,28(3):732-743
信息网络数据立方(InfoNetCube)的计算是进行信息网络在线分析处理的基础.然而,不同于传统的数据立方,信息网络数据立方由多个子方体格组成,每个方体格中的任意方体(cuboid)的任意单元格都包含一个主题图(或称图度量),因而空间开销较传统数据立方大2个数量级以上.如何快速、高效进行信息网络数据立方的部分物化是极具挑战的研究课题.本文提出基于“透析计算”思想的信息网络立方物化策略,通过主题图度量在信息维和拓扑维上反单调性运用,提出基于“透析计算”的空间剪枝算法,快速透析掉不可能命中的子图度量、方体单元、方体乃至方体格.实验结果表明,本文提出的基于“透析计算”的部分物化策略,可以对信息网络方体进行有效剪枝,算法较基于基本方体的部分物化策略运行时间平均降低75%.  相似文献   

8.
针对基于图卷积的自编码器模型对原始图属性和拓扑信息的保留能力有限、无法学习结构和属性之间深度关联信息等问题,提出基于多通道图卷积自编码器的图表示学习模型。设计拓扑和属性信息保留能力实验,验证了基于图卷积的自编码器模型具备保留节点属性和拓扑结构信息的能力。构建特定信息卷积编码器和一致信息卷积编码器,提取图的属性空间特征、拓扑空间特征以及两者关联特征,生成属性嵌入、拓扑嵌入和一致性嵌入,同时建立与编码器对称的卷积解码器,还原编码器过程。使用重构损失、局部约束和一致性约束,优化各编码器生成的低维嵌入表示。最终将蕴含不同图信息的多种嵌入进行融合,生成各节点的嵌入表示。实验结果表明,该模型在BlogCatalog和Flickr数据集上节点分类的Micro-F1和Macro-F1明显高于基线模型,在Citeseer数据集上节点聚类的精度和归一化互信息相比于表现最优的基线模型提升了11.84%和34.03%。上述实验结果证明了该模型采用的多通道方式能够在低维嵌入中保留更丰富的图信息,提升图机器学习任务的性能表现。  相似文献   

9.
异质信息网络表示学习在节点分类、链接预测、个性化推荐等多个领域上被广泛应用.现有的异质信息网络表示学习方法大多集中在静态网络,忽略网络中时间属性对节点表示的影响.为了解决该问题,文中提出基于元路径和层次注意力的时序异质信息网络表示学习方法.利用元路径捕获异质信息网络中的结构和语义信息.通过时间衰减注意力层,捕获不同元路径实例在特定时间对目标节点的影响.通过元路径级别注意力,融合不同元路径下的节点表示,得到最终表示.在DBLP、IMDB数据集上的实验表明,文中方法在节点分类和节点聚类任务上均可达到较优效果.  相似文献   

10.
《微型机与应用》2016,(9):81-84
根据基于OLAP的what-if分析的查询特点,使用分布式并行处理技术解决what-if分析性能较低的问题。以星座模型为基础的what-if分析中,将多维聚集查询分布到不同计算节点进行聚集计算,然后将各个计算节点的聚集计算结果合并输出。该方法根据基于OLAP的what-if分析中其维表远远小于事实表的特性,将事实表中的记录进行水平分片,充分利用各节点计算和I/O处理能力,以解决OLAP查询中计算密集型及I/O消耗过大的难题。在该方法中,随着计算节点数目的增加,其查询时间随之减少,有效地提升了分析效率。  相似文献   

11.
张大为  郭京京 《软件》2023,(2):27-31+36
针对二维表生成知识图谱的节点冗余问题,单表知识不足和多源数据库表在没有关系约束的前提下难以形成表间的映射问题,本文提出一种基于二维表数据的知识图谱融合构建方法。首先利用TKGC方法自行选出的核心属性与其他属性之间构成的<属性值、属性名、属性值>三元组生成单表知识图谱,然后利用SNF融合方法或者SRF融合方法对不同类型的二维表知识图谱进行融合,最后实现基于Neo4j的可视化存储。利用4个真实数据集进行实验,可视化结果证明图谱构建真实有效,融合后整体关系节点比增加了22.3%,关系数量增加了10.5%,增强了图谱联合查询和知识挖掘能力。  相似文献   

12.
通过对分布式列存储机制下多维数据仓库模型的研究,考虑到多维数据仓库模型上的关联和聚集操作常常会引入大量的数据迁移,提出一种有效的列存储机制下多维数据仓库模型的优化方法即结合层次编码技术。采用维表层次全局域编码和维表层次局部域编码相结合的方式对传统星型模型维表中的层次信息进行二进制编码整合,将维表的层次信息压缩进事实表形成无连接星型模型,并针对新模型下的数据特征提出一种复合压缩策略,以期减少分布式列存储机制下的OLAP操作引入的数据迁移并降低数据存储空间,提升系统的查询性能。实验结果表明,该优化方法是可行且有效的。  相似文献   

13.
网络表示学习旨在为网络中的组件(节点、边、子网络等)学习出低维的表征向量,使得这些向量能够在最大程度上保留组件在原网络中的特性。异质信息网络是由多种类型的节点、链接关系以及属性信息组成的网络,具有动态性、大规模和异质性等特点,在现实生活中普遍存在。融合多种异质信息进行网络表示学习,能在一定程度上解决数据稀疏问题,同时有助于训练出具有高区别力和推理能力的表征向量。但与此同时,也面临着如何有效处理复杂数据关系以及平衡异质信息的挑战。近年来,研究者们针对异质信息网络设计了不同的表示学习算法,在很大程度上推动了该领域的发展。针对这些算法,首先设计一个统一的分类框架,接着对各类别下的代表性算法进行概括介绍和比较,分析它们的时间复杂度和优缺点。此外,分类汇总了实验中的常用数据集。最后给出了该领域的挑战和未来可能的研究方向。  相似文献   

14.
提高多表连接和聚集操作性能是OLAP查询中的关键问题之一。本文提出了一种基于间接索引桶的OLAP分组聚集查询算法MIBGA。该算法将维层次编码和事实表标识符分组集合进行有效结合,用间接索引桶代替目前流行的位图连接索引,并通过分组属性位图的位操作方式来快速完成OLAP查询。分析表明,该方法压缩了索引的存储空间,减少了I/O开销,有效地提高了多表连接的查询效率。  相似文献   

15.
现实世界中存在着大量包含多种类型的对象和联系的异构信息网络,从中挖掘信息获取知识已成为当前的研究热点之一.基于图正则化的半监督学习在近年来得到了广泛的研究,然而,现有的半监督学习算法大都只能应用于同构网络.基于同构节点和异构节点的一致性假设,提出了任意结构的异构信息网络上的半监督学习的正则化分类函数,并得到分类函数的闭式解,以此预测未标记节点的类别.提出了异构信息网络上的半监督学习的迭代框架,标记节点的信息可以在邻近的节点上迭代传播,直至达到稳定状态,并证明了迭代算法将收敛于正则化分类函数的闭式解.DBL P数据集上的实验表明该方法优于经典的半监督学习算法.  相似文献   

16.
针对当前大部分影响力最大化算法忽略了异质信息网络包含多种节点类型和多种关系类型,且不同类型节点在原始空间无法直接度量的问题,提出了一种异质信息网络中基于网络嵌入的影响力最大化模型(influence maximization based on network embedding,IMNE),用于选择初始扩散节点实现影响力最大化。该模型不仅可以在对异质信息网络进行编码的同时表征异质信息网络中潜在的信息,还可以捕获不同类型节点间影响力的不确定和复杂性。在3个真实数据集上的实验验证了IMNE算法的有效性。  相似文献   

17.
数据仓库中的事实数据一般以最小粒度存储。而大量的细粒度数据具有很大的随机性,很少直接进行分析和处理,往往被聚集到一定层次的粗粒度数据。另一方面若采用ROLAP存储数据,则大量的细粒度数据将会影响查询的效率。本文介绍了一种基于时间维层次查询频率的粒度调整模型,它能根据用户在时间维层次的查询频率实现对数据粒度的调整。  相似文献   

18.
n维的立方体将生成2n个聚集立方体.如何进行立方体计算,在存储空间和查询时间方面寻求平衡,成为多维分析应用中的关键问题.基于部分物化的策略,并结合水利普查数据特征,改进Minimal cubing方法,提出了层次维编码片段方法HDEF cubing.该方法利用编码长度较小的层次维编码及其前缀,快速检索出与查询关键字相匹配的层次维编码,减少了多表连接操作,从而提高查询效率.以水利普查数据为例,验证了改进的立方体计算方法能高效地对立方体进行存储和查询,适用于水利普查成果分析.  相似文献   

19.
小规模、分布集中的WSNs(Wireless Sensor Networks,无线传感器网络)适宜采用平面路由协议,但在平面路由协议中,传统的洪泛路由算法以广播的方式在整个网络中传输查询请求和查询结果数据帧,消耗了较多的传感器节点能量,导致节点过早失效.论文对传统的洪泛路由算法进行改进,提出并实现了一种节能路由算法BRE-Flooding(Based on the Remaining Energy Flooding,基于剩余能量的洪泛算法).在算法中,节点依据剩余能量决定是否接收和转发数据帧;节点维护由剩余能量、距离网络中聚合节点(Aggregation Node)的跳数等信息组成的邻居路由信息表,并依据数据帧中表示该查询请求关键程度的属性,结合邻居路由信息表动态确定向哪几个(或全部)邻居节点转发数据帧.经实验仿真,表明所提算法在节省节点能量消耗及网络负载均衡方面具有较好的表现.  相似文献   

20.
属性图中的社区搜索是一种局部社区发现方法,本质是基于用户提供的查询节点返回包含查询节点且在结构内聚的同时属性与查询属性相似的个性化子图.该任务有助于用户更好地理解社区是如何形成的以及社区形成的原因.提出了一种融合结构-属性交互二部图随机游走机制,有效地支持属性图中的社区搜索.具体地,首先基于网络拓扑结构构建结构概率转移矩阵;其次探索结构与属性交互形成的二部图定义2阶段的节点-属性-节点概率转移矩阵,将其与结构概率转移矩阵有效融合得到属性图的概率转移矩阵;最后设计重启随机游走方法,基于融合结构和属性的并行电导值精准查询社区.在真实数据集和人工数据集上的实验表明了本文方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号