首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 312 毫秒
1.
Graph OLAPing 的建模、设计与实现   总被引:1,自引:0,他引:1  
提出了一系列Graph的OLAP模型和算法,实现了以Graph数据为中心度量的OLAP操作.主要贡献包括:(1)提出了面向Graph的数据仓库概念模型——双星模型;(2)提出了Graph的数据立方概念和创建过程;(3)设计了信息维聚集算法I-OLAPing;(4)设计了拓扑维聚集算法T-OLAPing;(5)实现了Graph OLAP的原型系统Graph OLAPer1.0.实验结果表明,设计和实现的Graph OLAPing算法及原型系统Graph OLAPer1.0能够有效地进行科研合作网分析.  相似文献   

2.
现实生活中大量数据都可以使用多维网络进行建模,如何更好地对多维网络进行分析至今仍是研究人员关注的重点.OLAP(联机分析处理)技术已被证实是对多维关系数据进行分析的有效工具,但应用OLAP技术管理和分析多维网络数据以支持有效决策仍旧是一项巨大的挑战.本文设计并提出了一种新的图立方体模型:路径-维度立方体,并针对提出的立方体模型将物化过程划分为关系路径物化与关联维度物化两部分,分别提出了物化策略并基于Spark框架设计了相关算法;在此基础上,我们针对网络数据设计并细化了相关的GraphOLAP(图联机分析处理)操作,丰富了框架的分析角度,提高了对多维网络的分析能力;最后,在Spark上实现了相关算法,通过对多个真实应用场景中的数据构建多维网络,在分析框架上进行了分析,实验表明我们提出的图立方体模型和物化算法具有一定有效性和可扩展性.  相似文献   

3.
为了解决推荐系统的冷启动和稀疏性问题, 本文提出了一种基于异质信息网络的推荐模型. 传统的推荐方法无法在知识图谱表示学习中融入隐含的路径信息, 这样使得知识推荐系统性能较为一般. 本文提出的模型在异质信息网络中设置元路径, 通过图神经网络融入到知识图谱表示学习中. 再利用注意力网络连接推荐任务和知识图谱表示任务, 其可以学习两个任务之中潜在的特征, 并且能够增强推荐系统中被推荐项和知识图谱中实体的相互作用. 最后在推荐任务中进行用户点击率预测. 模型在公开数据集Book-Crossing和通过DBLP数据集构建的图谱上进行了实验. 最后结果表明, 模型在AUC, 召回率和F1值3个指标上均比其他算法有更好的表现.  相似文献   

4.
由不同类型的节点和边组成的异质图在现实世界中具有广泛的应用场景.近年来,针对此类图数据的异质图神经网络研究与应用取得了很好的进展,但是现有的异质图神经网络在构建时没有考虑到异质图中存在关系的不确定性问题,因而在面对包含不确定性的关系的对抗性实例干扰时也暴露出鲁棒性较弱的缺点.针对上述问题,本文提出贝叶斯异质图神经网络模型(Bayesian Heterogeneous Neural Network,BHNN),用于解决异质图中关系不确定性问题并提高模型的鲁棒性. BHNN首先基于异质图的领域知识预定义不同的元路径,然后针对表示单一关系的每条元路径构建由相同类型节点构成的元路径邻居图,每个元路径邻居图被看作是一个随机图参数族的实现并可以使用随机块模型对其建模,最后结合贝叶斯方法对随机图的参数和节点标签的联合后验进行推理得到节点的预测标签的概率分布.节点分类实验结果表明:在ACM、DBLP和IMDB三个基准数据集上,相比较于目前最好的图数据训练模型,BHNN的微F1与宏F1分别平均提高了1.59%与1.36%,这验证了本文算法的有效性和优越性.在节点攻击实验中,相比较于基准方法中的图神经网络...  相似文献   

5.
基于关系数据库和XML的OLAP建模方案   总被引:1,自引:0,他引:1  
OLAP系统运行的基础是多维数据模型。以快速、准确、灵活地构建多维数据模型为目的,提出了一种基于关系数据库和XML的OLAP建模方案。该建模方案将OLAP的建模任务分为两个阶段:存储层建模和应用层建模。在存储层,使用关系数据库,按照"星型图"方法建立具备多维特性的关系数据模型;在应用层,设计XML Schema,描述多维数据立方体及物理映射。运用建模方案,可以有效提高OLAP多维数据建模的效率和效果。  相似文献   

6.
沈斯杰  陈榕  陈海波  臧斌宇 《软件学报》2023,34(10):4661-4680
随着业务数据的规模增大,一些重要的应用场景需要使用分布式在线分析处理(OLAP)支持大规模数据的分析,例如商务智能(BI),企业资源计划(ERP),用户行为分析等.同时,分布式OLAP打破单机存储的限制,可以将数据放在内存中以提升OLAP的处理性能.然而,基于内存的分布式OLAP在消除磁盘I/O后,性能瓶颈转移到了连接操作.连接操作是OLAP中的一种常用操作,会进行大量的数据读取与计算操作.通过对现有的几种连接操作方式进行分析,提出了一种能够加速连接操作的图结构索引以及基于图结构索引的连接操作方式LinkJoin.图结构索引通过用户所指定的连接关系,将数据在内存中的位置以图结构的形式进行存储.基于图结构索引的连接方式,不仅能够有等同于哈希连接的较低复杂度,而且在执行过程中能减少数据读取与计算操作次数.将目前先进的开源内存OLAP系统MonetDB从单机系统扩展成分布式系统,并且在该系统上设计与实现了基于图结构索引的连接操作方式.针对该系统的图索引结构,列式存储以及分布式执行引擎这3个重要方面,进行一系列设计与优化,以提升系统的分布式OLAP处理性能.测试结果表明,在TPC-H标准测试中...  相似文献   

7.
对信息网络数据集进行面向主题、多维、多层次的在线分析处理(on-line analytical processing,OLAP)面临数据规模爆炸,问题复杂性剧增等技术难题,传统OLAP技术不再适用。提出了面向信息网络的在线图处理(on-line graphic processing,OLGP)模型,OLGP包含节点集合、边集合、信息维集合,每个节点包含拓扑维集合;设计并实现了OLGP模型的核心操作(信息维上卷、拓扑维上卷、异步上卷)算法。对含有17431位作者的12499篇ACM论文的真实合作者网络数据集进行了相关分析处理,结果表明,信息维上卷仅需要113ms,拓扑维上卷仅需要61ms。  相似文献   

8.
网络已被广泛用作抽象现实世界系统以及组织实体之间关系的数据结构;网络嵌入模型是将网络中的节点映射为连续向量空间表示的强大工具;基于图卷积(Graph convolutional neural, GCN)的网络嵌入方法因受其模型迭代过程参数随机优化和聚合函数的影响,容易造成原始节点特征信息丢失的问题;为有效提升网络嵌入效果,针对于图神经网络模型在网络嵌入中节点表征学习的局限性,提出了一种基于二阶邻域基数保留策略的图注意力网络SNCR-GAT(Second-order Neighborhood Cardinality Retention strategy Graph attention network),通过聚合二阶邻域特征基数的方式,解决网络节点潜在特征学习过程中重要信息保留问题;通过在节点分类和可视化两个网络嵌入应用任务上进行实验,结果表明,SNCR-GAT模型在网络嵌入上的性能表现相比较基准方法更具优越性。  相似文献   

9.
针对以分散形式存储学科信息导致资源难以统计的问题,基于计算机学科领域本体模型,融合多源异质的学科数据构建高校计算机学科知识图谱.首先通过网络爬虫等技术从相关网站和已有文档中获取领域知识,并基于BERT模型对数据进行清洗;然后利用Word2Vec判断人物研究方向之间的相似度,解决实体对齐问题;最终将数据导入Neo4j图数据库中实现知识的存储.根据构建好的知识图谱建立计算机学科可视化系统,能够提供信息检索与图形显示等多种功能,实现计算机学科基础数据的快捷查询和资源统计,以期促进后续的学科评估工作更加高效地完成.  相似文献   

10.
林菁 《现代计算机》2011,(20):32-34,59
联机分析处理(OLAP)是支持复杂的数据分析需求的重要技术。将OLAP多维数据建模应用于电信行业的短消息通信业务。针对特定的短消息通信的数据分析需求,设计短消息通信数据分析系统的多维模型,并利用SQL Server以及相关工具成功地实现该系统。  相似文献   

11.
Graph OLAP: a multi-dimensional framework for graph data analysis   总被引:2,自引:1,他引:1  
Databases and data warehouse systems have been evolving from handling normalized spreadsheets stored in relational databases, to managing and analyzing diverse application-oriented data with complex interconnecting structures. Responding to this emerging trend, graphs have been growing rapidly and showing their critical importance in many applications, such as the analysis of XML, social networks, Web, biological data, multimedia data and spatiotemporal data. Can we extend useful functions of databases and data warehouse systems to handle graph structured data? In particular, OLAP (On-Line Analytical Processing) has been a popular tool for fast and user-friendly multi-dimensional analysis of data warehouses. Can we OLAP graphs? Unfortunately, to our best knowledge, there are no OLAP tools available that can interactively view and analyze graph data from different perspectives and with multiple granularities. In this paper, we argue that it is critically important to OLAP graph structured data and propose a novel Graph OLAP framework. According to this framework, given a graph dataset with its nodes and edges associated with respective attributes, a multi-dimensional model can be built to enable efficient on-line analytical processing so that any portions of the graphs can be generalized/specialized dynamically, offering multiple, versatile views of the data. The contributions of this work are three-fold. First, starting from basic definitions, i.e., what are dimensions and measures in the Graph OLAP scenario, we develop a conceptual framework for data cubes on graphs. We also look into different semantics of OLAP operations, and classify the framework into two major subcases: informational OLAP and topological OLAP. Second, we show how a graph cube can be materialized by calculating a special kind of measure called aggregated graph and how to implement it efficiently. This includes both full materialization and partial materialization where constraints are enforced to obtain an iceberg cube. As we can see, due to the increased structural complexity of data, aggregated graphs that depend on the underlying “network” properties of the graph dataset are much harder to compute than their traditional OLAP counterparts. Third, to provide more flexible, interesting and informative OLAP of graphs, we further propose a discovery-driven multi-dimensional analysis model to ensure that OLAP is performed in an intelligent manner, guided by expert rules and knowledge discovery processes. We outline such a framework and discuss some challenging research issues for discovery-driven Graph OLAP.  相似文献   

12.
针对目前知识图谱推理方法中,传统神经网络方法不能有效考虑实体之间的相关性问题,提出了一种将图卷积神经网络(GCN)与注意力机制(Attention)相结合的知识图谱推理方法。该方法利用注意力机制对知识图谱中的实体与其邻域实体进行相关性计算,得到实体特征向量。通过图卷积神经网络的参数共享技术学习实体的所有邻域实体特征。将实体特征和关系特征进行特征融合,得到每个实体的隐性特征向量。通过实体分类实验和链接预测实验进行分析,结果表明,该方法的准确率较传统神经网络方法有进一步提高,为搜索、问答、推荐以及数据集成等领域提供了方法支持。  相似文献   

13.
基于有向图描述数据仓库中复杂维层次结构的方法研究   总被引:2,自引:0,他引:2  
针对数据仓库中复杂维结构的特点,提出建立基于有向图的维字典图以辅助联机分析中有关维层次的定义,并利用维字典图重新定义了数据仓库多维数据模型和关于维层次的重要OLAP操作.该方法能够在复杂维层次结构的情况下灵活地适应用户的分析需求,提高了联机分析系统的处理能力.  相似文献   

14.
知识图谱旨在描述现实世界中存在的实体以及实体之间的关系.自2012年谷歌提出“Google Knowledge Graph”以来,知识图谱在学术界和工业界受到广泛关注.针对教育领域中信息缺乏系统性组织的不足,本文构建了面向高中的教育测评知识图谱(Educational Assessment Knowledge Graph,EAKG),其中EAKG的构建包括基于本体技术的知识图谱模式层构建和依托于模式层结构的知识图谱数据层构建.与传统通过网页爬虫等技术手段构建的知识图谱相比,本文构建的知识图谱优点在于逻辑结构清晰,实体间关系的刻画遵循知识图谱模式层的定义.EAKG为领域内知识共享,知识推理,知识表示学习等任务提供了良好的支撑.在真实模考数据上的实验结果表明:在试卷得分预测,知识点得分预测的实体链接预测和三元组分类嵌入式表示学习任务上,引入领域本体作为模式层构建的EAKG的性能优于没有领域本体模式层单纯由数据事实构成的EAKG,实验表明,领域本体的引入对知识图谱的表示学习具有一定的指导意义.  相似文献   

15.
图聚集是将一个大规模的图用简洁的并能有效反映原始图的结构和属性信息的小规模图来表示的技术.图聚集在图数据管理、分析和可视化中发挥着重要作用.图聚集方面现有研究结果还很少,也很不系统.其主要不足之处是:1)算法依赖于具体应用;2)算法仅考虑了图的某方面信息,如结构信息或属性信息;3)算法对用户提供的交互和反馈信息的约束很强.针对现有图聚集算法存在的主要不足,提出一种有向图新型图聚集算法,该算法采用一种新的聚集图质量函数,全面刻画了聚集图多样性、覆盖性、简洁性和实用性.该算法使用LSH(locality sensitive Hashing)技术和基于熵的划分技术,保证了聚集图的质量.在真实数据集上进行了大量的实验,验证了算法的有效性.  相似文献   

16.
车超  刘迪 《计算机工程》2022,48(3):74-80
实体对齐表示在不同的知识图谱中查找引用相同现实身份的实体。目前主流的基于图嵌入的实体对齐方法中的对齐实体通常具有相似的属性,有效利用属性信息可提升实体对齐效果,同时由于不同知识图谱之间的知识分布差异,仅考虑单个方向的对齐预测会导致预测结果出现偏差。针对上述问题,提出一种改进的跨语言实体对齐方法。利用融合属性信息的双向对齐图卷积网络模型,将前馈神经网络编码实体对应的属性信息与初始的实体嵌入相结合,得到联合属性信息的实体表示,并使用双向对齐机制实现跨语言的实体对齐预测。在3个跨语言数据集上的实验结果表明,该方法通过融合更多的知识图谱信息增强了实体表示能力,并且利用双向对齐机制缓解了数据分布差异问题,相比基于图嵌入的实体对齐方法整体性能更优。  相似文献   

17.
动态图模式匹配技术综述   总被引:1,自引:1,他引:0  
许嘉  张千桢  赵翔  吕品  李陶深 《软件学报》2018,29(3):663-688
随着大数据时代的到来,多源异构数据的快速增长已经成为了一个开放性问题,这些数据之间的内在关联通常可以用图数据的形式来表现.然而在实际应用中,例如网络安全分析和社交网络舆情分析,描述实体对象之间关系的图数据的结构和内容往往不是固定不变的,图数据的结构以及节点和边的属性会随着时间的推移发生更新变化.因此,如何在动态更新的图数据中进行高效的查询、匹配是目前研究的热点问题,也涌现了许多优秀的研究工作.本文从关键技术、代表性算法和性能评价方面对动态图匹配技术的研究进展进行了综述.最后对动态图匹配技术的典型应用、面临的挑战问题和未来发展趋势进行了总结和展望.  相似文献   

18.
孙亚茹  杨莹  王永剑 《计算机工程》2022,48(10):116-122
解决多源知识对齐和知识冗余问题是在开放数据域自动构建知识图谱的关键。建立一种融合知信学习与深度学习的知识图谱自动构建模型。分析图卷积神经网络(GCN)模型与知信学习之间的理论联系,以先验知识与深度学习相结合的方式构建实体语义联合空间,将先验知识对模型的干预形式化,并利用自动编码器实现一个细粒度的实体对齐和关系抽取模型。同时,采用GCN与多头注意力相结合的方式,缓解因结构数据中多跳推理造成实体依赖信息丢失的影响。在开源数据集SemEval、FB15k和收集整理的MD数据集上的实验结果表明,该模型针对关系抽取、实体对齐和三元组抽取任务的F1值分别达到89.5%、86.6%和84.2%,较BERT-Softmax模型分别提升了0.3、2.4和0.3个百分点,具有更好的信息学习能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号