共查询到17条相似文献,搜索用时 468 毫秒
1.
针对二维表生成知识图谱的节点冗余问题,单表知识不足和多源数据库表在没有关系约束的前提下难以形成表间的映射问题,本文提出一种基于二维表数据的知识图谱融合构建方法。首先利用TKGC方法自行选出的核心属性与其他属性之间构成的<属性值、属性名、属性值>三元组生成单表知识图谱,然后利用SNF融合方法或者SRF融合方法对不同类型的二维表知识图谱进行融合,最后实现基于Neo4j的可视化存储。利用4个真实数据集进行实验,可视化结果证明图谱构建真实有效,融合后整体关系节点比增加了22.3%,关系数量增加了10.5%,增强了图谱联合查询和知识挖掘能力。 相似文献
2.
为探索知识图谱技术在农业智能生产中应用与落地, 解决复杂多样的农业生产数据的精准查询与可视化问题, 本研究以小麦品种知识为例, 利用爬虫技术, 爬取1852个小麦品种信息、735个微百科、102349个词条; 基于知识图谱技术, 设计品种知识图谱实体与关系, 对抓取数据进行清洗、抽取与融合, 经过实体识别、关系构造等处理, 构建实体258484个, 关系328933个. 在此基础上, 设计了小麦品种知识存储方式, 结构化数据存储在MySQL中, 非结构化数据存储在MongoDB中, 使用Neo4j图数据库存储知识图谱来提高知识的查询性能, 在此基础上实现小麦品种关系查询与实体识别, 提供品种数据精确表达与可视化, 表明利用知识图谱技术实现品种等信息的可视化是可行的, 该研究可以为知识图谱在农业中的应用提供技术参考和理论支撑. 相似文献
3.
4.
知识图谱是数字孪生流域建设知识平台的重要组成部分,本研究以数字孪生流域建设而汇聚的数据底板为基础,依托自顶向下和自底向上相结合的方法,通过总体框架设计,基于BERT-BiLSTM-CRF命名实体识别、Transformer模型的关系抽取、Neo4j的存储和可视化展示完成知识图谱的搭建,并基于知识图谱建设性构建智能问答系统,为四川省数字孪生流域物理流域的全映射提供了支撑,实现了知识的可视化表达、精准查询与智能推荐,为四川省河湖智能管理提供知识性参考。 相似文献
5.
知识图谱技术在行业领域的运用越来越广, 因此研究知识图谱技术在成果地质资料领域中的运用, 解决到馆用户的精确查询和可视化问题变得更加重要. 本文以成果地质资料为研究对象, 利用爬虫技术, 爬取成果地质资料中的矿产、地理区域、组织机构等实体信息. 结合知识图谱相关技术, 设计成果地质资料知识图谱地质实体和关系, 经过命名实体识别、关系抽取和属性抽取, 构建成果地质资料实体266787 个, 关系306686 个. 使用Neo4j图形化数据库存储知识图谱来提高地质资料的查询性能, 方便到馆用户的查询. 该研究可以为知识图谱在成果地质资料上面的应用提供理论支撑. 相似文献
6.
鉴于现有农业知识图谱对病虫害防治相关实体、关系刻画不够细致的问题,以苹果病虫害知识图谱构建为例,研究细粒度农业知识图谱的构建方法。对苹果病虫害知识的实体类型和关系种类进行细粒度定义,共划分出19种实体类别和22种实体关系,以此为基础标注并构建了苹果病虫害知识图谱数据集AppleKG。使用APD-CA模型对苹果病虫害领域命名实体进行识别,使用ED-ARE模型对实体关系进行抽取。实验结果表明,该文模型在命名实体识别和关系抽取两项子任务中的F1值分别达到了93.08%和94.73%。使用Neo4j数据库对知识图谱进行了存储和可视化,并就细粒度苹果病虫害知识图谱可以为精准病虫害信息查询、智能辅助诊断等下游任务提供底层技术支撑进行了讨论。 相似文献
7.
针对以分散形式存储学科信息导致资源难以统计的问题,基于计算机学科领域本体模型,融合多源异质的学科数据构建高校计算机学科知识图谱.首先通过网络爬虫等技术从相关网站和已有文档中获取领域知识,并基于BERT模型对数据进行清洗;然后利用Word2Vec判断人物研究方向之间的相似度,解决实体对齐问题;最终将数据导入Neo4j图数据库中实现知识的存储.根据构建好的知识图谱建立计算机学科可视化系统,能够提供信息检索与图形显示等多种功能,实现计算机学科基础数据的快捷查询和资源统计,以期促进后续的学科评估工作更加高效地完成. 相似文献
8.
9.
KGDB:统一模型和语言的知识图谱数据库管理系统 总被引:2,自引:0,他引:2
知识图谱是人工智能的重要基石,其目前主要有RDF图和属性图两种数据模型,在这两种数据模型之上有数种查询语言,RDF图上的查询语言为SPARQL,属性图上的查询语言主要为Cypher.十年来,各个社区开发了分别针对RDF图和属性图的不同数据管理方法,不统一的数据模型和查询语言限制了知识图谱的更广应用.KGDB (Knowledge Graph Database)是统一模型和语言的知识图谱数据库管理系统:(1)以关系模型为基础,提出统一的存储方案,支持RDF图和属性图的高效存储,满足知识图谱数据存储和查询负载的需求;(2)使用基于特征集的聚类方法解决无类型三元组的存储问题;(3)实现了SPARQL和Cypher两种不同知识图谱查询语言的互操作性,使其能够操作同一个知识图谱.在真实数据集和合成数据集上进行的大量实验表明,KGDB与已有知识图谱数据库管理系统相比,不仅能够提供更加高效的存储管理,而且具有更高的查询效率.KGDB平均比gStore和Neo4j节省了30%的存储空间,基本图模式查询上的实验表明,在真实数据集上的查询速度普遍高于gStore和Neo4j,最快可提高2个数量级. 相似文献
10.
11.
Baozhu Liu Xin Wang Pengkai Liu Sizhuo Li Xiaowang Zhang Yajun Yang 《International Journal of Software and Informatics》2021,11(1):91-116
Knowledge graph is an important cornerstone of artificial intelligence, which currently has two main data models: RDF graphs and property graphs. There are several query languages on these two data models, including SPARQL on RDF graphs and Cypher on property graphs. Over the last decade, various communities have developed different data management methods for RDF graphs and property graphs. Inconsistent data models and query languages hinder the wider application of knowledge graphs. In this paper, we propose a knowledge graphy database (KGDB) system with unified data model and query language. (1) We work out a unified storage scheme based on the relational model that supports the efficient storage of RDF graphs and property graphs, catering to the smooth storage and query of knowledge graph data. (2) The characteristic set-based clustering is used in KGDB for the storage of typeless entities. (3) It realizes the interoperability of SPARQL and Cypher by enabling them to operate on the same knowledge graph. Extensive experiments on real-world datasets and synthetic datasets reveal that KGDB is more efficient than existing knowledge graph database management systems in storage management and query efficiency. KGDB saves 30% of the storage space on average compared with gStore and Neo4j. In addition, KDGB is two orders of magnitude faster than gStore and Neo4j in the query of the real-world datasets, seen from experiments on the query of basic graph pattern matching. 相似文献
12.
部分整体关系获取是知识获取中的重要组成部分。Web逐步成为知识获取的重要资源之一。搜索引擎是从Web中获取部分整体关系知识的有效手段之一,我们将Web中包含部分整体关系的检索结果集合称为部分整体关系语料。由于目前主流搜索引擎尚不支持语义搜索,如何构造有效的查询以得到富含部分整体关系的语料,从而进一步获取部分整体关系,就成为一个重要的问题。该文提出了一种新的查询构造方法,目的在于从Web中获取部分整体关系语料。该方法能够构造基于语境词的查询,进而利用现有的搜索引擎从Web中获取部分整体关系语料。该方法在两个方面与人工构造查询方法和基于语料库查询构造查询方法所获取的语料进行对比,其一是语料中含有部分整体关系的语句数量;二是从语料中进一步获取部分整体关系的难易程度。实验结果表明,该方法远远优于后两者。 相似文献
13.
14.
《Information and Software Technology》2002,44(9):513-539
To populate a data warehouse specifically designed for Web data, i.e. web warehouse, it is imperative to harness relevant documents from the Web. In this paper, we describe a query mechanism called coupling query to glean relevant Web data in the context of our web warehousing system called Warehouse Of Web Data (WHOWEDA). Coupling query may be used for querying both HTML and XML documents. Some of the important features of our query mechanism are ability to query metadata, content, internal and external (hyperlink) structure of Web documents based on partial knowledge, ability to express constraints on tag attributes and tagless segment of data, ability to express conjunctive as well as disjunctive query conditions compactly, ability to control execution of a web query and preservation of the topological structure of hyperlinked documents in the query results. We also discuss how to formulate query graphically and in textual form using coupling graph and coupling text, respectively. 相似文献
15.
This paper discusses the issues involved in designing a query language for the Semantic Web and presents the OWL query language (OWL-QL) as a candidate standard language and protocol for query–answering dialogues among Semantic Web computational agents using knowledge represented in the W3Cs ontology web language (OWL). OWL-QL is a formal language and precisely specifies the semantic relationships among a query, a query answer, and the knowledge base(s) used to produce the answer. Unlike standard database and Web query languages, OWL-QL supports query–answering dialogues in which the answering agent may use automated reasoning methods to derive answers to queries, as well as dialogues in which the knowledge to be used in answering a query may be in multiple knowledge bases on the Semantic Web, and/or where those knowledge bases are not specified by the querying agent. In this setting, the set of answers to a query may be of unpredictable size and may require an unpredictable amount of time to compute. 相似文献
16.
17.
基于最大熵分类器的Deep Web查询接口自动判定 总被引:1,自引:0,他引:1
Web中包含着海量的高质量信息,它们通常处在网络深处,无法被传统搜索引擎索引,将这样的资源称为Deep Web。因为查询接口是Deep Web的唯一入口,所以要获取Deep Web信息就必须判定哪些网页表单是Deep Web查询接口。由于最大熵模型可以综合观察到的各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的结果。因此,基于最大熵模型的分类性能,利用最大熵分类算法自动判定查询接口。并通过实验,将最大熵分类法与其它常用分类方法进行了比较,结果显示它的分类性能优于Bayes方法和C4.5方法,与SVM方法相当,表明这是一种非常实用的查询接口分类方法。 相似文献