首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文针对徽派建筑数据异构多源和非结构化的特点,提出一种BiLSTM-CRF模型与徽派建筑词典相结合的命名实体识别方法,利用先验知识的辅助作用,提升实体识别效果,完成对建筑实体进行的识别抽取.利用Neo4j图数据库存储知识,用属性图模型表示知识.最后使用Neo4j图数据库对构建的徽派建筑知识图谱进行了可视化展示.研究结果表明,此方法能够有效地构建徽派建筑领域知识图谱,为今后徽派建筑知识智能化推荐和搜索系统研究奠定基础.  相似文献   

2.
针对司法领域办案过程中所需知识分散、不完备、查询不便等问题,通过对收集到的司法案件进行分析归纳总结,首先采用哈工大的LTP语言技术平台对司法案件文本进行分词、词性标注及命名实体识别等处理,接着通过依存句法分析算法从处理过的文本中抽取出实体间的语义关系并存储为三元组的形式,然后将三元组形式的数据信息录入到Neo4j图数据库,利用Neo4j实现司法案件知识图谱的构建并对其进行可视化展示。最后以实例证明了该方法的可行性。  相似文献   

3.
为提高服务机器人对家庭环境中事物语义信息的准确获取与认知,提出了一种家庭服务机器人知识图谱的构建方案并进行了家庭服务的应用测试。 首先,针对家庭服务应用需求,构建了适用于家庭环境的领域本体,并采用结构化的方法表征家庭场景下环境、人物、服务等知识以及物体的语义属性,将其存储在关系型数据库中。 在此基础上,根据领域本体将知识库的结构化数据进行数据映射和知识抽取,完成知识图谱的构建,并针对典型家庭服务的应用需求进行了测试。 实验结果表明,构建的知识图谱能够有效地帮助服务机器人准确地获取家庭环境中事物的语义信息,检索得到服务所需的知识,从而保障其智能化地执行家庭服务。  相似文献   

4.
当前数控机床故障方面的查询机制尚不完善,机床工人在查找故障原因所在时往往需要花费较多的时间.为改善现状,从内蒙古某机械厂的数控机床故障数据中抽取其三元组,构建数控机床故障知识图谱,在此基础上开发知识图谱问答系统.构建数控机床故障知识图谱问答一般会包括4个步骤:数控机床故障问句实体识别;数控机床故障属性映射;数控机床故障实体链接;答案返回.设计ALBERT+Attention+BiLSTM+CRF模型识别问句中的数控机床故障实体;然后在所创的数控机床故障知识图谱中找到对应实体的三元组进行返回;通过训练属性映射模型,选择得分较高的几个三元组作为预选答案,最后通过实体链接重排序返回答案.在内蒙古某机械厂数控机床故障知识图谱数据集上分析并验证了所提方法的有效性.  相似文献   

5.
现有方法在构建知识图谱过程中,由于忽视了对半结构化数据的处理,导致知识图谱构建精确性不高,且耗时过长,为此本文提出基于海量文本数据的知识图谱自动构建算法。利用三元组抽取器实现海量文本数据源抽取,并提取其中的半结构化数据,同时剔除冗余数据。根据数据处理结果,利用数据采集功能选取适当的数据对象,作为知识图谱构建的文本数据源,并对数据源实行文本格式转换、分词和特征提取等规范化处理。分析得出数据的潜在语义,并绘制XTM可视化图谱,构成初步的知识图谱。挖掘该知识图谱中的已存知识,将潜在向量应用在信息推荐中,组成用户、评分与项目的三元组数据,采用图谱演进算法对评分、用户及项目进行预测,构建潜在向量模型生成多领域推荐,从而实现知识图谱的自动演进。实验结果表明,该算法具有更高的构建精确性,并且用时较短,说明该算法具有可靠性与实际应用性。  相似文献   

6.
针对风力发电机故障诊断与维修过程不明确以及历史故障数据记录大量遗留等问题,提出一种以知识图谱的方式构建的风力发电机故障诊断系统。首先,通过改进的命名实体识别模型BERT-BiLSTM-CRF对故障文本进行知识抽取。数据集采用了近10年来的风力发电机故障案例、事故分析等文本数据。实验结果表明:在风力发电机故障领域中,改进的实体识别方法相比于传统模型效果提升了2.54%。其次,对抽取的知识实体进行结构化分析,由于传统故障树在实际故障推理中缺乏目的性,且每个底事件相对于顶事件的重要性不同,提出以故障的特征属性为分支条件引入到故障树推理中,完成故障树定性与定量分析,并结合故障模式影响和危害性分析(FMECA)完善故障领域知识模型;再对知识结构完成本体化建模,使用Protégé开发工具对故障树结构完成了基于六元组概念的本体建模,使构建的本体知识库满足推理的前提条件。最后,通过Neo4j实现知识模型的可视化,并提升了知识数据的读写能力。  相似文献   

7.
智能问答系统是信息检索的一种新型检索模式.针对现有知识图谱问答系统存在的开放域知识覆盖不全而影响问答质量的问题,提出了一种融合机器阅读理解的知识图谱问答系统构建方法.首先采用Elasticsearch数据库来存储预处理之后的三元组数据,其次利用信息检索技术在知识图谱中对问题相关知识进行检索,并将检索结果拼接成一段自然语...  相似文献   

8.
为解决传统的关系型数据库在海量数据的存储和访问效率中存在的瓶颈问题,提出了一种基于非关系型(NoSQL:NotonlySQL)数据库的地学大数据高效存储方法。同时以MongoDB为代表,通过C#语言编写测试程序,与SQLServer在地学大数据的存储、查询等方面进行了性能对比。结果表明,与传统关系型数据库相比,NoSQL数据库的增、删和查询耗时明显降低,尤其是针对海量的非结构化、半结构化数据,其性能优势更加明显。  相似文献   

9.
基于长链非编码核糖核酸(long non-coding RNA,LncRNA)和疾病关系的分析,对LncRNA和疾病知识概念建模,提出一种有效的LncRNA与疾病关系的知识图谱构建方法.使用Protégé构建本体结构,建构概念层,整合结构化与非结构化两种不同来源的数据形成数据层,通过资源描述框架(resource de...  相似文献   

10.
军事领域非结构化文本中的大量目标实体往往包含丰富的军事信息和军事知识,对其准确识别是进行军事信息抽取和军事知识组织的基础性关键任务,也是构建军事知识图谱的重要环节.针对军事领域标注数据不足以及军事实体边界模糊的问题,提出基于预训练BERT模型的深度学习识别方法.利用BERT生成基于当前输入语境特征的动态字向量来增强字的...  相似文献   

11.
对我国科学数据开放政策进行细粒度分析,探讨我国科学数据开放的核心政策的影响情况与机制,为 数字经济环境下制定促进数据高效共享政策提供参考。采用自顶向下方式,构建知识图谱模式层,识别并提取 政策实体、属性及关系构建数据层,并存入 Neo4j 图数据库;实现语义层面的关联查询与可视化,从不同细粒 度对政策文本进行多维分析。通过知识图谱识别核心政策,结合政策工具进行政策文本多维分析,探究科学数 据开放核心政策对现有政策体系的影响情况。发现科学数据开放的核心政策在政策演化过程中,能够对其关联 政策以及政策整体的政策目标和政策工具使用产生影响。  相似文献   

12.
针对传统领域知识实体抽取算法主要依赖专家的专业知识,需要的标注工作量较大,本文提出了基于远程监督的实体抽取算法并应用于粮油存储领域。算法在PU学习的框架下,通过判定和分类2个阶段抽取实体,利用双向长短期记忆网络进行二分类实体判别。再通过全连接网络实体类型判别,构建了一个粮油领域知识图谱。研究表明:本算法可以应用于粮油存储领域的知识图谱构建,适用于训练实体样本较少的实体抽取任务,能够缩小使用双向长短期记忆网络算法进行实体抽取任务所需的语料规模,并在使用更小语料规模的情况下达到与经典双向长短期记忆网络算法相当的实体抽取效果。  相似文献   

13.
随着科技的发展,遥感影像照片在质量及数量上急剧增加,如何安全并高效地将其存储已成为当前研究的一个热点问题.应用NoSQl非关系型数据库,提出一种基于MongoDB的遥感影像大数据的存储方法.用基于GridFS的大文件存储方式存储影像,再将其有关的属性信息以一条文档的形式插入MongoDB数据库,两者之间用相同的ID编号连接.通过与关系型数据库PostgreSQL在大文件以及传统海量文档存储方面进行性能测试比较,结果表明基于MongoDB的海量遥感影像大数据存储方法在各方面性能均明显优于基于关系型数据库的存储方法.  相似文献   

14.
为了明确大气污染物、污染源、影响因素、评价指标、危害等之间的关系,分析大气污染传播路径,建立了一个较为清晰、完善的大气污染领域本体.首先,基于机器学习和自然语言处理等技术,提出一种基于注意力机制的序列标注联合抽取实体关系的方法,在双向长短时记忆(long short-term memory,LSTM)网络模型中加入注意力机制,并将实体和关系联合标注,从而进行实体关系抽取.其次,结合词频-逆文档频率(term frequency-inverse document frequency,TF-IDF)核心概念挖掘方法进行知识抽取,并将概念、属性、关系和实例组织起来,从而实现大气污染本体模型的半自动构建.最后,在本体和实例的基础上通过Protégé的SPARQL Query模块和HermiT推理机分别进行条件推理和可视化推理.结果表明,基于注意力机制的序列标注实体关系联合抽取方法所构建的大气污染领域本体包含核心实体68个,实例数360个,相较于现有的本领域本体,在全面性、有效性、准确性和可重用性方面都有较好表现,同时推理出了Ca2+和K+等污染离子的...  相似文献   

15.
针对TransD模型参数多和实体两种表示间没有关联的问题,提出一种改进的知识表示模型PTransD。通过减少实体投影数,并对实体进行聚类来减少参数量,同时利用K-L(Kullback-Leibler)散度限制实体投影和对应实体类,使其概率分布相同。在模型训练时,对三元组损失和K-L损失交替优化,从类间距大的实体类中替换实体,提高负例质量。最后,在知识图谱数据集上进行三元组分类和链接预测实验。结果表明,该模型的性能在各项指标上均有明显提高,可以应用于知识图谱的完善和推理等。  相似文献   

16.
大量根据CNONIX标准编写的XML格式的数据如何在数据库中存储是目前亟需研究并解决的问题.本文首先介绍非关系型数据库的特点,之后分析CNONIX数据的格式特点,将XML与BSON格式进行比对,提出了基于MongoDB的CNONIX数据存储方案,将XML格式转换为BSON数据后存入MongoDB数据库中.运用Apache JMeter对此方案进行性能测试,并与传统关系型数据库进行对比.结果表明,CNONIX数据在MongoDB数据库中存储简便,且效率较关系型数据库有明显提高,能够解决其在关系型数据库中不易存储的问题.  相似文献   

17.
针对复杂、多样的工艺知识难以统一表示所导致的工艺知识重用和共享困难等问题,提出了一种面向工艺重用的工艺知识图谱构建方法。该方法首先依据国际工业标准step-NC建立工艺知识图谱的基本模式层,以保证工艺知识数据模式的准确性和通用性;其次通过工艺知识解析和工艺知识合并,完善工艺知识图谱基本模式层,形成工艺知识图谱扩展模式层;同时采用SWRL语言对已有经验规则进行统一表征,完成工艺知识图谱模式层的构建。然后,在工艺知识图谱模式层的引导下,引入潜在语义分析技术,对加工工艺实例知识进行分析并计算工艺实例之间的相似性,将工艺实例知识转化为结构化工艺知识图谱的形式表示,实现工艺知识图谱模式层的实例化,以得到工艺知识图谱数据层。最后,开发了工艺知识图谱构建和应用平台,以验证所提方法的可行性。  相似文献   

18.
为解决电网客服领域人力成本过高、业务处理受到时空限制的问题,探究基于行业知识图谱的智能客服查询显示系统。根据电网客服领域的业务需求和数据特点,采用半自动化的方式对源数据进行语义标注与关系抽取,建立行业知识图谱。在实现自动问答系统的语义解析环节,提出一种多模式匹配和相似度度量融合的实体识别算法,提高实体识别模块的性能。通过设计100道问题对构建好的智能客服自动问答系统进行测试,最终有93道问题被正确处理。该系统的实现过程为构建基于行业知识图谱的智能问答系统提供参考。  相似文献   

19.
为了辅助进行产品评论中特征-观点对识别的挖掘工作,对细颗粒度产品评论语料库的构建技术进行了研究.介绍了用于产品评论细颗粒度挖掘的语料库构建方法,以及目前初步进行的语料标注工作.标注数据可以数据库形式存储,从而实现了无结构化到结构化的转变,为自动查询等处理提供了极大方便.实验结果表明:虽然文中的标注方法以手机产品为例,但具有良好的移植性,可以应用到其他产品评论的细颗粒度语料库构建.相应的语料库构建对于高性能机器学习方法的应用、特征-观点对识别算法的性能提高以及自动评价等具有重要意义.  相似文献   

20.
在研究非关系型数据库Mongo DB的基础上,设计实现了基于Mongo DB的海量电能质量数据存储方案,并与基于关系型数据库的存储方案进行了性能比较测试。测试结果表明:该存储方案具有更好的数据存储和查询性能,可为海量电能质量数据的存储与处理提供借鉴。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号