首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 220 毫秒
1.
混凝土坝施工管理知识多以文本的形式记录存储,具有数据量大、碎片化严重、层次性差等特点。本文从非结构化文本数据中智能挖掘施工知识,理清知识间的逻辑关系,提升知识的应用效率是混凝土坝施工管理面临的重要问题。本文提出一种混凝土坝施工管理知识图谱智能生成方法,将海量文本数据转化为可直接利用的知识。融合字词向量、BiLSTM-CRF(Bi-directional Long Short-Term Memory-Conditional Random Field)网络、Attention机制,建立混凝土坝施工管理实体智能识别模型,强化施工实体特征,获取混凝土坝施工管理文本中的实体词语。结合已识别的施工实体,定义实体间关系类型,利用互信息提取实体关系,组合形成施工知识链,构建混凝土坝施工管理知识图谱。该方法应用于实际混凝土坝施工管理文本分析中,经过计算得到混凝土坝施工管理实体智能识别模型的F1值为92.48%,优于其他实体识别模型;利用已识别实体间的关联关系,建立了混凝土坝施工管理知识图谱,形成基于知识图谱的施工知识检索机制,实现施工知识的快速提取,提高了施工知识的应用效率。  相似文献   

2.
为提高混凝土坝面作业场景识别工作效率,提出了一种混凝土坝面作业场景智能识别方法(ResNet50-SEMSF)。将采集的坝面施工现场监控视频分割为图像,分析混凝土坝面作业人、机、料、环境等实体要素图像特征,界定坝面作业典型场景;以残差网络(ResNet50)为骨干网络结构,引入挤压激励(SE)注意力机制,关注不同通道间特征关系,提升坝面作业场景图像中多目标实体要素关键特征表达能力;融合下采样多尺度特征,保留坝面作业场景图像低级特征和高级语义信息,增强模型对图像不同层次特征的理解能力,克服尺度变化、目标变形等问题。对比分析其他3种卷积神经网络模型试验结果,使用梯度类激活映射(Grad-CAM)可视化方法,解释ResNet50-SEMSF模型对场景类别中实体要素信息的关注程度。结果表明:ResNet50-SEMSF识别效果明显优于ResNet50、MobileNetV2、VGG16等经典网络模型,表明ResNet50-SEMSF模型用于混凝土坝面作业场景智能识别的可行性,为混凝土坝面施工安全管理工作提供参考。  相似文献   

3.
知识获取多年来一直被认为是阻碍智能系统开发的瓶颈问题,尤其是互联网时代,大量的信息都以非结构化的文本形式存在。本文运用分布式计算思想设计了一个基于互联网大规模语料库的知识自动获取系统。采用弱监督条件下机器学习的方法对信息自动挖掘和获取,实现机器对知识的自动学习和挖掘、新词词典发现、实体关系模板提取、命名实体识别等功能。利用该系统分别对未登录新词发现和地名识别两种应用进行了实验,运用N gram和互信息(PMI)方法分别取得了72.1%和87.28%的准确率。  相似文献   

4.
利用电力系统二次设备功能缺陷文本数据,建立了基于双向长短时记忆网络与条件随机场(BiLSTM-CRF)模型的文本信息抽取模型.在此基础上,为了进一步将数据中蕴含的知识价值应用到电力系统生产、管理过程中,构建了电力系统二次设备功能缺陷知识图谱,将各类数据间所含语义信息融入各类实体间的关系约束,建立了基于BiLSTM-CRF模型与知识图谱的二次设备功能缺陷智能诊断与辅助决策平台.该平台可依据缺陷设备类型与缺陷现象快速诊断设备的缺陷部位及原因,并推荐合理的解决措施.算例分析结果表明,相较于传统的命名实体识别算法、BiLSTM-softmax以及Seq2Seq-Attention模型,所采用BiLSTM-CRF模型的精确率、召回率、F1值这3项评估指标均有较大提升,所建平台能很好地挖掘、应用电力文本数据知识与价值,为电力系统二次设备功能缺陷处理提供有益参考.  相似文献   

5.
近年随着电网调度领域数据自动化、智能化管理需求的日益增长,知识图谱成为提供知识管理、智能查询、辅助决策等功能的重要技术.实体作为构成知识图谱的核心要素,识别的准确率将直接影响知识图谱的质量.针对电网调度领域,首先分析电网调度实体识别研究现状,明确了实体识别任务目标,然后根据电网调度领域文本数据特征,设计了同时满足局部特...  相似文献   

6.
碾压混凝土坝施工气候是造成碾压混凝土VC值(vibrating-compacted value,单位:s)变化的主要因素之一,建立考虑施工气候参数影响的碾压混凝土VC值变化量的预测模型,对于保证碾压混凝土坝施工质量,具有重要的理论意义。本文依托碾压混凝土坝施工气候信息实时监控技术,提取碾压混凝土坝施工气候参数值(温度、相对湿度以及风速),通过现场检测获得了对应的VC值变化量,采用多元回归分析方法,分析施工气候参数与VC值变化量之间的多元映射关系,建立VC值变化量的预测模型。该模型可以对施工现场碾压混凝土VC值的变化量进行实时预测,反馈指导施工管理人员采取相应措施修改VC值,为碾压混凝土坝质量控制提供新的途径。  相似文献   

7.
电网故障处置预案是电网故障处置的重要参考,对电网故障处置预案文本中各类电力设备、名称编号等细粒度的关键实体信息进行抽取,是实现计算机学习理解预案内容并进一步支撑故障处置智能化的重要基础。文中提出一种基于深度学习的电网故障处置预案文本命名实体识别技术,首先采用字向量表征预案文本,然后将注意力机制以及双向长短期记忆网络相结合,有所侧重地提取实体词深层字符特征,最后采用条件随机场求解最优序列化的标注。算例表明:文中所提预案文本命名实体识别模型不依赖人工特征,能够自动高效地提取文本特征,准确识别预案文本中细粒度的实体词,满足预案文本中关键实体信息精确定位和识别的要求。  相似文献   

8.
继电保护装置缺陷时有发生,威胁其作为第一道防线的可靠性,进而影响电网安全稳定运行。随着电网规模扩大,保护装置数量增加,现场运维工作需要智能化辅助减小运维压力;同时,保护装置历史缺陷数据累积,蕴含有助于辅助运维的信息有待文本挖掘。有鉴于此,该文以某地区电网实际继电保护装置缺陷数据和专业词典为基础,提出了一种面向继电保护装置缺陷知识图谱构建的实体关系抽取方法。首先,以传统本体构建思想为基础,借助词频–逆文档频率(term frequency-inverse document frequency,TF-IDF)方法,抽取了继电保护装置领域术语,并定义了概念及其间关系,实现了继电保护装置缺陷本体构建;其次,根据继电保护装置缺陷记录文本特征,提出了基于语法规则的实体关系抽取方法,实现了近邻词位实体的关系抽取;再次,提出了基于远程监督学习的实体关系抽取方法,实现了长间隔词位实体关系抽取;进一步,利用关系抽取可信度评价指标,实现了综合语法规则和远程监督的实体关系抽取;最后,利用Protégé对装置缺陷本体及关系抽取结果做了局部可视化展示。  相似文献   

9.
针对电力领域语音转写文本质量差,不能很好解决电网领域命名实体识别问题,以电网信息通信(information and communications technology,ICT)系统语音转写文本数据为研究对象,构建了一种基于双向长短期记忆(bi-directional long short-term memory,BiLSTM)神经网络融合条件随机场(conditional random field,CRF)面向电力文本特征的实体识别算法。通过与循环神经网络(recurrent neural network,RNN)等神经网络算法的对比验证:BiLSTM-CRF在电网ICT领域实体识别准确率达79%,F1值达80%,优于LSTM(long short-term memory)和其他RNN算法,并能较好地识别转写错误实体。该算法有效提升了领域语音转写文本的实体识别准确率,同时降低了领域语音识别技术成本,为电网客服领域信息检索、智能问答、个性化推荐等自然语言处理应用提供了高质量非结构化样本数据。  相似文献   

10.
在传统的信息检索系统中,用户只能通过诸如现大量与用户查询相关度低甚至无关的内容.本文将本体技术运用到传统检索系统中,提出基于本体的信息检索模型框架,列举相关的各项技术,利用反映概念之间关系的领域本体指导主题标引,利用反映实体之间关系的领域本体指导实体关系标引,并以本体的形式表示文档替代物和查询表达式,该方法可以进一步提高文本信息检索系统的性能.  相似文献   

11.
因知识图谱具备强大的实体关系表达推理能力,近年来在各领域得到了广泛应用。文中针对电能计量装置存在标准规范多,建设管理运营成本和门槛高的问题,研究并提出了一种电能计量装置知识图谱的自动构建方法。针对技术规范文档存在的实体嵌套、语义模糊和图谱不全等问题,文中综合采用基于候选实体图匹配的命名实体识别方法,基于多依存句法树融合的关系抽取方法,基于概念层次图融合的关系推理方法,并在电能计量装置知识图谱构建中进行了验证。实验表明文章构建的知识图谱在实体识别、关系提取和关系推理的准确率和扩展性方面都取得了较大提升,可大幅降低相关领域标准规范的应用审查门槛和成本。  相似文献   

12.
通过对长期服役的混凝土坝工作性态健康诊断,有助于选择合适的风险管控措施,保障混凝土坝安全运行.在阐述我国混凝土坝病险隐患的基础上,总结了混凝土坝健康诊断的作用,论述了混凝土坝安全监测和现场检测技术、诊断模型、结构计算及模型试验等关键理论、方法与技术的研究进展.认为今后应加强数据驱动的混凝土坝安全性态时空演变特征提取、可...  相似文献   

13.
中文电子病历实体包含大量的医学领域词汇并具有明显的嵌套特征。嵌套实体识别时往往存在目标实体定位不完整、不准确的问题。针对这一问题,提出了一种基于机器阅读理解的中文电子病历嵌套命名实体识别模型MRC-PBM (machine reading comprehension-position information biaffine and MLP)。该模型将命名实体识别(named entity recognition, NER)转化为机器阅读理解任务,将中文电子病历文本和预定义的查询语句串联作为输入,使用基于医学的预训练模型MC_BERT获取词向量,然后通过双向长短期记忆网络模型(BiLSTM)和多粒度扩张卷积模型分别获取双向的特征信息以及单词之间的信息,得到相应的特征向量,最后使用Hybrid-PBM预测器进行实体预测。在嵌套和平面NER数据集上进行实验。实验表明,该模型在糖尿病语料和公开医学数据集上优于其他主流神经网络模型,F1值比基线模型提高了1.21%~5.80%。  相似文献   

14.
混凝土大坝的渗漏是影响大坝安全运行的重要因素,在渗漏早期具有渗漏范围窄、渗流量小的特点,同时又处于复杂的背景流场中,传统的方法受分辨率以及抗干扰能力的限制,很难有效准确地检测渗漏部位。本文以龚嘴电站拦河坝渗漏入口部位检测为例,利用伪随机电流场拟合渗漏场,通过检测电流场的分布达到检测渗漏入口部位的目的。  相似文献   

15.
规模化风机高频运维信息愈发呈现数据高维、类间互联、规模攀升的特点,传统人工孤岛式故障检修运维模式难以适应人机料法环一体式发展进程。针对风机全环节、全要素的主动运维要求,提出知识规则、主从设备、规范条例一体融合的风电机组运维知识图谱构建方法。利用图论文本关键词提取算法(TextRank)完成对风电专业运维文本的实体识别与关系抽取,用以提高特征词的提取精度。采用Neo4j图数据库构建风电安全管理规程图谱及风电设备运维图谱,实现多元数据的互联与可视,进而实现风电运维信息的智能化查询。应用上述方法构建了629个实体、742条关系类型的风机知识图谱。数据查询试验表明:该方法的精确率及召回率等主要指标均在89%以上,较传统数据库方法平均提升了6.5%。该方法建立了运维要求可视表达和类间任务关联。运维大数据的有效查询,将有助于节省双碳战略风电运维力量,提高运维智能化水平。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号