首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
当前电网数字化转型升级,电力设备智能运维技术快速发展,在运维过程中积累了大量包含电网重要信息的电力设备缺陷文本。由于文本数据标签稀疏,以及描述语言的模糊性、差异性等问题,电力文本中的运维信息难以被有效挖掘。文章提出了一种针对电力设备缺陷文本的数据增强方法。首先,使用缺陷文本数据集微调预训练模型ERNIE(enhanced representation through knowledge integration),应用多阶段知识掩码策略将电气领域专业知识集成到对缺陷文本的动态编码中;然后在流形假设的基础上基于降噪自动编码器架构设计破坏函数和重建函数,遵循基于信息价值的掩码单元选择策略构建破坏函数,基于微调过的ERNIE构建重建函数,在“破坏-重建”过程中获得位于原始数据流形范围内的增强样本;其次对增强数据集基于影响函数和多样性度量进行数据选择,过滤掉数据质量差和重复度高的增强样本;最后通过多层训练框架,将增强数据应用于各种缺陷文本挖掘任务。算例基于真实设备巡检、检修记录构建了电力设备缺陷文本等级分类任务。结果表明,所提出的算法对缺陷文本挖掘效果有较大提升,并且可以广泛灵活地应用在多种电力...  相似文献   

2.
电力设备缺陷种类繁多,部分缺陷会引发设备故障,及时检测电力设备存在的缺陷是防止发生设备故障的重要手段。设备缺陷检测旨在从文本中识别触发词并且将文本划分对应的设备缺陷类型。针对电力领域缺陷数据集标注不足,以及由于文本中包含大量专业术语造成语义理解难等问题,研究基于深度学习的设备缺陷检测方法,设计电力领域设备缺陷检测预训练语言模型,利用事件三元组知识。文中,构建一个电力设备缺陷检测数据集,在模型进行缺陷检测任务之前,通过事件三元组预训练的方式提高语言模型的表征能力。实验表明,基于现场设备案例数据经过预训练的模型在缺陷检测任务上具有更好的表现效果,可以有效实现对电力领域缺陷报告文本的缺陷检测。  相似文献   

3.
电力设备在长期运行与维护过程中积累了大量电力文本,文本中含有常见的故障部位、故障现象与故障检修方法,由于电力文本常采用非结构化的形式进行记录,所以电力信息的自动挖掘难以准确实现.提出了一种新的电力实体信息识别方法(PowerBERT+Bi-LSTM+CRF,PBERTBiLC).该方法首先采用预训练方式对通用BERT进...  相似文献   

4.
电力设备在运行维护中积累了大量包含重要实体信息的故障文本,然而文本实体边界模糊、术语较多等特点导致传统实体识别方法训练效率低下,效果难以提升。为此,该文提出一种新的实体识别方法 I-BRC(integrated algorithm of BERT based BiRNN with CRF)。该方法采用字嵌入模型将文本逐字转化为字向量序列以避免分词处理带来的误差累积;利用循环神经网络与概率图模型对文本的序列特征信息进行抽取;集成多个单一类型实体识别器分别独立学习不同类型实体的特征并采用并行预训练机制提升算法训练效率;最后利用多类型识别器对识别结果进行整合。此外,通过调整单一类型实体识别器可以灵活机动地应对不同电力设备的实体识别任务,避免重复训练,节省计算资源。实验表明,所提出的I-BRC仅需3次迭代就可收敛,训练效率大幅度提升;且该模型的F1值、精确率、召回率分别达到了88.0%、86.8%与89.2%,相比传统模型性能提升了7.5%~29.3%,验证了所提模型的有效性与可行性。  相似文献   

5.
电力设备缺陷文本包含大量设备缺陷历史信息,从文本中精确辨识缺陷信息,可提供对于设备的故障率建模和健康状态评价问题的有效指导。引入依存句法分析技术,提出"左贪心"出栈规则和基于神经网络的依存关系状态转移分析模型,实现了电力设备实际缺陷文本和缺陷分类标准文本的依存句法树构建,并结合缺陷文本特点提出了电力设备依存句法树的剪枝、切分和重构方法。同时,提出了基于依存关系的树匹配算法,实现实际缺陷和标准缺陷依存句法树的匹配。以主变压器缺陷文本为例,研究了基于依存句法分析的缺陷信息辨识方法的可行性和有效性。结果表明,所提方法相比于其他树匹配算法和语义相似度计算方法在效率和准确性上有明显提升。  相似文献   

6.
充分利用历史电力设备缺陷描述文本可对新出现的设备故障进行快速分类,提升运维人员的检修效率,为此针对缺陷描述文本具有复杂语义等特点,提出基于多头注意力循环卷积神经网络(multi-head attention recurrent convolutional neural networks,MAT-RCNN)的电力设备缺陷...  相似文献   

7.
电网企业拥有大量蕴含着重要可靠性信息的设备缺陷文本,依靠人工进行挖掘不仅效率低而且准确性因人而异。以变压器缺陷文本为研究对象,通过分析文本的特点,建立了基于语义框架的电网缺陷文本挖掘模型,解决了缺陷文本句子成分难以划分、数字量无法精确提取等问题,为电网领域的非结构化数据挖掘提供了新技术。首先在建立本体词库基础上,对缺陷文本进行分词、词汇特征提取等预处理;然后定义了电力语义框架与语义槽,提出了槽填充和语义框架构建流程,并通过词串合并实现了本体字典自动完善;最后对缺陷文本挖掘结果在可靠性统计中的应用进行了研究。算例表明,所提出的挖掘技术应用于电网缺陷自动分类与统计中,具有可行性和有效性。  相似文献   

8.
电网生产管理系统中存在大量闲置的设备缺陷记录文本。针对电力设备缺陷文本的特点,构建了基于卷积神经网络的缺陷文本分类模型。首先通过分析大量电力设备缺陷记录,归纳了电力设备缺陷文本的特点;然后参考中文文本分类的一般流程,并考虑缺陷文本的特点,建立了一种基于卷积神经网络的电力缺陷文本分类模型;最后通过算例对基于卷积神经网络的缺陷分类模型和多种传统机器学习分类模型进行全面比较。算例结果表明,所提出的缺陷文本分类模型能显著降低分类错误率,在分类效率上也比较可观。  相似文献   

9.
电力变压器运维过程中形成的工作票及操作票等文本蕴藏着丰富的设备状态信息,然而由于中文文本结构和语义的复杂性,难以进行信息挖掘。针对该现状,提出基于深度语义学习的变压器运维文本信息挖掘方法。首先分析并归纳传统文本挖掘模型的局限性及变压器运维文本的特点,然后利用分布式文本学习工具word2vec,自动学习语义信息,将单词用低维稠密向量表示,并建立循环卷积神经网络,基于其端到端的网络结构提取文本的深层语义特征。基于变压器运维文本的案例分析表明,所提方法比常规文本挖掘方法的语义学习能力更优。通过对非结构化文本数据的信息挖掘,有利于今后结合结构化数据,全面评估变压器运行状态。  相似文献   

10.
电力设备铭牌包含丰富的设备信息,通过图文识别技术获取设备铭牌信息,可更加高效快捷地完成电力设备的信息统计、台帐校核等工作,也有利于提高电力系统的设备管理水平。针对电力设备铭牌与普通图像文本识别差异较大的特殊应用场景,文中提出一种基于深度学习的电力设备铭牌信息自动识别算法。该算法由铭牌检测、文本检测、文本识别三部分组成。通过改进损失函数设计、增加文本识别结果纠正、人工合成文本图像等方式,使得铭牌检测模型在测试集上的平均精度均值达到92.2%,文本检测模型在测试集上的F1值达到91.2%,文本识别模型的字符识别准确率达到94.0%,文本行识别准确率达到82.3%。  相似文献   

11.
日常安全巡检是维护长距离调水工程安全运行的重要手段.目前巡检采集的非结构化文本数据主要依靠人工进行安全等级评判,在工作效率和准确率方面存在明显不足.本研究基于自然语言处理技术,提出了一种面向字符层面的卷积神经网络的巡检安全文本智能分类方法.该方法通过引入预训练的单个字符向量改进卷积神经网络的输入层,使得分类模型直接从原...  相似文献   

12.
在设备运行维护中,记录了设备运行状态的非结构化数据尚未被挖掘并利用。为此,基于深度学习思想,提取运行检修过程中产生的设备缺陷记录的语义信息,并结合结构化的检测数据信息,提出了一种多源异构数据融合的电力变压器状态评价方法。该方法首先建立可识别电气专业术语的自定义词典,利用深度语义学习网络构建缺陷记录与缺陷等级间的深层映射关系;继而将基于结构化数据的计算结果和基于非结构化数据的计算结果进行加权求和,得到了不同运行状态下的隶属度。实验结果表明,所提出的非结构化信息挖掘方法具有98%~99%的分类准确度,且基于多源异构数据的变压器运行状态评价准确度达96.67%,可较准确地评估设备运行状态。  相似文献   

13.
本文的主要研究目的是探究文本挖掘技术在电力数据中的应用场景,通过对电力设备运行过程中累计的缺陷数据进行分析应用,实现缺陷处理措施的自动推荐,以提升检修消缺的效率,降低工单化过程的时间成本。本文首先构建了电力设备专业词库,词库来源主要包含电力行业常用词汇、南方电网设备类别词汇和缺陷数据特征词汇。其次对非结构化的缺陷文本数据,如:缺陷表象、缺陷原因及缺陷类型等数据,结合已构建的专业词库进行分词,提取出其中的关键字、并对关键程度进行排序。最后通过Simhash算法与汉明距离的计算在缺陷数据库中查询层发生过的相似度最高的缺陷,推荐其处理措施作为本条缺陷的参考。本文应用上述方法,成功实现了输入缺陷处理措施的推荐,且根据专家判断该措施可以实现这类缺陷的消缺。  相似文献   

14.
电网故障处置预案是电网故障处置的重要参考,对电网故障处置预案文本中各类电力设备、名称编号等细粒度的关键实体信息进行抽取,是实现计算机学习理解预案内容并进一步支撑故障处置智能化的重要基础。文中提出一种基于深度学习的电网故障处置预案文本命名实体识别技术,首先采用字向量表征预案文本,然后将注意力机制以及双向长短期记忆网络相结合,有所侧重地提取实体词深层字符特征,最后采用条件随机场求解最优序列化的标注。算例表明:文中所提预案文本命名实体识别模型不依赖人工特征,能够自动高效地提取文本特征,准确识别预案文本中细粒度的实体词,满足预案文本中关键实体信息精确定位和识别的要求。  相似文献   

15.
中文电子病历实体包含大量的医学领域词汇并具有明显的嵌套特征。嵌套实体识别时往往存在目标实体定位不完整、不准确的问题。针对这一问题,提出了一种基于机器阅读理解的中文电子病历嵌套命名实体识别模型MRC-PBM (machine reading comprehension-position information biaffine and MLP)。该模型将命名实体识别(named entity recognition, NER)转化为机器阅读理解任务,将中文电子病历文本和预定义的查询语句串联作为输入,使用基于医学的预训练模型MC_BERT获取词向量,然后通过双向长短期记忆网络模型(BiLSTM)和多粒度扩张卷积模型分别获取双向的特征信息以及单词之间的信息,得到相应的特征向量,最后使用Hybrid-PBM预测器进行实体预测。在嵌套和平面NER数据集上进行实验。实验表明,该模型在糖尿病语料和公开医学数据集上优于其他主流神经网络模型,F1值比基线模型提高了1.21%~5.80%。  相似文献   

16.
利用电力系统二次设备功能缺陷文本数据,建立了基于双向长短时记忆网络与条件随机场(BiLSTM-CRF)模型的文本信息抽取模型.在此基础上,为了进一步将数据中蕴含的知识价值应用到电力系统生产、管理过程中,构建了电力系统二次设备功能缺陷知识图谱,将各类数据间所含语义信息融入各类实体间的关系约束,建立了基于BiLSTM-CR...  相似文献   

17.
输电线路上的鸟巢会对电力设备的安全运行构成威胁,甚至影响整个电力系统的稳定性。针对复杂场景下输电线路鸟巢检测方法适用性较差的问题,提出一种基于改进YOLOv5的输电线路鸟巢检测方法。该方法结合通道注意机制和空间注意机制设计特征平衡网络,以通道权值和空间权值作为引导,实现检测网络不同层次特征之间语义信息和空间信息的平衡。同时,为了避免因网络层数增加导致特征信息不断被弱化的问题,设计特征增强模块以捕获与鸟巢相关的通道关系和位置信息。最后,利用输电线路无人机巡检图像建立鸟巢数据集进行训练和测试。实验结果表明,所提出的输电线路鸟巢检测方法具有较强的泛化能力和适用性,同时也为电力图像缺陷检测提供技术参考。  相似文献   

18.
刘赫  皮俊波  宋鹏程  赵翰林  张越  刘显壮 《中国电力》2022,55(9):105-110+120
为了提升电力调度文本在业务场景的应用效果,提出基于混合神经网络的电力调度文本事件抽取方法。以电力调度文本故障处置预案为研究对象,建立以预案触发词为中心的事件抽取模型。通过仿真案例验证了所提方法具有较好的事件抽取效果,能够提升实体和实体关系识别的准确率。  相似文献   

19.
针对车道线检测环境复杂,光照变化复杂等特点,提出了一种新型车道线检测方法。首先运用可变形卷积神经网络提取特征,然后通过对白天、夜晚、雨天等复杂光照条件下的KITTI道路数据集进行联合训练,端到端获取车道线上下文信息。建立结构化道路车道线网络模型,进而对车道线进行图像语义分割,并判断车道线类型。该模型预测车道线像素所属的场景语义类别,实现车道线实时检测。实验结果表明,该方法具有较好的准确性和实时性,在多场景结构化道路上的车道线识别率可达96.83%。  相似文献   

20.
为了提升电力调度文本在业务场景的应用效果,提出基于混合神经网络的电力调度文本事件抽取方法。以电力调度文本故障处置预案为研究对象,建立以预案触发词为中心的事件抽取模型。通过仿真案例验证了所提方法具有较好的事件抽取效果,能够提升实体和实体关系识别的准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号