首页 | 本学科首页   官方微博 | 高级检索  
     

面向电网设备故障报告的半监督命名实体识别方法
引用本文:杨祎,崔其会,丁奕齐.面向电网设备故障报告的半监督命名实体识别方法[J].计算机应用,2021,41(z2):41-47.
作者姓名:杨祎  崔其会  丁奕齐
作者单位:国网山东省电力公司电力科学研究院,济南250000;北京邮电大学计算机学院,北京100876
摘    要:针对电网领域命名实体识别(NER)对人工标注的依赖问题,提出了一种面向电网设备故障报告的半监督命名实体识别方法Semi-supervised PGTBC.首先使用基于多头自注意力机制的深度自注意力网络进行特征抽取,然后结合双向长短记忆神经网络(BiLSTM)和条件随机场模型(CRF)建立电网领域命名实体识别模型,最后基于半监督思想,引入基于深度自注意力网络的实体类别综合描述相似度计算,结合PGTBC的置信度作为半监督阈值筛选依据,减少对电网设备故障报告实体标注的依赖.数据集使用来源于1256篇的电网故障报告的10301条标注样本数和30829条无标注样本数.在有标注电网领域数据上的实验结果表明,基于PGTBC模型的预测F1为96.43%,相对于传统的BiLSTM-CRF模型提高了7.09个百分点.在无标注样本上,半监督方法Semi-supervised PGTBC取得了93.16%的F1,相对半监督CRF模型的F1提高了23.4个百分点,并对无标注样本进行了自动标注,识别出1661条新实体,有效减少电网设备故障报告命名实体任务对人工标注的依赖.

关 键 词:命名实体识别  电网设备  半监督学习  多头自注意力机制  深度自注意力网络  双向长短记忆神经网络

Named entity recognition method for power grid equipment fault report based on semi-supervised learning
YANG Yi,CUI Qihui,DING Yiqi.Named entity recognition method for power grid equipment fault report based on semi-supervised learning[J].journal of Computer Applications,2021,41(z2):41-47.
Authors:YANG Yi  CUI Qihui  DING Yiqi
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号