基于多头注意力的电网调度领域命名实体识别 |
| |
引用本文: | 毛宏亮,艾孜尔古丽,陈德刚.基于多头注意力的电网调度领域命名实体识别[J].计算机技术与发展,2023(2):181-186+194. |
| |
作者姓名: | 毛宏亮 艾孜尔古丽 陈德刚 |
| |
作者单位: | 1. 新疆师范大学计算机科学技术学院;2. 国家语言资源监测与研究少数民族语言中心 |
| |
基金项目: | 国家自然科学基金资助项目(61662081);;新疆维吾尔自治区自然科学基金资助项目(2017D01A58); |
| |
摘 要: | 针对电网调度领域实体识别准确率较低的问题,提出一种融合多头注意力机制和双向长短时记忆网络的电网调度领域中文命名实体识别方法。利用词向量表示电网调度语音识别后语句,并将生成的词向量序列输入双向长短时记忆网络(BiLSTM)挖掘其上下文语义特征,引入多头注意力机制重点关注文本中的实体词,挖掘其隐藏特征,同时通过条件随机场(CRF)计算序列标签的联合概率标注出实体识别结果。根据电网调度语音识别后文本特点自建标注数据集,并将电网调度语音识别文本中的命名实体细粒度划分为参数、设备、操作、系统、组织5个类别进行实验。其结果表明,该方法对电网调度领域实体识别具有更高的准确率和召回率,且F1值可达到93.63%,切实解决了电网调度领域实体识别任务中标注数据稀少和精度较低的问题,有助于电网调度领域知识图谱的构建。
|
关 键 词: | 实体识别 电网调度 多头注意力 双向长短时记忆 联合概率 知识图谱 |
|