联合词性特征的微博文本命名实体识别 |
| |
引用本文: | 王昊,史玉雪,刘高军,段建勇.联合词性特征的微博文本命名实体识别[J].北方工业大学学报,2019,31(5). |
| |
作者姓名: | 王昊 史玉雪 刘高军 段建勇 |
| |
作者单位: | 北方工业大学信息学院,100144,北京;北方工业大学信息学院,100144,北京;北方工业大学信息学院,100144,北京;北方工业大学信息学院,100144,北京 |
| |
基金项目: | 国家自然科学基金;重点实验室项目;北方工业大学科研启动基金 |
| |
摘 要: | 微博文本语法不规范且多由短语组成,严重影响了现有针对规范、长句文本设计的命名实体识别算法的性能.针对上述问题,本文提出了一种融合词性信息的微博文本命名实体识别模型.该模型通过分词工具提取词性信息,将词性信息作为特征与单词嵌入向量结合后输入双向长短期记忆神经网络,最后使用条件随机场对神经网络输出进行解码,从而实现词性特征辅助命名实体识别.实验结果表明,融合词性信息的命名实体识别模型,显著提高了微博文本命名实体识别的准确率.相比于其它模型,该模型F1值提高了1. 88%.
|
关 键 词: | 命名实体识别 微博文本 词性特征 神经网络 |
本文献已被 CNKI 万方数据 等数据库收录! |
|