植物属性文本的命名实体识别方法研究 |
| |
引用本文: | 李冬梅,檀稳. 植物属性文本的命名实体识别方法研究[J]. 计算机科学与探索, 2019, 13(12): 2085-2093 |
| |
作者姓名: | 李冬梅 檀稳 |
| |
作者单位: | 北京林业大学 信息学院,北京,100083 |
| |
基金项目: | The National Natural Science Foundation of China under Grant;the Fundamental Research Funds for the Central Universities of China under Grant |
| |
摘 要: | 植物属性文本的命名实体识别对林业领域的信息抽取和知识图谱的构建起着重要的作用,针对该问题,提出了一种基于双向长短时记忆网络(BiLSTM)、卷积神经网络(CNN)和条件随机场(CRF)模型的植物属性文本命名实体识别方法 BCC-P。分析了植物属性文本的特点,并进行预处理和标注,完成数据集的构建。BCC-P方法通过BiLSTM模型对植物属性文本进行建模,有效捕捉植物属性文本中的上下文语义特征。将获得的特征传递到CNN模型,进一步提取深度特征。最后使用了CRF模型进行植物属性文本的标注,输出在句子序列上最优的标注结果。在植物属性文本语料上的实验表明,该方法的准确率达到了91.8%,因此能够有效应用于植物属性文本的命名实体识别任务。
|
关 键 词: | 命名实体识别 双向长短时记忆网络(BiLSTM) 卷积神经网络(CNN) 条件随机场(CRF) |
Research on Named Entity Recognition Method in Plant Attribute Text |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|