面向农业知识图谱构建的文本实体标注准则构建及应用 |
| |
作者姓名: | 陈晓晋 唐球 王耀君 |
| |
作者单位: | 中国农业大学信息与电气工程学院,北京100083;中国电子信息产业集团有限公司第六研究所,北京100083 |
| |
摘 要: | 随着农业大数据及智慧农业的发展,面对海量的农业文本数据,构建知识图谱等自然语言处理应用需求逐渐增长。目前,在农业领域的实体语料库及实体标注体系仍处于空白状态。对农业文本进行处理时,面临如何定义实体类别及范围等问题。基于此问题,以农业科学叙词表为科学依据,提出面向农业知识图谱构建的农业文本数据实体标注准则,涵盖了农作物、病虫草害等多种农业实体,以及基于该准则设置标注原则构建基于农业文本的自注释语料库,并进行实验验证,证明了该准则的有效性。该准则为农业实体语料库的构建提供可参考的标注规范,以及为农业实体识别提供语料支持。
|
关 键 词: | 知识图谱 农业文本 实体标注 知识表示 |
本文献已被 万方数据 等数据库收录! |
|