首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的汉语语义角色分类体系与标注实践
引用本文:宋衡,曹存根,王亚,王石.一种改进的汉语语义角色分类体系与标注实践[J].中文信息学报,2023(1):16-32.
作者姓名:宋衡  曹存根  王亚  王石
作者单位:1. 中国科学院计算技术研究所智能信息处理重点实验室;2. 中国科学院大学
基金项目:国家重点研发计划(2017YFC1700302,2017YFB1002300);;国家自然科学基金(61702234);;北京市科技新星计划交叉学科合作课题(Z191100001119014);
摘    要:语义角色标注是自然语言处理中的一项重要任务,涉及文本挖掘、神经网络学习、统计语言学等多个研究领域。在对一个汉语语料库进行语义角色分析时,发现现有的汉语语义角色体系存在一定的局限性。通过引入新的语义角色、吸收和重新定义现有语义角色体系中的语义角色,该文提出了一种改进的汉语语义角色分类体系。该语义角色分类体系将事件中的语义角色分为两大类,即中枢语义角色和周边语义角色,其中,周边语义角色可进一步被细分为主要周边语义角色和辅助周边语义角色。为了减少语义理解的主观性从而客观地判断语义角色类型,该文基于语义和句式以“判断标准-相应例句”的形式详细解释了语义角色分类体系中的主要周边语义角色,并从中枢语义角色半自动化判断、复合动词作中枢语义角色处理、易混淆语义角色难点分析和辅助周边语义角色标注规定等多个方面给出了提高语义角色标注一致性的说明。最后,根据提出的语义角色分类体系对实验语料库进行了语义角色的标注实践,分析了标注一致性,统计了新提出和重定义的主要周边语义角色在语料库中的分布情况,并与基于鲁川语义角色分类体系得到的标注结果进行了对比。

关 键 词:汉语语义角色分类体系  知识抽取  文本挖掘  浅层语义分析  语料库
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号