首页 | 本学科首页   官方微博 | 高级检索  
     

中文模糊限制信息范围语料库的研究与构建
引用本文:周惠巍,杨 欢,徐俊利,张 静,亢世勇. 中文模糊限制信息范围语料库的研究与构建[J]. 中文信息学报, 2017, 31(3): 77-85
作者姓名:周惠巍  杨 欢  徐俊利  张 静  亢世勇
作者单位:1. 大连理工大学 计算机科学与技术学院,辽宁 大连 116024;
2. 鲁东大学 文学院,山东 烟台 264025
基金项目:国家自然科学基金(61272375)
摘    要:模糊限制语用于表示不确定性的观点。由模糊限制语所引导的信息为模糊限制信息,开展中文模糊限制信息检测研究,对事实信息抽取意义重大。模糊限制信息检测包含模糊限制性句子识别和模糊限制信息范围检测两个子任务。中文模糊限制信息范围语料库的缺乏,影响了中文模糊限制信息检测的研究。该文研究制定了基于短语结构的中文模糊限制信息范围标注规则,构建了中文模糊限制信息范围语料库。最后对标注的语料库进行了统计和分析。该文语料库的构建为中文模糊限制信息检测研究提供了资源支持。

关 键 词:中文模糊限制信息范围  标注规则  语料库  

Construction of Chinese Hedge Scope Corpus
ZHOU Huiwei,YANG Huan,XU Junli,ZHANG Jing,KANG Shiyong. Construction of Chinese Hedge Scope Corpus[J]. Journal of Chinese Information Processing, 2017, 31(3): 77-85
Authors:ZHOU Huiwei  YANG Huan  XU Junli  ZHANG Jing  KANG Shiyong
Affiliation:1. School of Computer Science and Technology, Dalian University of Technology, Dalian, Liaoning 116024,China;
2. School of Liberal Arts, Ludong University, Yantai, Shandong 264025,China
Abstract:Hedge is usually used to express uncertainty. Hedge information indicates that authors do not backup their statements with facts. Chinese hedge information detection is of great significance for Chinese factual information extraction. Hedge information detection contains two subtasks: identifying hedges and detecting the in-sentence scopes of hedge cues. The lack of Chinese hedge scope corpus has limited the research of Chinese hedge scope information detection. This paper first manually crafted the syntactic rules for Chinese hedge scope annotation, and then constructs a Chinese hedge scope corpus. Finally, we statistically analyzed the corpus. The construction of the corpus provides a great support for Chinese uncertainty detection.
Keywords:Chinese hedge scope   annotation rules   corpus  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号