首页 | 本学科首页   官方微博 | 高级检索  
     

汉语篇章修辞结构的标注研究
引用本文:乐明.汉语篇章修辞结构的标注研究[J].中文信息学报,2008,22(4):19.
作者姓名:乐明
作者单位:浙江大学 外国语学院语言学研究所,浙江 杭州 310058
基金项目:浙江省社会科学联合会资助项目
摘    要:汉语篇章修辞结构标注项目CJPL采用大陆主要媒体的财经评论文章为语料,依据修辞结构理论(Rhetorical Structure Theory,RST),定义了以标点符号为边界的篇章修辞分析基本单元和47种区分核心性单元的汉语修辞关系集,并草拟了近60页的篇章结构标注工作守则。这一工作目前完成了对97篇财经评论文章的修辞结构标注,在较大规模数据的基础上检验了修辞结构理论及其形式化方法在汉语篇章分析中的可移用性。树库所带有的修辞关系信息以及三类篇章提示标记的篇章用法特征,可以为篇章层级的中文信息处理提供一些浅层语言形式标记的数据。

关 键 词:计算机应用  中文信息处理  汉语语料库  篇章标注  修辞结构理论  

Rhetorical Structure Annotation of Chinese News Commentaries
YUE Ming.Rhetorical Structure Annotation of Chinese News Commentaries[J].Journal of Chinese Information Processing,2008,22(4):19.
Authors:YUE Ming
Affiliation:Institute of Linguistics, School of International studies, Zhejiang University, Hangzhou, Zhejiang 310058, China
Abstract:This paper reports a rhetorical structure annotation project to a Chinese news commentary corpus Caijingpinglun(CJPL) for the purpose of natural language processing.The elementary discourse unit(EDU) in this project is defined as a string between two selected punctuation marks.And altogether 47 Chinese rhetorical relations are defined to mark the nuclarity according to the classic rhetorical structure theory(RST).A 60-page annotation manual with detailed rules of EDU segmentation,EDU combination,relation and scheme tagging protocols are composed.Analysis on the first manually annotated set of 97 texts shows that the RST has good cross-language transferability to Chinese,and the data obtained from this project may be further exploited in Chinese discourse processing.
Keywords:computer application  Chinese information processing  Chinese corpus  discourse annotation  rhetorical structure theory
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号