首页 | 本学科首页   官方微博 | 高级检索  
     

汉语显式篇章关系分析
引用本文:丁彬,孔芳,李生,周国栋.汉语显式篇章关系分析[J].中文信息学报,2014,28(6):101-106.
作者姓名:丁彬  孔芳  李生  周国栋
作者单位:苏州大学 计算机科学与技术学院,江苏 苏州 215006
基金项目:国家自然基金(61333018);国家863(2012AA011102);国家自然基金(61273320)
摘    要:篇章关系分为显式和隐式两种。显式关系的显著特征是篇章的基本单元之间存在显式连接词。针对汉语显式篇章关系,构建了包括汉语连接词识别和篇章关系分类的显式篇章关系分析平台。该文选取汉语宾州树库(Chinese Penn Treebank, CTB)中的500篇文本进行了汉语显式篇章关系标注;结合连接词的中心词,采用最大熵分类器构建了汉语连接词识别模块,其性能F1值达到了66.79%;基于连接词及其词性等上下文特征,构建了篇章关系分类器,其在最顶层4大类语义关系上的分类性能的F1值为91.92%。

关 键 词:连接词识别  语义关系分类  最大熵分类器  

Explicit Discourse Relation Parsing of Chinese Text
DING Bin,KONG Fang,LI Sheng,ZHOU Guodong.Explicit Discourse Relation Parsing of Chinese Text[J].Journal of Chinese Information Processing,2014,28(6):101-106.
Authors:DING Bin  KONG Fang  LI Sheng  ZHOU Guodong
Affiliation:School of Computer Sciences and Technology, Soochow University, Suzhou, Jiangsu, 215006, China
Abstract:Discourse relations can be expressed explicitly or implicitly. This paper focuses on explicit discourse relations that are explicitly signaled by discourse connectives. We propose an explicit discourse relation parsing platform, containing connective identification and sense classification. Using 500 texts from the Chinese Discourse TreeBank corpus (CTB), we annotate an explicit discourse relations corpus. Considering headwords of connectives, we construct a connective identifier using maximum entropy based on this corpus, which reports F1 of 66.79%. And a sense classifier based on the context of connective itself is proposed and reports F1 of 91.92%.
Keywords:connectives identification  sense classification  maximum entropy classifier  
本文献已被 CNKI 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号