首页 | 本学科首页   官方微博 | 高级检索  
     

汉英篇章衔接对齐语料库构建研究
作者姓名:李艳翠  冯继克  来纯晓  冯洪玉  冯文贺
作者单位:1.河南师范大学 计算机与信息工程学院,河南 新乡 453007;
2. 河南科技学院 信息工程学院,河南 新乡 453003;
3.广东外语外贸大学 语言工程与计算实验室,广东 广州 510006
基金项目:国家自然科学基金(61502149);河南省科技计划项目(182102210048);广东省基础与应用基础研究基金项目(2020A1515011056)
摘    要:篇章衔接性分析是理解篇章的基础,汉语和英语在指代、连接和省略等主要衔接方式上存在差异。该文分别给出子句、连接词、指代和省略的汉英篇章衔接对齐标注策略,创建了规模为200个对齐文档的语料库资源,对标注语料进行质量评估并讨论了标注中的难点问题及解决方法。语料库中的子句、连接词和指代标注一致率分别为0.909、0.876和0.920。在该文构建的语料库上分别进行子句切分和连接词识别实验,结果表明,该文语料标注策略切实可行,标注质量满足实际需要。

关 键 词:篇章衔接  对齐语料标注  指代  省略  连接  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号