汉英篇章衔接对齐语料库构建研究 |
| |
作者姓名: | 李艳翠 冯继克 来纯晓 冯洪玉 冯文贺 |
| |
作者单位: | 1.河南师范大学 计算机与信息工程学院,河南 新乡 453007; 2. 河南科技学院 信息工程学院,河南 新乡 453003; 3.广东外语外贸大学 语言工程与计算实验室,广东 广州 510006 |
| |
基金项目: | 国家自然科学基金(61502149);河南省科技计划项目(182102210048);广东省基础与应用基础研究基金项目(2020A1515011056) |
| |
摘 要: | 篇章衔接性分析是理解篇章的基础,汉语和英语在指代、连接和省略等主要衔接方式上存在差异。该文分别给出子句、连接词、指代和省略的汉英篇章衔接对齐标注策略,创建了规模为200个对齐文档的语料库资源,对标注语料进行质量评估并讨论了标注中的难点问题及解决方法。语料库中的子句、连接词和指代标注一致率分别为0.909、0.876和0.920。在该文构建的语料库上分别进行子句切分和连接词识别实验,结果表明,该文语料标注策略切实可行,标注质量满足实际需要。
|
关 键 词: | 篇章衔接 对齐语料标注 指代 省略 连接 |
|
| 点击此处可从《中文信息学报》浏览原始摘要信息 |
|
点击此处可从《中文信息学报》下载全文 |
|