正则表达式在PDTB语料数据预处理中的应用 |
| |
作者姓名: | 贾震斌 |
| |
作者单位: | 苏州市职业大学,江苏苏州,215004 |
| |
基金项目: | 国家自然科学基金支持;基金 |
| |
摘 要: | 篇章关系识别是计算机自然语言处理领域中近年来研究的一个难点,采用语料库结合机器学习分类是目前主要研究路径,将语料数据转换成适合篇章关系识别训练与测试数据过程通常比较繁琐,本文结合自己研究过程提出了语料数据预处理的方法,该方法在隐式篇章关系识别研究效率中取得了明显效果,为进一步研究提供了基础。
|
关 键 词: | 自然语言理解 语料数据预处理 正则表达式 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|