首页 | 本学科首页   官方微博 | 高级检索  
     

融合多策略数据增强的低资源依存句法分析方法
引用本文:线岩团,高凡雅. 融合多策略数据增强的低资源依存句法分析方法[J]. 计算机科学, 2022, 49(1): 73-79. DOI: 10.11896/jsjkx.210900036
作者姓名:线岩团  高凡雅
作者单位:昆明理工大学信息工程与自动化学院 昆明 650500,昆明理工大学云南省人工智能重点实验室 昆明 650500
基金项目:国家自然科学基金项目(61732005,61972186);云南省重大科技专项(202002AD080001,202103AA080015);云南省高新技术产业专项(201606)。
摘    要:依存句法分析旨在识别句子中词与词之间的句法依赖关系。依存句法能为信息抽取、自动问答和机器翻译等任务提供句法特征,提高模型性能。训练数据规模对依存句法分析模型的性能具有重要影响,训练数据的缺乏会带来严重的未知词问题和模型过拟合问题。文中针对低资源依存句法分析问题,提出了多种数据增强策略。所提方法通过同义词替换有效扩充了训练数据,缓解了未知词问题。通过多种Mixup的数据增强策略,有效缓解了模型过拟合问题,提高了模型的泛化能力。在(Universal Dependencies treebanks, UD treebanks)数据集上的实验结果表明,所提方法有效提升了小规模训练语料条件下泰语、越南语和英语依存句法分析的性能。

关 键 词:依存句法分析  低资源语言  Mixup数据增强  同义词替换  多策略

Improving Low-resource Dependency Parsing Using Multi-strategy Data Augmentation
XIAN Yan-tuan,GAO Fan-ya. Improving Low-resource Dependency Parsing Using Multi-strategy Data Augmentation[J]. Computer Science, 2022, 49(1): 73-79. DOI: 10.11896/jsjkx.210900036
Authors:XIAN Yan-tuan  GAO Fan-ya
Affiliation:(Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China;Yunnan Key Laboratory of Artificial Intelligence,Kunming University of Science and Technology,Kunming 650500,China)
Abstract:
Keywords:Dependency parsing  Low-resource language  Mixup data augmentation  Synonym substitution  Multi-strategy
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号