首页 | 本学科首页   官方微博 | 高级检索  
     

基于BERT与柱搜索的中文释义生成
引用本文:范齐楠,孔存良,杨麟儿,杨尔弘.基于BERT与柱搜索的中文释义生成[J].中文信息学报,2021,35(11):80-90.
作者姓名:范齐楠  孔存良  杨麟儿  杨尔弘
作者单位:1.北京语言大学 信息科学学院,北京 100083;
2.北京语言大学 语言资源高精尖创新中心,北京 100083
基金项目:北京语言大学研究生创新基金(中央高校基本科研业务费专项资金)(20YCX139);北京语言大学语言资源高精尖创新中心项目(TYZ19005);国家语委信息化项目(ZDI135-105)
摘    要:释义生成任务是指为一个目标词生成相应的释义。该文在中文释义生成任务中使用了目标词的上下文信息,并提出了一个基于BERT与柱搜索的释义生成模型。该文构建了包含上下文的CWN中文数据集,同时也在Oxford英文数据集上开展了实验。实验结果显示,该文模型在中英文数据集上性能均有显著提升,其中CWN数据集实验结果相比基线模型BLEU指标提升了10.47,语义相似度指标提升了0.105。语义相似度指标与人工评价结果相关性更高。最后,该文分析了中文释义生成任务仍存在的四个问题。

关 键 词:中文释义生成  BERT  柱搜索  
收稿时间:2021-02-22

Chinese Definition Modeling Based on BERT and Beam Search
FAN Qinan,KONG Cunliang,YANG Liner,YANG Erhong.Chinese Definition Modeling Based on BERT and Beam Search[J].Journal of Chinese Information Processing,2021,35(11):80-90.
Authors:FAN Qinan  KONG Cunliang  YANG Liner  YANG Erhong
Affiliation:1.School of Information Science, Beijing Language and Culture University, Beijing 100083, China;2.Advanced Innovaion Center for Language Resources, Beijing Language and Culture University, Beijing 100083, China
Abstract:Definition modeling task refers to generate a corresponding definition for a target word. This paper introduces the context information of the target word and proposes a definition generation model based on BERT and beam search. A CWN Chinese definition modeling dataset is constructed with context of the target word. Experiments on this Chinese dataset and the English Oxford dataset show that the model achieves significant improvements in both dataset. Especially in CWN dataset, compared with the baseline model, the BLEU score is improved by 10.47, and the semantic similarity is improved by 0.105.
Keywords:Chinese definition modeling  BERT  beam search  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号