首页 | 本学科首页   官方微博 | 高级检索  
     

开放域上基于深度语义计算的复述模板获取方法
引用本文:刘明童,张玉洁,徐金安,陈钰枫.开放域上基于深度语义计算的复述模板获取方法[J].中文信息学报,2018,32(2):94-101.
作者姓名:刘明童  张玉洁  徐金安  陈钰枫
作者单位:北京交通大学 计算机与信息技术学院,北京 100044
基金项目:北京交通大学人才基金(KKRC11001532);国家自然科学基金(61370130,61473294);北京市自然科学基金(4172047)
摘    要:利用实体关系从网络大规模单语语料获取复述模板的方法可以规避对单语平行语料或可比语料的依赖,但是后期需要人工对有语义差异的关系模板分类后获取复述模板。针对这一遗留问题,该文提出基于深度语义计算的复述模板自动获取方法,首先设计基于统计特征的模板裁剪方法,从非复述语料中获取高质量的关系模板,然后设计基于深度语义计算的关系模板聚类方法获取高精度的复述模板。我们在四类实体关系数据上的实验结果表明,该方法实现了关系模板的自动获取与自动聚类,可以获得语义相近度更高、表现形式多样的复述模板。

关 键 词:关系模板  复述模板  深度语义计算  自动聚类  

An Open Domain Paraphrasing Patterns Acquisition Based on Deep Semantic Computing
LIU Mingtong,ZHANG Yujie,XU Jinan,CHEN Yufeng.An Open Domain Paraphrasing Patterns Acquisition Based on Deep Semantic Computing[J].Journal of Chinese Information Processing,2018,32(2):94-101.
Authors:LIU Mingtong  ZHANG Yujie  XU Jinan  CHEN Yufeng
Affiliation:School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China
Abstract:This paper proposes a method of paraphrasing pattern acquisition based on deep semantic computing. We design a sentence segmentation method based on statistical features to obtain high-quality relational patterns from non-paraphrasing corpus, and then the paraphrasing patterns are detected by entity relation patterns. Finally, the patterns are automatically clustered according to their semantic similarity. Our experimental results on the four types of entity relation show that our method acquired paraphrasing patterns with good performance, with more diversity and closer semantic relation.
Keywords:relational pattern  paraphrasing pattern  deep semantic computing  automatic clustering  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号