首页 | 本学科首页   官方微博 | 高级检索  
     

一种句词五特征融合模型的复述研究
引用本文:何贤江,何维维,左航. 一种句词五特征融合模型的复述研究[J]. 四川大学学报(工程科学版), 2012, 44(6): 127-132
作者姓名:何贤江  何维维  左航
作者单位:四川大学计算机学院,四川成都,610065
摘    要:为解决中文同义词词林无法用做上下文相关的复述语料问题,提出了一种词汇级复述方法。在中文大语料库环境下,根据给定的上下文,提取复述目标词和复述候选词;建立词、句融合的分层概率统计模型,给出了计算句、词复述相似度的5项特征值,用以训练二元分类器,并对候选复述词进行筛选。实验结果证明:1)基于大语料库数据挖掘,获取候选复述词提取方法具有实用价值,每个目标词给定的上下文句子中获取3.1个正确复述词;2)利用二元分类器对复述确认是有效的,精确率达到0.65;3)提取的复述中,有32%在《中文同义词扩展词林》无法查出,有效扩展了传统同义词复述方法。

关 键 词:中文复述  五特征融合  智能识别  二元分类
收稿时间:2012-06-27
修稿时间:2012-09-20

Research on Word-level Contextual Paraphrase Retrieving with Five-features
He Xianjiang,He Weiwei and Zuo Hang. Research on Word-level Contextual Paraphrase Retrieving with Five-features[J]. Journal of Sichuan University (Engineering Science Edition), 2012, 44(6): 127-132
Authors:He Xianjiang  He Weiwei  Zuo Hang
Affiliation:School of Computer Sci.,Sichuan Univ.;School of Computer Sci.,Sichuan Univ.;School of Computer Sci.,Sichuan Univ.
Abstract:
Keywords:Chinese paraphrase  five-feature  intelligent identification  binary classification
本文献已被 万方数据 等数据库收录!
点击此处可从《四川大学学报(工程科学版)》浏览原始摘要信息
点击此处可从《四川大学学报(工程科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号