首页 | 本学科首页   官方微博 | 高级检索  
     

基于二元分类的复述搭配抽取
引用本文:赵世奇,赵 琳,刘 挺,李 生.基于二元分类的复述搭配抽取[J].软件学报,2010,21(6):1267-1276.
作者姓名:赵世奇  赵 琳  刘 挺  李 生
作者单位:哈尔滨工业大学,计算机科学与技术学院,黑龙江,哈尔滨,150001
基金项目:Supported by the National Natural Science Foundation of China under Grant Nos.60803093, 60675034 (国家自然科学基金); the National High-Tech Research and Development Plan of China under Grant No.2008AA01Z144 (国家高技术研究发展计划(863))
摘    要:以动宾关系的搭配为例研究复述搭配的抽取.具体地,该方法将复述搭配抽取视作二元分类问题,并综合使用了基于翻译、词典、极性词以及网络挖掘的多种特征.实验结果表明,所采用的二元分类方法对于抽取复述搭配是行之有效的,其中使用的各种特征对于提高复述搭配抽取的效果皆有帮助.利用该方法,共抽取出28万余对的复述搭配,其准确率超过70%.进一步的实验结果表明,使用抽取的复述搭配,可以为约40%的句子实现复述生成,从而说明了该方法的实际应用价值.

关 键 词:复述搭配  二元分类  复述特征
修稿时间:2009/1/15 0:00:00

Paraphrase Collocation Extraction Based on Binary Classification
ZHAO Shi-Qi,ZHAO Lin,LIU Ting and LI Sheng.Paraphrase Collocation Extraction Based on Binary Classification[J].Journal of Software,2010,21(6):1267-1276.
Authors:ZHAO Shi-Qi  ZHAO Lin  LIU Ting and LI Sheng
Abstract:
Keywords:paraphrase collocation  binary classification  paraphrase feature
本文献已被 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号