首页 | 本学科首页   官方微博 | 高级检索  
     

基于内容相似度的文摘自动评测方法及其有效性分析
引用本文:张姝,赵铁军,赵华,姚建民. 基于内容相似度的文摘自动评测方法及其有效性分析[J]. 高技术通讯, 2006, 16(3): 241-245
作者姓名:张姝  赵铁军  赵华  姚建民
作者单位:哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001
基金项目:国家科技攻关项目 , 中国科学院资助项目
摘    要:为进行快速、可重复地自动文摘评测,提出利用文本余弦相似度评价自动文摘系统的方法,研究了不同项权重选取策略对评测结果的影响.对比了多个英文单文档、多文档自动文摘系统的人工评测和自动评测结果,证明余弦相似度方法能够较有效地区分不同文摘质量的系统.统计相关分析表明该自动评测方法和人工评测存在较高的一致性.评测结果对比表明基于tf-idf词权重信息的余弦相似度方法改善了缺少评测语料的多文档文摘自动评测的质量.

关 键 词:文摘评测  相似度  项权重  相关性
收稿时间:2005-04-27
修稿时间:2005-04-27

Application and analysis of content-similarity-based automatic evaluation for summarization systems
Zhang Shu,Zhao Tiejun,Zhao hua,Yao Jianmin. Application and analysis of content-similarity-based automatic evaluation for summarization systems[J]. High Technology Letters, 2006, 16(3): 241-245
Authors:Zhang Shu  Zhao Tiejun  Zhao hua  Yao Jianmin
Abstract:A fast and reliable content-similarity-based evaluation method is proposed and implemented for automatic summarization system evaluation. Statistical correlation analysis shows that the method is highly consistent with human evaluation for both single- and multiple- English document summarization. A comparison of term weight calculation strategies shows that the ff-idf weighting has improved the cosine similarity based multi-document summarization evaluation performance with less test data.
Keywords:summarization evaluation   similarity   term weight   correlation
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号