改进的关键词抽取方法研究 |
| |
引用本文: | 邓箴,包宏.改进的关键词抽取方法研究[J].计算机工程与设计,2009,30(20). |
| |
作者姓名: | 邓箴 包宏 |
| |
作者单位: | 北京科技大学信息工程学院,北京,100083 |
| |
基金项目: | 国家973重点基础研究发展计划基金项目 |
| |
摘 要: | 在关键词抽取方法研究中,提出了多步骤的,针对任意领域的文本关键词抽取方法.该方法采用多元文法进行候选关键词抽取,提出了基于语言学特征的扩展tf/idf关键词的加权计算方法,以及能够抽取未登录词的关键词的方法和对关键词抽取进行优化的策略.首次提出了用支持向量机对最后的抽取结果进行优化.实验结果表明,该方法与单纯的tf/idf算法相比,具有更高的查准率和查全率.
|
关 键 词: | 关键词抽取语言学特征 特征拟合 多元文法 支持向量机 |
Improved keywords extraction method research |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|