基于统计的行业中文文本关键词提取方法 |
| |
作者姓名: | 孙宏志 任丽妍 孙琪 |
| |
作者单位: | 中国矿业大学 北京 100083 |
| |
摘 要: | 本文针对垂直搜索引擎对中文文本关键词提取方法的需要,提出一种基于统计的行业中文文本关键词提取方法。该方法是将词语的位置信息、词跨度信息等指标融入到传统的基于统计特征的关键词提取方法之中,并采用一些方法对指标的权重进行校准,以达到垂直搜索引擎需要的提取的准确率和效率。实验表明,该方法能够有效提高对行业文本的关键词提取的准确率,具有良好的时间效率和稳定性。
|
关 键 词: | 提取 中文文本 垂直搜索引擎 |
本文献已被 CNKI 万方数据 等数据库收录! |
|