基于多重启发式规则的英文特征值提取算法研究 |
| |
作者姓名: | 郑海燕 |
| |
作者单位: | 咸阳职业技术学院 |
| |
基金项目: | 2021年度陕西省教育科学“十四五”规划课题(SGH21Y0597); |
| |
摘 要: | 提出一种基于多重启发式规则的英文特征值提取算法。该算法从概率论和英语语义两个层面引入了词频启发式规则、集中度启发式规则、同义启发式规则、同源启发式规则等特征值提取手段,阐述各种启发规则下的数据处理方法以及特征值提取算法具体流程,并将所提出的基于多重启发式规则的英文特征值提取算法与基于词频的常规算法进行对比,取得了较为理想的特征值提取效果。
|
关 键 词: | 英文文本 特征值提取 概率启发 语义启发 |
|
|