面向领域新闻的词汇输入预测 |
| |
引用本文: | 张明西,马悦荣,林启新.面向领域新闻的词汇输入预测[J].计算机工程与设计,2023(1):262-268. |
| |
作者姓名: | 张明西 马悦荣 林启新 |
| |
作者单位: | 上海理工大学出版印刷与艺术设计学院 |
| |
基金项目: | 国家自然科学基金项目(62002225);;上海市自然科学基金项目(21ZR1445400); |
| |
摘 要: | 为解决领域新闻中词汇使用频率对输入预测准确度的影响,提出一种面向领域新闻的词汇输入预测方法,结合样本修剪提升LSTM应用于领域新闻词汇预测中的准确性。利用文本的词序关系形成词汇网络,构建词汇相关度度量模型计算词汇间的相关度,依据词汇间的强弱关系进行词汇修剪。基于词序关系,采用LSTM进行训练,生成词汇输入预测序列。实验结果表明,相比传统LSTM模型,所提方法能够提升平均4.73%的准确率,验证了所提方法的可行性与有效性。
|
关 键 词: | 长短期记忆网络 领域新闻 词汇输入预测 词汇网络 TFIDF模型 |
|
|