基于注意力机制的Siamese-BiLSTM短文本相似度算法 |
| |
引用本文: | 徐菲菲,冯东升.基于注意力机制的Siamese-BiLSTM短文本相似度算法[J].计算机应用与软件,2022(4):281-286+325. |
| |
作者姓名: | 徐菲菲 冯东升 |
| |
作者单位: | 上海电力大学计算机科学与技术学院 |
| |
基金项目: | 国家自然科学基金项目(61272437,61305094);;上海市教育发展基金会和上海市教育委员会“晨光计划”项目(13CG58);;上海市自然科学基金项目(13ZR1417500); |
| |
摘 要: | 提出将注意力机制引入至孪生网络(Siamese Network)结构,通过注意力机制对句子中单词进行重要性评分,以双向长短时记忆网络(BiLSTM)作为基准系统,获得文本语义的深层次特征表示,从而有效地提升短文本相似度的准确率。实验采用通用公开标注数据集Quora语句对集和蚂蚁金服句对集,结果表明,与传统神经网络以及Siamese-Net网络相比,所提出的算法在短文本相似度总体效果上有明显提升,验证了所提算法的有效性。
|
关 键 词: | 短文本 相似度 孪生网络 长短时记忆网络 注意力机制 |
|