首页 | 本学科首页   官方微博 | 高级检索  
     

融合音节和词条特征的藏文文本情感分类研究
引用本文:孟祥和,于洪志.融合音节和词条特征的藏文文本情感分类研究[J].中文信息学报,2023(2):80-86.
作者姓名:孟祥和  于洪志
作者单位:西北民族大学中国民族语言文字信息技术教育部重点实验室
基金项目:西北民族大学2021年度中央高校基本科研业务费项目(31920210087);;西北民族大学2020年度中央高校基本科研业务费项目(31920200116);
摘    要:将深度神经网络模型应用于藏文文本情感分类中,虽然取得不错的分类效果,但仍然存在因藏文评论文本长度较短引起的特征稀疏的问题,使得深度学习模型不能够提取到更为全面的藏文文本语义特征。该文提出一种以藏文音节和藏文词条同时作为文本基本表示对象,采用CNN、BiLSTM和Multi-Headed Self-Attention机制等深度学习模型完成对藏文评论文本情感分类的研究方法。实验首先对音节和词条进行向量化表示,然后分别采用多核卷积神经网络、BiLSTM和Multi-Headed Self-Attention机制获取藏文文本中多维度的内部特征,最后通过特征拼接,再经激活函数为Softmax的全连接神经网络完成文本情感分类。研究结果表明,在该文的实验测试语料集上,融合音节和词条特征模型的分类准确率要优于基于音节的模型和基于词条的模型。

关 键 词:藏文文本  情感分类  藏文音节  深度神经网络
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号