共查询到10条相似文献,搜索用时 15 毫秒
1.
《中国计量学院学报》2020,(2):225-232
目的:情感分析问题是限制人工智能发展的瓶颈之一,针对传统的深度学习方法不能有效获取文本语义的问题,提出BLSTM算法和字词融合的文本情感分类方法。方法:首先将文本切分为以字为单位的序列,经过嵌入层后得到字向量序列;然后将文本分词,通过预训练的Word2Vec模型获取对应的词向量,将每个词的词向量重复"词的字数",得到和字向量对齐的词向量序列;最后将两者混合编码获得字词混合向量。在模型训练过程中,固定词向量不变,优化字向量,分别通过卷积神经网络和双向长短时记忆神经网络模型进行情感正负分类和主客观分类实验。结果:相对于字向量表示、词向量表示或者传统的字词融合向量,该字词融合方法在两种分类实验中的F值都有所提升。结论:使用BLSTM算法和字词融合方法相结合能够有效地提高文本情感分类模型的性能。 相似文献
2.
目的 为解决传统感性设计研究中意象实验耗时大以及小样本偶然性等问题,依托现有网络评价文本信息提取了用户意象认知。方法 首先,爬取大规模汽车外观评论文本,构建语义分析词汇库,构建word2vec词向量模型;然后,基于模型获取词库内部的语义联系,计算高频关键形容词之间的语义离散性,以构建代表性意象词空间;最后,通过语义量化匹配将评论映射到意象词空间,得到大规模用户对各车型的显著性意象表征,明确了指定意象词汇下的汽车外观匹配结果。结果 运用该方法挖掘汽车外观显著性意象与基于人工评价的实验结果无显著性差异且具有高度相关性,证明了该方法的有效性。结论 以该方法挖掘用户意象认知,运用了现有的大批量用户反馈知识,提高了意象分析效率,有助于决策者快速理解消费者对汽车外观的感性知识,在设计迭代中可使产品更符合市场期望;对比相关研究,基于语义量化匹配的方式无需对超高维向量进行降维和聚类,避免了以往研究因特征降维而可能导致的词向量语义联系的损失,以得到更为准确的意象挖掘结果。 相似文献
3.
4.
针对人-机器人语音交互中经过语音识别的文本指令,提出了一种利用汉语拼音中声韵母作为特征的深度学习文本分类模型。首先,以无人驾驶车语音导航控制为人机交互的应用背景,分析其文本指令结构并分别构建单一意图与复杂意图语料库;其次,在以字符作为文本分类特征的基础上,结合汉语拼音与英文单词的区别,提出了一种利用拼音声韵母字符作为中文文本分类的特征表示方法;然后,用门控递归单元(GRU)代替传统递归神经网络单元以解决其难以捕获长时间维度特征的不足,为提取信息的高阶特征、缩短特征序列长度并加快模型收敛速度,建立了一种结合卷积神经网络及GRU递归神经网络的深度学习文本分类模型。最后,为验证模型在处理长、短序列任务上的表现,在上述两个语料库上对提出的模型分别进行十折交叉测试,并与其他分类方法进行比较与分析,结果表明该模型显著地提高了分类准确率。 相似文献
5.
《测试技术学报》2021,35(5)
机器阅读理解(简称阅读理解)是自然语言处理领域的一项重要任务.目前基于深度学习的阅读理解模型在一些数据集上(如SQuAD)取得了很好的性能,但是这些模型不能有效整合句法结构、句子间长距离语义信息,对问题和篇章理解得不够充分.为解决以上问题提出一种新方法,该方法利用图结构对句子内部的句法结构与句子间的语义关系进行建模,然后与基于注意力机制的表示进行融合,最终形成对篇章与问题更好的理解与表示.同时,该方法还引入问题分类任务,与问答任务共同形成多任务学习框架,进一步优化了问题与文本的表示,获得了更好的答案预测准确率.相关数据集上的实验结果表明,所提方法取得了比基线模型更好的效果. 相似文献
6.
文本数据挖掘在数字图书馆中的应用研究 总被引:2,自引:0,他引:2
文本数据挖掘在数字图书馆中的应用进行探索研究,重点对数字图书馆文本分类的构建与实现进行研究,并将开方拟合检验方法、KNN分类算法等经典理论应用到数字图书馆文本分类模型中,以提高数字图书馆检索能力以及检索准确性。 相似文献
7.
政策文本分类是一项涉及自然语言处理(NLP)、机器学习、政策解析等多领域的综合性技术,在政策管理、研究以及信息服务等方面有重要应用。首先,针对目前政策文本领域公共资源较少的问题,提出结合领域知识和NLP构建政策文本分类数据集的半自动化方法,构建了句子级自然资源政策文本分类数据集;其次,挖掘政策文本自身特点,提出基于深度学习的标题信息自适应增强政策文本分类方法,并在现有主流深度学习模型上进行扩展应用;最后,在自然资源政策文本分类数据集上的实验表明,应用该方法后,5个常用深度学习分类模型的准确率获得了3%以上提升,宏平均F1值获得了5%以上提升。 相似文献
8.
9.
研究基于语义网的文本分类问题,结果表明,SOM神经网络的文本分类可以在降低时间和空间复杂度的基础上,提高分类准确度,从而为文本处理环境下的实时分类提供良好的实现算法。 相似文献
10.
研究基于文本内容的网页过滤技术,网页过滤的成效依赖于网页分类的精度,网页分类的准确与否依赖于网页文本内容抽取的效果,即通过分析网页内容,得到网页中的能够代表网页语义的文本信息。提出一种在同一网站中寻找相似网页的算法,它可以克服其他网页内容抽取方法中存在的弱点。 相似文献