首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对目前财经领域内新闻数据杂乱无章、缺乏自动高效管理等问题,提出一种基于卷积神经网络的中文财经新闻分类方法。收集大规模财经新闻语料,通过无监督学习方法训练获得一个广义通用的财经类词向量模型,将词向量引入到卷积神经网络模型训练中实现有效分类。与传统方法相比,基于卷积神经网络的中文财经新闻分类方法网络模型结构简单,针对小样本集也能表现优异的性能,不仅能有效解决中文财经新闻分类问题,还可充分证明卷积神经网络在处理文本分类问题中的有效性。  相似文献   

2.
为解决单一的卷积神经网络(CNN)缺乏利用上下文本信息与单一循环神经网络(RNN)对局部信息把握不全面问题,提出一种基于注意力机制的多通道TextCNN-BiGRU分类模型.首先,通过word2vec对初始文本向量化,经实验选取窗口值组成三通道.然后利用CNN的强学习能力提取局部特征,利用双向门控循环单元(BiGRU)提取上下文全局信息,运用注意力层与池化层获取并优化重要的特征.最后采用softmax函数使误差loss极小化.仿真实验结果表明,提出的模型分类性能,准确度达94%,损失函数值稳定在0.22%左右,具有良好的泛化能力,能够有效解决单一模型挖掘信息不全问题,有效提高分类效果.  相似文献   

3.
为实现环境类虚假投诉举报检测, 提出一种基于对抗迁移学习方法的虚假投诉举报检测模型。首先, 以长短期记忆(long-short term memory, LSTM)网络为特征抽取器抽取微博谣言(源域)和投诉举报文本(目标域)的共享特征; 然后, 使用对抗学习方法进行领域适配, 将源域特征和目标域特征进行特征对齐; 最后, 由分类器输出分类结果, 并由分类损失和领域适配损失共同更新网络参数。通过模型对比实验和消融实验可知, 模型的F1达到了79.61%。结果表明, 对抗迁移学习模型具有较好的性能, 适合应用在环境类虚假投诉举报检测任务中。  相似文献   

4.
针对目前财经领域内新闻数据杂乱无章、缺乏自动高效管理等问题,提出一种基于卷积神经网络的中文财经新闻分类方法。收集大规模财经新闻语料,通过无监督学习方法训练获得一个广义通用的财经类词向量模型,将词向量引入到卷积神经网络模型训练中实现有效分类。与传统方法相比,基于卷积神经网络的中文财经新闻分类方法网络模型结构简单,针对小样本集也能表现优异的性能,不仅能有效解决中文财经新闻分类问题,还可充分证明卷积神经网络在处理文本分类问题中的有效性。  相似文献   

5.
针对不同领域的语义规则和潜在主题结构复杂,导致主题句生成的易扩充性和可移植性不佳、中文文本主题句与中文文本的相似度较低、中文文本的主题句提取冗余度较高的问题,提出了基于TextRank算法和相似度的中文文本主题句自动提取方法。采用双向长短期记忆网络(Bi-LSTM)模型进行中文文本分词,将连续的中文文本切分成独立的词语,通过互信息方法进行中文文本特征,计算特征值,提取任务最相关、最有代表性的特征(如关键词、线索词)。将关键词、线索词作为主题句提取的重要线索和依据,基于TextRank算法和相似度,考虑各项权重和权重系数,完成中文文本主题句自动提取。实验结果表明,本文方法的中文文本主题句自动提取冗余度低,文档的完备性、易扩充性、可移植性均处于良好的状态,且ROUGE-1、ROUGE-2、ROUGE-L结果均较高,可以保证中文文本主题句自动提取效果,应用程度较高。  相似文献   

6.
机械故障诊断是日趋复杂的现代自动化机械系统的可靠性和安全性的关键.传统的轴承故障检测方法通常依赖人工特征提取和分类器设计,其效率和准确性存在一定的局限性.提出了一种基于卷积神经网络(convolutional neural network, CNN)和长短期记忆网络(long short-term memory network, LSTM)的深度学习方法:WDC-LSTM. CNN从振动信号中提取关键局部特征,LSTM则处理特征序列以捕捉时间连续性和动态变化.二者结合可同时建模轴承故障数据的空间特征与时间特性,实现端到端的轴承故障检测.为验证方法性能,基于凯斯西储大学轴承故障数据集进行实验,并与现有方法进行对比.结果表明,WDC-LSTM在轴承故障分类中具有更高的准确率和更强的泛化能力.  相似文献   

7.
长短周期记忆神经网络(LSTM)受益于能够捕获长期依赖关系的特点,在许多实际应用中展现了优异的性能.该文构建了LSTM多变量数据驱动的预测模型,通过多变量输入的方式预测澳大利亚森林大火.首先使用多变量LSTM预测模型对日最高温度进行预测,并与反向传播(BP)神经网络以及ARIMA预测模型的结果进行对比.研究表明:以相关...  相似文献   

8.
针对文本信息隐藏嵌入容量低和语义连贯性差的问题,提出了一种基于神经网络图像描述的文本信息隐藏模型.将卷积神经网络与长短期记忆网络相结合,把图像特征和生成语句进行关联.从收发双方能否共享图像及模型参数的不同应用前提出发,设计了多种概率采样方式,从而生成载密的图像描述文本.实验结果表明,该算法具有较高的隐藏容量,载密描述句能较好地表达图像内容.该模型归属于\"无载体\"自然语言生成式信息隐藏,具有较好的隐蔽性和安全性.  相似文献   

9.
不同类型的声音对城市居民的身心健康质量影响不同,将城市声音精准的分类有利于对其进行有效的评价,从而促进对城市声音的管理.深度学习在语音识别方面已有所应用,其中循环神经网络(RNN)表现最为突出.由于基本RNN存在明显的梯度消失 、网络损耗大 、准确率低等问题,应用改进的RNN对城市背景噪声进行分类.采用长短期记忆神经网...  相似文献   

10.
提出了一种基于多特征的中文文本蕴含识别方法,首先对文本进行预处理、中文分词、词性标注、命名实体识别、依存分析等处理;然后提取字符串特征、句法特征、语义特征等,使用贝叶斯逻辑回归模型进行预测;最后再使用规则进行修正,得到最终的识别结果.该方法在2014年RITE-VAL 评测任务的CS 数据上的MacroF1为0.625,超过目前最好的研究现状(MacroF1:0.615, BUPTTeam-CS-SVBC-05).  相似文献   

11.
基于语义情景分析及向量化对访问流量语料库大数据进行词向量化处理,实现面向大数据跨站脚本攻击智能检测.利用自然语言处理方法进行数据获取、数据清洗、数据抽样、特征提取等数据预处理.设计基于神经网络的词向量化算法,实现词向量化得到词向量大数据;通过理论分析和推导,实现多种不同深度的长短时记忆网络智能检测算法.设计不同的超参数...  相似文献   

12.
为充分挖掘电力负荷历史数据的潜在特征,提高短期负荷预测模型的预测精度,提出了一种由改进残差网络(ResNetPlus)、注意力机制(Attention mechanism,AM)和双向长短期记忆网络(Bi-directional long short-term memory,Bi-LSTM)结合而成的残差AM-Bi-LSTM预测模型。该模型将历史负荷、温度和所预测日期的特征作为输入,在Bi-LSTM模型基础上,引入多层改进残差网络提取输入数据的隐藏特征,有效克服了网络隐藏层数加深导致的网络退化问题,使模型的反向传播能力大幅提升;加入注意力机制,分析网络中输入信息与当前负荷的相关性并突出重要信息的影响,从而提高模型的速度与准确率;使用Snapshot策略集成收敛于不同局部极小值的多个模型,以提升模型的准确率和鲁棒性。最后,使用美国ISO-NE数据集进行模拟预测,测试结果表明:所提模型的平均预测精度达到98.27%;在连续的12个月中采用该模型的平均预测精度相比于LSTM模型提高了2.87%;在不同季节下采用该模型的平均预测精度相比于AM-Bi-LSTM和ResNetPlus模型分别提高了1.05%和1.16%。说明所提模型相较于对比模型具有较高的准确率、鲁棒性以及泛化能力。  相似文献   

13.
心理词汇研究是心理语言学和二语词汇习得领域的研究热点之一。文章从心理语言学的有关认知理论的角度介绍了词汇记忆的整个心理过程,并根据这些理论提出了几点在词汇教学中帮助学习者建立和扩展心理词汇网络的建议。  相似文献   

14.

针对现有预测模型无法在交通大数据中提取交通流序列的内部规律,且未能充分利用交通流的时空相关性以实现高精度预测的问题,提出了一种基于K-最近邻(K-nearest neighbor,KNN)与长短时记忆(long short term memory,LSTM)网络模型相结合的短时交通流预测模型.采用KNN算法选择路网中与预测站点时空相关的检测站,以选择的检测站的交通流序列构造数据集,将其输入LSTM模型中进行训练及测试,并通过美国交通研究数据实验室的真实交通数据对提出的模型进行验证.结果表明:与现有的交通预测模型相比,该方法能更好地提取交通流序列的时空特性,预测准确率平均可提高12.28%,可为交通诱导与控制提供必要的依据.

  相似文献   

15.
基于深度学习下的长短期记忆循环神经网络对家庭短期用电预测进行研究.本研究引入卷积神经网络(convolutional neural network,CNN)和长短期记忆(long short term memory,LSTM)模型结合的混合深度神经网络模型C-LSTM,并在此模型基础上提出多步预测策略.根据对5个真实家...  相似文献   

16.
针对微表情动作幅度小、强度低等缺点,提出了一种基于带有注意力机制的卷积神经网络(ACNN)和双向长短期记忆网络(Bi-LSTM)相结合的神经网络结构。实验采用CASME II数据集,为了减少出现过拟合的风险,首先将预处理后的特征向量经过预训练的VGG16网络提取出基本特征,接着对输出特征进行裁剪,得到带有局部特征的24个微表情识别块和带有整个图片特征的全局特征向量;然后将24个识别块分别经过局部识别块注意力卷积神经网络(BR-ACNN)提取出带有注意力信息的局部特征,将全局特征向量经过全局注意力卷积神经网络(GR-ACNN)提取出带有注意力信息的全局特征;最后,将提取的局部和全局特征,经过Bi-LSTM提取出微表情序列之间的相关性信息。实验结果显示,5折交叉验证平均准确率为0.69,UF1为0.638 2,UAR为0.675 0。CASME II数据集上结果显示,所提算法模型相对OFFApexNet模型,其UF1提高了0.028 1,UAR提高了0.096 9;相对ATNet模型,其UF1提高了0.007 2,UAR提高...  相似文献   

17.
近些年来,人机对话系统作为自然语言处理的重要问题之一受到了越来越多的关注.基于大数据的深度学习的方法在对话系统中被广泛应用.本文首先介绍了人机对话系统的研究背景,然后以基于多轮交互的对话系统为例,着重介绍了任务型和非任务型对话系统的主要类型和目前的研究进展,并对评估对话系统的主要方法进行了概述.最后,结合当前研究现状,对多轮交互的人机对话系统的研究方向进行了展望.  相似文献   

18.
命名实体识别是自然语言处理中一项非常重要的任务,一句话中可以正确理解其中的实体,对于是否能正确理解这句话至关重要,而中文的命名实体识别相比英文更有难度,原因在于中文没有英文中类似空格的边界标示词,且存在复杂的嵌套现象.针对现有的中文命名实体识别方法中大多只利用单一层次的特征这一问题,利用Bert中文预训练集和额外的词汇数据集的融合模型增强词意和中文上下文联系,采用BiGRU网络获取序列特征矩阵,通过条件随机场模型生成全局最优序列,从而提升实体识别准确率.实验结果表明该方法在公开数据集上的效果优于现有模型.  相似文献   

19.
本文介绍了计算语言学的起源及其发展历史,对该领域的一些相近术语概念及其各概念之间的关系进行了详细的解释,包括计算语言学、自然语言处理、自然语言理解、人类语言技术、语言信息处理、中文信息处理等等。  相似文献   

20.
CNN图像标题生成   总被引:1,自引:0,他引:1  
图像标题生成任务需要生成一个有意义的句子来准确地描述该图像的内容,而现有研究通常采用卷积神经网络编码图像信息、循环神经网络来编码文本信息,由于循环神经网络的“串行特性”,导致模型的性能低。为解决该问题,基于卷积神经网络来构建一种模型,采用不同结构的卷积神经网络来同时处理两个模态的数据,得益于卷积运算的“并行特性”,该模型的运行效率有明显提升。在两个公开数据集上进行了实验,实验结果在指定的评价指标上也有一定的提升,表明了该模型对于处理图像标题生成任务的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号