首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 875 毫秒
1.
文本自动撰写在自然语言处理中是一个重要的研究领域,可通过人工智能的方法来提升文本的生成结果。目前主流的生成方法是基于深度学习的方法,而该文则提出了一种基于注意力的端到端模型生成藏文律诗法。该方法基本框架是一个双向LSTM的编码—解码模型,在此基础上引入了藏文字嵌入、注意力机制和多任务学习法。实验结果表明,该文提出的方法在藏文律诗生成结果中BLEU值和ROUGE值分别能达到59.27% 、62.34%,并无需任何人为的特征设置。  相似文献   

2.
对话是自然语言处理的一个重要研究领域,其成果已经得到广泛的应用。然而中文对话模型训练时由于字词数量庞大,必然会面临模型复杂度过高的问题。为解决此问题,该文首先将对话模型的汉字输入转化为拼音输入并将拼音分为声母、韵母和声调三个部分,以此减小输入的字词数量。然后以嵌入编码的方法将拼音信息组合为图像形式,再通过全卷积神经网络(FCN)和双向Long Short Term Memory(LSTM)网络提取拼音特征。最后采用4层的Gated Recurrent Units(GRU)网络对拼音特征进行解码以解决长时记忆问题,得到对话模型的输出。在此基础上,模型在解码阶段加入了注意力机制,使模型的输出可以更好地与输入进行对应。为对提出的中文对话模型进行评价,该文建立了应用于医疗领域的中文对话数据库,并以BLEU和ROUGE_L为评价指标在该数据库上对模型进行了测试。  相似文献   

3.
张德正  翁理国  夏旻  曹辉 《计算机应用》2019,39(6):1657-1662
针对视频帧预测中难以准确预测空间结构信息细节的问题,通过对卷积长短时记忆(LSTM)神经网络的改进,提出了一种深度卷积长短时神经网络的方法。首先,将输入序列图像输入到两个不同通道的深度卷积LSTM网络组成的编码网络中,由编码网络学习输入序列图像的位置信息变化特征和空间结构信息变化特征;然后,将学习到的变化特征输入到与编码网络通道数对应的解码网络中,由解码网络输出预测的下一张图;最后,将这张图输入回解码网络中,预测接下来的一张图,循环预先设定的次后输出全部的预测图。与卷积LSTM神经网络相比,在Moving-MNIST数据集上的实验中,相同训练步数下所提方法不仅保留了位置信息预测准确的特点,而且空间结构信息细节表征能力更强。同时,将卷积门控循环单元(GRU)神经网络的卷积层加深后,该方法在空间结构信息细节表征上也取得了提升,检验了该方法思想的通用性。  相似文献   

4.
古诗、对联是中华文化艺术的智慧结晶,随着计算机技术的发展,计算机辅助古文分析技术成为一个研究热点[1]。在此提出并设计了3个针对古诗、对联分析的自然语言处理任务,分别是对联分词、古诗情感分析和古诗的关键词提取任务。其中对联分词是基于构建对联词表的反向最大匹配并自动校正的方法,古诗情感分析是基于BERT-CCPoem预训练模型设计的下游任务,而古诗的关键词提取则是基于TextRank和Word2vec方法。实验结果表明,提出的对联分词方法效果与人工标注具有很高的一致性,同时,在情感分析和关键词提取任务上的性能与现存的大模型持平或者更佳,具有很强的实用性。  相似文献   

5.
计算机写诗是实现计算机写作的第一步,目前计算机写诗普遍存在主题不明确、诗的内容与写作意图不一致的问题。为改善这些问题,效仿古人写诗的过程,提出了一种两个阶段生成古诗的方法。第一阶段获取写诗大纲,采用TextRank算法对用户输入文本提取关键词,并提出一种基于注意力机制的序列到序列神经网络模型用于关键词扩展;第二阶段根据写诗大纲生成每一行诗句,并提出一种包含双编码器和注意力机制的序列到序列神经网络模型用于古诗生成。最后通过对实验结果的评估验证了提出方法的有效性。与基准方法相比,该方法生成的古诗的主题意义更加明确,诗所表现的内容和写作意图更加一致。  相似文献   

6.
针对标准编码解码模型(Encoder-Decoder Model,EDM)对于时间序列数据提取能力弱的问题,提出一种融合双向长短时记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)和注意力机制(Attention)的编码解码模型.通过Bi-LSTM对输入数据从正反两个方向进行特征提取,基于注意力机制将所得到的特征根据不同时刻分配不同权重,根据解码阶段的不同时刻生成相应背景变量,进而实现对机场客流量的预测.选取上海虹桥机场为例用该算法进行实验仿真,实验结果表明,本文所提方法与RNN、LSTM相比,平均标准误差降低了57.9%以上,为机场客流量预测提供了一种新的思路.  相似文献   

7.
该文通过详细分析La格的用法及特征,在研制La格(■)浅层语义标记规范的基础上,提出一种端到端的长短时记忆神经网络藏文La格浅层语义分析方法,该方法首先借鉴LSTM的设计思路,通过在LSTM的垂直方向上装置一个新颖的“门控高速连接”机制(Gated high-speed connection mechanism, GM),学习了输入句子的时序语义特征。GM包含对单元内部输入和输出的线性连接,使信息可以通畅地在不同层之间传播;然后使用Softmax计算每一时刻语义标签的局部归一化分布,以供输出层进行约束解码;最后使用维特比算法进行解码时通过强制执行该文设定的BIO和La格浅层语义标注约束,规范了输出语义标签之间的结构关系。虽然这个模型比较简单,不需要输入任何额外特征,但取得了理想的实验结果,在测试集上的藏文La格浅层语义分析准确率达到90.59%。  相似文献   

8.
《信息与电脑》2022,(1):50-54
近年来,研究者在利用循环神经网络(RecurrentNeuralNetwork,RNN)进行古诗自动生成方面取得了显著的效果。但RNN存在梯度问题,导致处理时间跨度较长的序列时RNN并不具备长期记忆存储功能。随后,出现的基于长短期记忆网络(LongShort-TermMemory,LSTM)古诗自动生成方法在一定程度上解决了RNN的梯度问题。本文将LSTM改进的门控循环单元(GateRecurrentUnit,GRU)应用在古诗自动生成技术上,并利用Adagrad优化算法对GRU模型进行优化,最后利用Tkinter设计GUI界面进行操作和查看。实验表明,相对于传统的LTSM,GRU在古诗自动生成方面生成的古诗效果更好。  相似文献   

9.
定义抽取是从非结构化文本中自动识别定义句的任务,定义抽取问题可建模为句子中术语及相应定义的序列标注问题,并利用标注结果完成抽取任务。针对传统的定义抽取方法在抽取定义特征过程中费时且容易造成错误传播的不足,提出一个基于双向长短时记忆(BiLSTM)的序列标注神经网络模型,对输入文本进行自动化定义抽取。通过将原始数据输入到BiLSTM神经网络中,完成输入句的特征表示,并采用基于LSTM的解码器进行解码得到标注结果。在Wikipedia英文数据集上的实验结果表明,该方法的精确率、召回率和F1值分别为94.21%、90.10%和92.11%,有效提升了基准模型效果。  相似文献   

10.
研究情境特征在文本分类中的作用,提出了一种层级双向LSTM模型用于情感分类问题。该模型首先将句子分词,把词向量作为第一层双向LSTM模型的输入;其次从文档中提取出稠密、连续的向量作为情境特征;然后将第一层模型的输出向量和情境向量共同输入第二层双向LSTM;最后将这种层级双向的LSTM模型的输出向量通过sigmoid函数进行分类。情境向量作用于每个句子,一致的情感得到增强,不一致的情感被弱化,从而提高了分类的精度。在两个公开数据集上的实验表明,整合了情境特征的层级双向LSTM取得较优的精度。除此之外,通过在一个包含两万余条中文评论的公开数据集上对模型进行测试,表明该模型测试正确率相比于普通的LSTM和双向LSTM都有提升,说明情境特征对于提升情感分类的作用比较显著。  相似文献   

11.
Haq  Nuhman Ul  Khan  Ahmad  Rehman  Zia ur  Din  Ahmad  Shao  Ling  Shah  Sajid 《Multimedia Tools and Applications》2021,80(14):21771-21787

The semantic segmentation process divides an image into its constituent objects and background by assigning a corresponding class label to each pixel in the image. Semantic segmentation is an important area in computer vision with wide practical applications. The contemporary semantic segmentation approaches are primarily based on two types of deep neural networks architectures i.e., symmetric and asymmetric networks. Both types of networks consist of several layers of neurons which are arranged in two sections called encoder and decoder. The encoder section receives the input image and the decoder section outputs the segmented image. However, both sections in symmetric networks have the same number of layers and the number of neurons in an encoder layer is the same as that of the corresponding layer in the decoder section but asymmetric networks do not strictly follow such one-one correspondence between encoder and decoder layers. At the moment, SegNet and ESNet are the two leading state-of-the-art symmetric encoder-decoder deep neural network architectures. However, both architectures require extensive training for good generalization and need several hundred epochs for convergence. This paper aims to improve the convergence and enhance network generalization by introducing two novelties into the network training process. The first novelty is a weight initialization method and the second contribution is an adaptive mechanism for dynamic layer learning rate adjustment in training loop. The proposed initialization technique uses transfer learning to initialize the encoder section of the network, but for initialization of decoder section, the weights of the encoder section layers are copied to the corresponding layers of the decoder section. The second contribution of the paper is an adaptive layer learning rate method, wherein the learning rates of the encoder layers are updated based on a metric representing the difference between the probability distributions of the input images and encoder weights. Likewise, the learning rates of the decoder layers are updated based on the difference between the probability distributions of the output labels and decoder weights. Intensive empirical validation of the proposed approach shows significant improvement in terms of faster convergence and generalization.

  相似文献   

12.
五言绝句是我们传统文学的宝藏,给人独特的语言美感和审美体验.使用机器生成绝句诗歌对机器理解人类语言有着积极的探索意义.依据诗歌语言自身韵律和对仗特点,我们在诗歌数据集和对联数据集上联合训练诗歌生成模型.模型包括语义模型和文字规则模型,语义模型创新性地使用一维卷积网络提取诗歌文字的语义特征,学习诗歌语义的主题信息.文字规则模型使用带注意力机制的编码解码器,学习诗歌文字的对仗特征.实验结果表明模型可以很好地生成符合诗歌规则,表现诗人情感的诗句,如“感时花溅泪,愁路竹林心.秋风草树色,夜雨寒风声.”  相似文献   

13.
The model for obtaining universal sentence representation is getting larger and larger, making it unsuitable for small embedded systems. The paper presents an extended encoder-decoder model with introduced an attention mechanism for learning distributed sentence representation. We can extract the CNN encoder and apply to other NLP downstream tasks on small embedded systems. Inspired by the linguistic features of the word embeddings, the different dimensions of the sentence representation can be aligned to especially linguistic features. The decoder which decodes one word will focus on the partial dimension of sentence representation into a fixed-length vector where CNN is more effective than LSTM, especially on devices with limited computing power. Moreover, the expanded LSTM with attention mechanism as the decoder to learn multitask that reconstruct the original sentence and predict the next sentence. The model was trained on an extensive collection of a novel to learning sentence representation encoder. Finally, the small-scale CNN encoder obtained encouraging results on several benchmark datasets and multiple task.  相似文献   

14.
为了在光照变化和头部运动条件下实现准确稳定的无接触心率估计,基于UNet模型提出一种融合多头自注意力机制的端到端心率估计模型rPPG-UNet。该模型通过使用U型编码器—解码器网络结构实现对生理特征的提取与重建,并使用Skip Connection连接编码器与解码器实现浅层时间特征的复用。该模型还融合多头自注意力机制来捕获生理特征的时间依赖性。最后,该模型采用多任务学习策略以提高心率估计的准确度,加速网络训练。在公开数据集上的实验结果表明,rPPG-UNet的性能优于其他基线模型,可以实现更准确的无接触心率估计。  相似文献   

15.
目前,深度全卷积网络在图像语义分割领域已经取得了瞩目的成就,但特征图的细节信息在多次下采样过程中会大量损失,对分割精度造成影响。针对该问题设计了一个用于图像语义分割的深度全卷积网络。该网络采用“编码器-解码器”结构,在编码器后端引入空洞卷积以降低细节信息的损失,在解码过程中融合对应尺寸的低阶语义特征,并在解码器末端融入全局特征以提升模型的分割精度。使用数据增强后的CamVid数据集对网络进行训练和测试,测试结果达到了90.14%的平均像素精度与71.94%的平均交并比。实验结果表明,该网络能充分利用低阶特征与全局特征,有效提升分割性能,并在区域平滑方面有很好的表现。  相似文献   

16.
目前深度学习已经广泛应用于英文文本摘要领域,但是在中文文本摘要领域极少使用该方法进行研究。另外,在文本摘要领域主要使用的模型是编码-解码模型,在编码时输入的是原始的文本信息,缺乏对文本高层次特征的利用,导致编码的信息不够充分,生成的摘要存在词语重复、语序混乱等问题。因此,提出一种局部注意力与卷积神经网络结合的具备高层次特征提取能力的编码-解码模型。模型通过局部注意力机制与卷积神经网络结合的方式提取文本的高层次的特征,将其作为编码器输入,此后通过基于全局注意力机制的解码器生成摘要。实验结果证明,在中文文本数据集上该模型相对于其他模型有着较好的摘要效果。  相似文献   

17.
陈莉明  田茂  颜佳 《计算机应用研究》2021,38(11):3500-3505
跨年龄人脸识别因其在现实生活中的广泛应用而成为人脸识别领域的热门话题.针对跨年龄人脸识别精度较低的问题,引入解纠缠表示学习,提出了一个基于生成对抗网络的解纠缠表示学习(IPDRL)网络来实现人脸图像的识别.该网络由编码器、生成器和鉴别器构成.编码器在对特征中的年龄变化进行解纠缠的同时,对人脸图像的身份信息进行编码,提取只利于身份鉴别的特征,实现身份特征和年龄特征的解纠缠;生成器根据输入的年龄特征生成对应的身份保持的年龄图像;鉴别器通过对抗学习和多任务学习实现年龄和身份的类分布预测.通过将解纠缠表示学习、对抗学习和多任务学习相结合的方法,很好地保留了人脸图像的身份信息,并使跨年龄人脸图像识别的精度得到了提高.  相似文献   

18.
Deep neural networks (DNNs) have been extensively studied in medical image segmentation.However,existing DNNs often need to train shape models for each object to be segmented,which may yield results that violate cardiac anatomical structure when segmenting cardiac magnetic resonance imaging (MRI).In this paper,we propose a capsule-based neural network,named Seg-CapNet,to model multiple regions simultaneously within a single training process.The Seg-CapNet model consists of the encoder and the decoder.The encoder transforms the input image into feature vectors that represent objects to be segmented by convolutional layers,capsule layers,and fully-connected layers.And the decoder transforms the feature vectors into segmentation masks by up-sampling.Feature maps of each down-sampling layer in the encoder are connected to the corresponding up-sampling layers,which are conducive to the backpropagation of the model.The output vectors of Seg-CapNet contain low-level image features such as grayscale and texture,as well as semantic features including the position and size of the objects,which is beneficial for improving the segmentation accuracy.The proposed model is validated on the open dataset of the Automated Cardiac Diagnosis Challenge 2017 (ACDC 2017) and the Sunnybrook Cardiac Magnetic Resonance Imaging (MRI) segmentation challenge.Experimental results show that the mean Dice coefficient of Seg-CapNet is increased by 4.7% and the average Hausdorff distance is reduced by 22%.The proposed model also reduces the model parameters and improves the training speed while obtaining the accurate segmentation of multiple regions.  相似文献   

19.
文本分类是自然语言处理领域中一项基本任务,但目前的文本分类任务往往是领域独立的,且需要丰富的标注数据。该文通过利用不同领域的数据蕴含的相似信息,在一定程度上缓解标签训练数据不足的问题。该文提出了一种多任务学习模型来解决跨领域文本分类任务,通过每个领域的私有编码器和所有领域的共享编码器来分别提取私有特征和共享特征,从而利用不同层面的领域知识来表示文本,并帮助文本分类。另外,该文还利用正交投影将共享特征和领域私有特征进一步异化,从而强化共享特征的纯度,同时使用门控机制将共享特征和私有特征进行重组融合。我们在两个常用的多领域文本分类数据集(Amazon和FDU-MTL)上对所提模型进行了验证。实验结果表明,该模型在Amazon和FDU-MTL数据集上的平均分类准确率分别达到了86.04%和89.2%,较之前多个基线模型有明显提升。  相似文献   

20.
Deep neural networks (DNNs) have been extensively studied in medical image segmentation.However,existing DNNs often need to train shape models for each object to be segmented,which may yield results that violate cardiac anatomical structure when segmenting cardiac magnetic resonance imaging (MRI).In this paper,we propose a capsule-based neural network,named Seg-CapNet,to model multiple regions simultaneously within a single training process.The Seg-CapNet model consists of the encoder and the decoder.The encoder transforms the input image into feature vectors that represent objects to be segmented by convolutional layers,capsule layers,and fully-connected layers.And the decoder transforms the feature vectors into segmentation masks by up-sampling.Feature maps of each down-sampling layer in the encoder are connected to the corresponding up-sampling layers,which are conducive to the backpropagation of the model.The output vectors of Seg-CapNet contain low-level image features such as grayscale and texture,as well as semantic features including the position and size of the objects,which is beneficial for improving the segmentation accuracy.The proposed model is validated on the open dataset of the Automated Cardiac Diagnosis Challenge 2017 (ACDC 2017) and the Sunnybrook Cardiac Magnetic Resonance Imaging (MRI) segmentation challenge.Experimental results show that the mean Dice coefficient of Seg-CapNet is increased by 4.7% and the average Hausdorff distance is reduced by 22%.The proposed model also reduces the model parameters and improves the training speed while obtaining the accurate segmentation of multiple regions.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号