排序方式: 共有78条查询结果,搜索用时 31 毫秒
1.
针对多步交通流量预测任务中时间空间特征提取效果不佳和预测未来时间交通流量精度低的问题,提出一种基于长短时记忆(LSTM)网络、卷积残差网络和注意力机制的融合模型。首先,利用一种基于编解码器的架构,通过在编解码器中加入LSTM网络来挖掘不同尺度的时间域特征;其次,构建基于注意力机制挤压激励(SE)模块的卷积残差网络嵌入到LSTM网络结构中,从而挖掘交通流量数据中的空间域特征;最后,将编码器中获得的隐状态下的信息输入到解码器中,实现高精度多步交通流量的预测。基于真实交通数据进行实验测试和分析,实验结果表明,相较于原始的基于图卷积的模型,所提模型在北京和纽约两个交通流量公开数据集上的均方根误差(RMSE)分别获得了1.622和0.08的下降。所提模型能够高效且精确地对交通流量作出预测。 相似文献
2.
3.
提出一种实现二维光码分多址系统编解码的方法.阐述编解码的原理和电光晶体的基本性质,用电光晶体构造编解码器的关键部件电光偏转器和电光开关,对系统的每个部分进行分析,用具体的地址码进行模拟.结果表明,该方法能有效实现二维光码分多址系统的编解码,并且方法简单、控制灵活、系统升级方便,能够在全光网络通信中发挥重要作用.Abstract: A new encoder-decoder scheme of 2-D OCDMA (Optical Code Division Multiple Access) system is proposed.The principles of encoding-decoding and the characteristics of electro-optic crystals are discussed.The key components,electro-optic deflector and switch,were manufactured by electro-optic crystals and each part of this system was analyzed respectively.A simulation was made with 2-D OOC (optical orthogonal code),and the results showed the effectiveness of this technique in realizing encoder-decoder.This system would play an important role in all-optical telecommunications with its simple scheme,flexible control and convenient upgrade. 相似文献
4.
随着道路场景理解技术的快速发展,自主驾驶领域取得了长足的进步。在相关任务中,包括道路分割、分类和车辆检测的实时性和准确性是安全性的一个关键问题。为此,提出了一个具有编/解码器网络结构的基于深度残差学习的方法。一方面,编码器网络结构使用不同层次的残差网络来提取高维中的抽象特征,这些特征在接下来的三个任务中共享使用;另一方面,解码器网络结构采用一种子任务的并行计算机制,即道路分割、车辆检测和道路分类任务同时执行。此外,全卷积神经网络用于对提取的图像特征进行上采样以解决道路分割问题。最终,实验结果表明在保证高精度的前提下处理帧率可达到15 fps以上。 相似文献
5.
针对拍摄场景中物体运动不一致所带来的非均匀模糊,为提高复杂运动场景中去模糊的效果,提出一种多尺度编解码深度卷积网络。该网络采用"从粗到细"的多尺度级联结构,在模糊核未知条件下,实现盲去模糊;其中,在该网络的编解码模块中,提出一种快速多尺度残差块,使用两个感受野不同的分支增强网络对多尺度特征的适应能力;此外,在编解码之间增加跳跃连接,丰富解码端信息。与2018年国际计算机视觉与模式识别会议(CVPR)上提出的多尺度循环网络相比,峰值信噪比(PSNR)高出0.06 dB;与2017年CVPR上提出的深度多尺度卷积网络相比,峰值信噪比和平均结构相似性(MSSIM)分别提高了1.4%和3.2%。实验结果表明,该网络能快速去除图像模糊,恢复出图像原有的边缘结构和纹理细节。 相似文献
6.
人体解析作为一种复杂而精细的计算机视觉任务,应用前景十分广泛,为了得到精确的人体解析结果需要提取丰富人体语义特征,对此提出一种双路人体解析网络(MTCnet)。MTCnet将编码解码网络与空洞卷积相结合,拥有两个特征提取子网能够融合学习多尺度特征信息,相比单一网络,能够学习更丰富人体语义特征信息。与以往单一阶段处理方式不同,提出的方法需要进行多阶段学习,每个阶段对前一阶段的人体解析结果进行改进,达到最优的解析结果。实验结果表明,提出的方法与目前一些先进的方法相比特征提取能力更强,解析结果更加精准。 相似文献
7.
蕴含语义、句法和上下文信息的语境词向量作为一种动态的预训练词向量,在自然语言处理的下游任务中有着广泛应用。然而,在机器译文质量估计中,没有相关研究工作涉及语境词向量。该文提出利用堆叠双向长短时记忆网络将BERT语境词向量引入神经译文质量估计中,并通过网络并联的方式与传统的译文质量向量相融合。在CWMT18 译文质量估计评测任务数据集上的实验结果表明,融合中上层的BERT语境词向量均显著提高了译文质量估计与人工评价的相关性,并且当对BERT语境词向量的最后4层表示平均池化后引入译文质量估计中对系统性能的提高幅度最大。实验分析进一步揭示了融合语境词向量的方法能利用译文的流利度特征来提高翻译质量估计的效果。 相似文献
8.
9.
本文将深度强化学习应用于二维不规则多边形的排样问题中,使用质心到轮廓距离将多边形的形状特征映射到一维向量当中,对于在随机产生的多边形中实现了1%以内的压缩损失.给定多边形零件序列,本文使用多任务的深度强化学习模型对不规则排样件的顺序以及旋转角度进行预测,得到优于标准启发式算法5%-10%的排样效果,并在足够次数的采样后... 相似文献
10.
传统的视频字幕生成模型大多都采用编码器—译码器框架。在编码阶段,使用卷积神经网络对视频进行处理。在解码阶段,使用长短期记忆网络生成视频的相应字幕。基于视频的时序相关性和多模态性,提出了一个混合型模型,即基于硬注意力的多模态视频字幕的生成模型。该模型在编码阶段使用不同的融合模型将视频和音频两种模态进行关联,在解码阶段基于长短期记忆网络的基础上加入了硬注意力机制来生成对视频的描述。这个混合模型在数据集MSR-VTT(Microsoft research video to text)上得到的机器翻译指标较基础模型有0.2%~3.8%的提升。根据实验结果可以判定基于硬注意力机制的多模态混合模型可以生成视频的精准描述字幕。 相似文献