期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

时空序列预测方法综述 总被引：1，自引：0，他引：1

黎维陶蔚周星宇潘志松《计算机应用研究》2020,37(10):2881-2888

随着数据采集技术的进步,带有地理位置信息的时空数据迅速增长,迫切需要探索有效的时空数据建模方法。时空序列预测是时空数据建模的基础方法之一,它广泛应用于很多领域。目前缺乏对它进行综述的中文文献,因而对这些方法进行归纳和总结具有重要的研究意义。针对时空序列预测问题进行了研究,首先回顾了其应用背景和发展历程,介绍了它的相关定义及特点。然后按其类别介绍了传统的时空序列预测方法、基于传统机器学习的时空序列预测方法和基于深度学习的时空序列预测方法,并分析了这些方法的应用范围和优缺点。最后对时空序列预测未来的研究方向进行了梳理和展望,为研究者们进一步深入研究时空序列预测问题奠定了理论基础。相似文献

2.

基于深度学习的时空序列预测方法综述

潘志松黎维《数据采集与处理》2021,36(3):436-448

随着数据采集技术的蓬勃发展,各个领域的时空数据不断累积,迫切需要探索高效的时空数据预测方法.深度学习是一种基于人工神经网络的机器学习方法,能有效地处理大规模的复杂数据,因而研究基于深度学习的时空序列预测方法具有十分重要的意义.在这一背景下,针对已有的预测方法进行归纳和总结,首先回顾了深度学习在时空序列预测中的应用背景和... 相似文献

3.

基于GAN的遥感图像协同数据增强方法

邵利军任彦高晓文戚忠涛《遥感信息》2023,(4):80-86

针对基于深度学习的分类模型在少样本训练时所遭受的梯度消失、过拟合问题,结合DCGAN和SRGAN特性,提出一种抑制过拟合、提升图像生成质量的DS-GAN协同数据增强算法。通过改进DCGAN生成新的图像,使用改进SRGAN对其进行超分辨率重构,二者协同得到新的超分辨率图像。首先,提出一种软标签函数,代替DCGAN原始固定标签;其次,引入空洞卷积残差块作为SRGAN判别器主结构,同时加入CBAM注意力机制实现权重的再分配;最后,在SRGAN判别器中引入自适应平均池化,降低网络参数量。实验结果表明,使用标准数据集AID和RSOD,经MobileNet V2分类网络进行测验,DS-GAN数据增强方法相较于常规增强和DCGAN增强方法有明显提高。在AID数据集上,准确率分别提升8.01%、9.49%。在RSOD数据集上,准确率分别提升4.76%、1.4%。相似文献

4.

基于GAN的网络安全数据增强研究综述与展望

《计算机应用与软件》2022,39(11)

相似文献

5.

基于MUNIT的数据增强方法研究

丁柏楠王淏袁文翠吴圣洁《微型电脑应用》2021,(12):19-22

近年来深度学习和机器学习在图像分类上取得了重大的进展,但高效的网络训练需要巨量的数据支持.在只有少量数据的情况下,模型的表现十分糟糕.数据增强方法可以通过更加高效的使用已有的数据来减轻该问题.但通常的数据增强方法只通过裁剪,旋转等方法产生有限的可能有用的数据.针对这一问题,提出了一种基于MUNIT的数据增强方法,通过使... 相似文献

6.

不同数据增强方法对模型识别精度的影响

王建明陈响育杨自忠史晨阳张宇航钱正坤《计算机科学》2022,49(z1):418-423

相似文献

7.

基于深度学习的图像数据增强研究综述

孙书魁范菁孙中强曲金帅代婷婷《计算机科学》2024,(1):150-167

近年来，深度学习在图像分类、目标检测、图像分割等诸多计算机视觉任务中都取得了出色的性能表现。深度神经网络通常依靠大量的训练数据来避免过拟合，因此，出色的性能背后离不开海量图像数据的支持。但在很多实际应用场景中，通常很难获取到足够的图像数据，并且数据的收集也是昂贵且耗时的。图像数据增强的出现很好地缓解了数据不足的问题，作为增加训练数量、提升数据质量和多样性的有效途径，数据增强已成为深度学习模型在图像数据上成功应用的必要组成部分，理解现有算法有助于选择适合的方法以及开发新算法。文中阐述了图像数据增强的研究动机，对众多的数据增强算法进行了系统分类，详细分析了每一类数据增强算法；随后指出数据增强算法设计时的一些注意事项及其应用范围，并通过3种计算机视觉任务证明了数据增强的有效性；最后总结全文并对数据增强未来的研究方向进行展望。相似文献

8.

基于生成对抗网络的数据增强方法

张晓峰吴刚《计算机系统应用》2019,28(10):201-206

深度学习在分类任务上取得了革命性的突破,但是需要大量的有标签数据作为支撑.当数据匮乏的时候,神经网络极易出现过拟合的问题,这种现象在小规模数据集上尤为明显.针对这一难题,本文提出了一种基于生成对抗网络的数据增强方法,并将其应用于解决由于数据匮乏,神经网络难以训练的问题.实验结果表明,合成的数据和真实的数据相比既具有语义上的相似性,同时又能呈现出文本上的多样性;加入合成的数据后,神经网络能够更加稳定地训练,而且分类的准确度也有了进一步的提高.将提出的算法和其他一些数据增强的技术对比,我们的方法结果最好,从而证明了这种技术的可行性和有效性. 相似文献

9.

基于深度学习的时间序列数据异常检测方法

胡姣姣王晓峰张萌张德鹏胡绍林《信息与控制》2019,48(1):1-8

针对类间分布不平衡的时间序列数据的异常检测问题,提出了一种基于深度卷积神经网络的检测方法.首先采用抽样法对不平衡时间序列数据进行预处理;其次,将处理后的时间序列数据转换为尺度一致、时长一致的片段;最后将数据送入具有4层隐藏层结构的卷积神经网络模型中进行异常检测.实验结果表明,所提方法弥补了现存的检测技术由于忽略数据分布的偏斜性而造成的少数类检测精度低的缺点,并通过与现有的时间序列分类方法的比较,验证了所提方法的高效性. 相似文献

10.

基于特征提取偏好与背景色相关性的数据增强算法

余鹰王乐为张应龙《计算机应用》2019,39(11):3172-3177

深度神经网络具有强大的特征自学习能力,可以通过多层逐步提取的方式获取不同层次的粒度特征,但当图片目标本体与背景色具有强相关性时,特征提取会存在"惰性",所提取特征的抽象层次较低,判别性不足。针对此问题,通过实验对深度神经网络特征提取的内在规律进行研究,发现特征提取偏好与图片背景色之间具有相关性,消除该相关性可以帮助深度神经网络忽略背景的干扰,直接学习目标本体的特征,由此提出了数据增强算法,并在自主构建的数据集上进行实验。实验结果表明,所提算法可以降低背景色对目标本体特征提取的干扰,减少过拟合,提高分类效果。相似文献

11.

序列数据相似性查询技术研究综述 总被引：2，自引：0，他引：2

朱扬勇戴东波熊赟《计算机研究与发展》2010,47(2)

序列数据在文本、Web访问日志文件、生物数据库等应用中普遍存在,对其进行相似性查询是一种提取有用信息的重要手段.近年来,随着各种科学计算的发展和序列数据的大量产生,序列相似性查询已经成为数据分析领域一个研究热点.其涉及到的几个重要问题有面向各种应用领域的相似性度量及其相互之间的关系;随机序列数据中距离分布的统计信息及其对分析查询算法性能的作用;在大规模数据中,各种高效回答相似性查询的关键技术及各自的优缺点比较.总结了序列数据的分类和特点,给出了几种序列数据相似性度量和随机序列之间距离分布的统计信息,并进一步分析了这些度量之间的关系.接着给出了几种序列相似性查询的类型,以及序列相似性查询要解决的核心问题.在此基础上,针对各种序列相似性查询关键技术进行分类和评价.最后,讨论了关于序列数据相似性查询研究所面临的挑战,并归结了未来的研究方向. 相似文献

12.

数据增广下的人脸识别研究

黄法秀张世杰吴志红陈虎孙家炜《计算机技术与发展》2020,(3):67-72

随着计算机技术的发展和应用,人脸识别技术以其具有的非强制性、非接触性、并发性等优势得到了越来越广泛的应用。大规模数据是提高基于深度学习人脸识别准确率的关键因素,但往往数据不易获得,并且存在训练数据缺乏测试数据样本的情况,如模糊、亮度失真和腐蚀感画质样本等。针对训练数据缺乏问题,提出了利用滤波、亮度调节和腐蚀操作3种传统图像处理方法10种增广方式增加数据量和数据的多样性,进而提高识别算法的性能。将原始数据和增广数据作为训练数据训练模型,选择从不同地方拍摄的视频上截取的人脸图像组成了四个测试集,实验结果表明,增广数据与测试集样本存在一致性时,增广方式对提升识别性能都有一定的效果,其中最好的效果是对图像整体调亮时在一个测试集上的识别率提高了4.02%。相似文献

13.

基于数据增强的地质文本主题模型

张竞元刘刚曾粤周大双陈麒玉《计算机系统应用》2022,31(7):290-297

直接利用主题模型对地质文本进行聚类时会出现主题准确性低、主题关键词连续性差等问题, 本文采取了相关改进方法. 首先在分词阶段采用基于词频统计的重复词串提取算法, 保留地质专业名词以准确提取文本主题, 同时减少冗余词串数量节约内存花销, 提升保留词的提取效率. 另外, 使用基于TF-IDF和词向量的文本数据增强算法, 对原始分词语料进行处理以强化文本主题特征. 之后该算法与主题模型相结合在处理后的语料上提取语料主题. 由于模型的先验信息得到增强, 故性能得以提高. 实验结果表明本文算法与LDA模型相结合的方法表现较好, 在相关指标及输出结果上均优于其他方法. 相似文献

14.

融合数据增强的迁移字典学习

下载免费PDF全文

王子儒李振民《计算机工程与应用》2021,57(23):193-199

提出利用迁移字典解决复杂行为数据集标签样本不足的问题。所提出的方法使用简单行为作为源域,来辅助识别由一系列简单行为组成的复杂行为。通过稠密轨迹提取视频的低级特征,利用字典学习从简单行为和复杂行为的低级特征中分别获得相应的稀疏表示,并利用简单行为的稀疏表示通过迁移矩阵改善复杂行为的稀疏表示。因此,即使在复杂行为标签样本较少的情况下,迁移字典也能够获得更有效的高级特征。同时,利用GAN在特征层面上进行数据增强,帮助学习表征能力更强的字典。提出的方法在UCF101和HMDB51两个数据上进行了实验,在小样本量的情况下获得了比现有方法更好的识别结果,证明了方法的有效性。相似文献

15.

基于数据增强技术的神经机器翻译

蔡子龙杨明明熊德意《中文信息学报》2018,32(7):30-36

神经机器翻译是目前机器翻译领域最热门的研究方法。和统计机器翻译相比,神经机器翻译在语料丰富的语种上可以取得非常好的结果,但是在资源比较稀缺的语种上表现一般。该文利用数据增强技术对资源贫乏语种的训练数据进行扩充,以此增强神经机器翻译的泛化能力。该文在藏汉、汉英两种语言对上进行了实验,当训练数据规模只有10万平行句对时,相较于基准系统,在两种语言对上均获得了4个BLEU值的提高。实验表明,数据增强技术可以有效地解决神经机器翻译因为训练数据太少而导致的泛化能力不足问题。相似文献

16.

AMR文本生成的数据扩充方法

付叶蔷李军辉《计算机工程》2022,48(5):91-97

在抽象语义表示（AMR）文本生成过程中,AMR图到文本形式的转换在很大程度上受语料规模的影响。提出一种简单有效的动态数据扩充方法,在已标注数据集规模有限的情况下提高AMR文本生成性能。将AMR文本生成模型解码端视作一个语言模型,使用单词级别的扩充方法,通过动态地对目标端单词进行随机替换,得到带噪声的数据,从而增强模型的泛化能力。在加载数据时,随机选择目标句子中的部分单词做噪声化处理,利用约束编码器预测被覆盖的单词并还原出原始语句,使模型具有更深层的语言表征能力。基于AMR2.0和AMR3.0英文标准数据集进行实验,结果表明,该方法可有效提升AMR文本生成系统性能,与未引入噪声的基准Transformer模型相比,能够获得更优的BLEU、Meteor和chrF++指标,其中BLEU值在人工标注语料场景下分别提升0.68和0.64,且在大规模自动标注语料场景下也能提升0.60和0.68。相似文献

17.

数据增广求解贝叶斯Logistic回归模型的方法研究

侯禹腾《软件》2014,(7):109-115

贝叶斯Logistic回归模型是机器学习中一类被广泛应用的经典模型,然而由于其先验和似然间的非共轭性,Logistic回归模型的贝叶斯推理成为机器学习中的一个重要问题。数据增广方法是一种解决非共轭问题非常有效的方法,该方法通过引入增广变量来发掘模型中的隐藏结构,再通过采样的方法得到模型推理结果。本篇文章实现了两种不同的数据增广算法并通过在多个现实生活数据集上进行试验来对比算法的优越性。相似文献

18.

基于对抗式数据增强的深度文本检索重排序

陈丽萍任俊超《计算机系统应用》2021,30(7):204-209

在信息检索领域的排序任务中, 神经网络排序模型已经得到广泛使用. 神经网络排序模型对于数据的质量要求极高, 但是, 信息检索数据集通常含有较多噪音, 不能精确得到与查询不相关的文档. 为了训练一个高性能的神经网络排序模型, 获得高质量的负样本, 则至关重要. 借鉴现有方法doc2query的思想, 本文提出了深度、端到... 相似文献

19.

基于注意力引导数据增强的车型识别

孙伟常鹏帅戴亮张小瑞陈旋代广昭《计算机工程》2022,48(7):300-306

车型识别在智能交通系统中发挥着重要作用。受车辆数据不足、车辆类间差异小等因素的影响,传统车型识别方法未充分利用车辆鉴别性区域的特征,导致识别准确率降低。提出一种基于注意力模块引导数据增强的车型识别方法。将ResNet-50作为骨干网络提取车辆特征,同时在网络的每个残差块后均嵌入坐标注意力模块,编码成一对方向感知和位置敏感的注意力图,以增强车辆鉴别性区域的特征表达。在此基础上,利用双线性注意力汇集操作生成增强特征图,通过对增强特征图进行注意力裁剪和注意力擦除,获取具有强鉴别性的增强数据。在Stanford Cars车辆数据集上的实验结果验证了该方法的有效性,结果表明,该方法的车型识别准确率达到94.86%,与RA-CNN、MA-CNN、WS-DAN+Inception-v3等方法相比,能够有效提高车型识别准确率和数据增强效率。相似文献