排序方式: 共有34条查询结果,搜索用时 22 毫秒
1.
目的 图像字幕生成是一个涉及计算机视觉和自然语言处理的热门研究领域,其目的是生成可以准确表达图片内容的句子。在已经提出的方法中,生成的句子存在描述不准确、缺乏连贯性的问题。为此,提出一种基于编码器-解码器框架和生成式对抗网络的融合训练新方法。通过对生成字幕整体和局部分别进行优化,提高生成句子的准确性和连贯性。方法 使用卷积神经网络作为编码器提取图像特征,并将得到的特征和图像对应的真实描述共同作为解码器的输入。使用长短时记忆网络作为解码器进行图像字幕生成。在字幕生成的每个时刻,分别使用真实描述和前一时刻生成的字幕作为下一时刻的输入,同时生成两组字幕。计算使用真实描述生成的字幕和真实描述本身之间的相似性,以及使用前一时刻的输出生成的字幕通过判别器得到的分数。将二者组合成一个新的融合优化函数指导生成器的训练。结果 在CUB-200数据集上,与未使用约束器的方法相比,本文方法在BLEU-4、BLEU-3、BLEI-2、BLEU-1、ROUGE-L和METEOR等6个评价指标上的得分分别提升了0.8%、1.2%、1.6%、0.9%、1.8%和1.0%。在Oxford-102数据集上,与未使用约束器的方法相比,本文方法在CIDEr、BLEU-4、BLEU-3、BLEU-2、BLEU-1、ROUGE-L和METEOR等7个评价指标上的得分分别提升了3.8%、1.5%、1.7%、1.4%、1.5%、0.5%和0.1%。在MSCOCO数据集上,本文方法在BLEU-2和BLEU-3两项评价指标上取得了最优值,分别为50.4%和36.8%。结论 本文方法将图像字幕中单词前后的使用关系纳入考虑范围,并使用约束器对字幕局部信息进行优化,有效解决了之前方法生成的字幕准确度和连贯度不高的问题,可以很好地用于图像理解和图像字幕生成。 相似文献
2.
3.
小样本目标检测旨在通过少量的样本学习来训练目标检测模型,现有的小样本目标检测方法大多基于经典的目标检测算法。在二阶段的检测方法中,由于新类别样本数量少,产生了许多无关的边界框,导致候选区域的准确率较低。为了解决这个问题,提出了一种基于特征融合的小样本目标检测算法FF-FSOD。该方法采用特征融合的方法进行数据增强,对新类别样本进行补充,扩大样本的覆盖范围,同时引入FPN网络进行多尺度特征提取,再对RPN网络进行改进,引入支持集图像分支,计算支持集图像特征与查询集图像特征的深度互相关性,得到注意力特征图,进而获得更精确的候选框。所提模型的有效性在MS COCO和FSOD数据集上得到了验证,实验结果表明,该方法获得了更精准的候选框,进而提升了检测精度。 相似文献
4.
新疆兵团农五师八十九团是北疆地区大型棉花加工企业之一,近几年,该厂积极参与棉花质量检验体制改革,筹措资金进行企业技术改造,已有"88-17"车间、"171"车间仪器化公证检验通过相关部门的验收.目前,该厂"139"车间改建工作在紧锣密鼓地进行,与此同时,八十九团生产的北疆牌棉花也正源源不断地走向市场. 相似文献
5.
为探究环境风速对间接空冷系统性能影响机理,以某600 MW超临界机组SCAL空冷塔为对象,建立相应的计算模型,采用CFD数值模拟与现场试验相结合的方式,模拟了空冷塔内、外流场随环境风速的变化情况,研究了不同环境风速下空冷塔的热力性能。结果表明,随着环境风速的增加,空冷塔出口阻力增大,塔内温度场、塔内外压力场受风速影响较大,塔内烟气流动轨迹基本保持相似;并得到了各扇段及塔整体性能参数随环境风速的变化趋势和规律,为间接空冷系统的运行和设计提供一定的参考。 相似文献
6.
目的 现有大多数视觉问答模型均采用自上而下的视觉注意力机制,对图像内容无加权统一处理,无法更好地表征图像信息,且因为缺乏长期记忆模块,无法对信息进行长时间记忆存储,在推理答案过程中会造成有效信息丢失,从而预测出错误答案。为此,提出一种结合自底向上注意力机制和记忆网络的视觉问答模型,通过增强对图像内容的表示和记忆,提高视觉问答的准确率。方法 预训练一个目标检测模型提取图像中的目标和显著性区域作为图像特征,联合问题表示输入到记忆网络,记忆网络根据问题检索输入图像特征中的有用信息,并结合输入图像信息和问题表示进行多次迭代、更新,以生成最终的信息表示,最后融合记忆网络记忆的最终信息和问题表示,推测出正确答案。结果 在公开的大规模数据集VQA (visual question answering)v2.0上与现有主流算法进行比较实验和消融实验,结果表明,提出的模型在视觉问答任务中的准确率有显著提升,总体准确率为64.0%。与MCB(multimodal compact bilinear)算法相比,总体准确率提升了1.7%;与性能较好的VQA machine算法相比,总体准确率提升了1%,其中回答是/否、计数和其他类型问题的准确率分别提升了1.1%、3.4%和0.6%。整体性能优于其他对比算法,验证了提出算法的有效性。结论 本文提出的结合自底向上注意力机制和记忆网络的视觉问答模型,更符合人类的视觉注意力机制,并且在推理答案的过程中减少了信息丢失,有效提升了视觉问答的准确率。 相似文献
7.
8.
在介绍大采高煤矿工作面基本情况的基础上,设计研究了采煤机相关技术参数。基于计算结果和实践经验选择的采煤机型号为MG900/2215-GWD。设备投入运行1年时间过程中,故障率非常低,且采煤能力达到了矿井的产能要求,取得了较好的应用效果。 相似文献
9.
采用MBS型增韧剂(EM500)为基材,加入双酚A双(二苯基)磷酸酯(BDP)和三(三-溴苯基)氰尿酸酯(FR-245)熔融共混制备出溴-磷阻燃剂含量为80%的溴-磷阻燃剂母粒。以此母粒和透明ABS树脂(TE-10S)熔融共混制备出新型透明阻燃ABS材料。通过氧指数(OI)、水平垂直燃烧(UL 94)、锥形量热仪和光度雾度仪测试研究了该透明阻燃ABS材料的阻燃性能和透明性。结果表明:当BDP:FR-245=2:8(质量比),母粒含量为12.5%时,体系的OI达到25%,UL 94达到V-2级;透明性保持率达到84%;母粒含量为25%时,体系的OI达到30%,UL 94达到V-0级,透明性保持率达到50%,同时材料具有优异的力学性能和加工性。 相似文献
10.