共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
图像描述任务是使计算机自动生成给定图像的自然语言描述文本,它涉及计算机视觉与自然语言处理两个领域,可应用于检索系统、盲人导航和医学报告生成等领域.针对现有的图像描述模型对视觉语义关系挖掘不充分,及多层注意力机制建模特征存在注意偏差的问题,提出一种融入视觉常识和注意力的图像描述模型.在编解码器结构框架下,编码部分引入了视... 相似文献
3.
论文介绍了一种双目图像测量系统.这种测量系统能实现物体的非接触测量.其内容包括:系统软、硬件组成;图像预处理和边缘检测、二值化处理、细化处理和边缘连接五部分.其测量系统结构简单,计算速度快,有一定的实用价值. 相似文献
4.
5.
钢帽和盘面区域的自动提取,是绝缘子红外智能检测的基础.针对现有提取方法的不足,提出一种基于红外图像的绝缘子串钢帽和盘面区域自动提取方法:通过灰度化、双边滤波、OTSU二值分割,进行红外图像预处理;利用特定算法,实现绝缘子串自动定位;利用绝缘子串骨架的回归直线,进行图像角度校正;根据绝缘子串区域列宽分布,分割绝缘子串,提取绝缘子片;运用傅里叶描述子进行验证识别;分离钢帽和盘面,实现绝缘子串钢帽和盘面区域的提取.实验结果表明该方法可以准确地提取绝缘子串钢帽和盘面区域,为后期绝缘子故障智能诊断奠定基础. 相似文献
6.
图像内容检索是互联网应用的一个研究热点内容,如何准确地描述图像信息是多媒体信息检索必须要解决的问题.本文提出一种基于MPEG-7标准的图像内容的描述方案,可以有效地对图像内容进行描述.文章首先介绍了MPEG-7标准和描述方案,然后叙述基于MPEG-7的图像描述方案的技术与相关特征,最后给出一个具体的基于MPEG-7的图像描述方案的例子. 相似文献
7.
图像内容检索是互联网应用的一个研究热点内容,如何准确地描述图像信息是多媒体信息检索必须要解决的问题.本文提出一种基于MPEG-7标准的图像内容的描述方案,可以有效地对图像内容进行描述.文章首先介绍了MPEG-7标准和描述方案,然后叙述基于MPEG-7的图像描述方案的技术与相关特征,最后给出一个具体的基于MPEG-7的图像描述方案的例子. 相似文献
8.
图像内容检索是互联网应用的一个研究热点内容,如何准确地描述图像信息是多媒体信息检索必须要解决的问题。本文提出一种基于MPEG-7标准的图像内容的描述方案,可以有效地对图像内容进行描述。文章首先介绍了MPEG-7标准和描述方案,然后叙述基于MPEG-7的图像描述方案的技术与相关特征,最后给出一个具体的基于MPEG-7的图像描述方案的例子。 相似文献
9.
10.
11.
12.
针对目前基于内容的图像检索技术中低级特征无法准确全面地描述高级语义的问题,本文提出了一种基于多级图像描述模型的渐进式图像内容理解.该图像描述模型在不同层次上对图像内容进行分析和提取,实现了图像内容的全方位描述,从底层向高层的过渡是渐进式的图像理解过程.特别是从视觉感知层到目标层,体现了图像低级特征与高级语义之间的过渡.本文给出了一种基于先验知识的上下文驱动的目标理解算法,实现了图像语义的提取.作为一个应用实例,本文给出了以上方法在基于内容的图像检索技术中的具体应用. 相似文献
13.
14.
针对近些年来,女性人群中乳腺恶性肿瘤患者逐年增长的趋势,提出了一种融合纹理特征和形状特征的乳腺超声肿瘤图像的识别方法。该方法不但结合了临床医生的诊断经验,而且有效利用了数字图像特征提取技术,提取出的特征能反映出良性肿瘤和恶性肿瘤的本质区别,将样本进行特征提取并通过支持向量机(SVM)技术分类,该方法取得了良好的分类效果。实验结果证明文中的特征融合方法十分有效。 相似文献
16.
图像描述的任务是根据输入图像自动生成描述该图像的语句,属于计算机视觉与自然语言处理的交叉领域.针对传统注意力机制提取特征能力不足、模型复杂且训练困难等问题,本文提出了一种改进注意力机制的图像描述模型.在传统注意力机制的基础上引入高效通道注意模块,在提升特征提取效果的同时降低模型复杂度,在保证性能的同时提高模型效率,更好... 相似文献
17.
信号电平测量是有线电视系统所有其他各种测量的基础。没有合适的系统信号电平所有其他各种测量的结果就都是可疑的。 有线电视系统的图像载波电平是某一频道的图像载波的均方根电压值,它是将图像载波按正弦波考虑、在调制包络峰跨越与有线电视系统的内阻抗相匹配的终接阻抗测量而得的。 相似文献
18.
19.
20.
卷积神经网络(Convolution Neural Networks,CNN)和循环神经网络(Recurrent NeuralNetworks,RNN)在图像分类、计算机视觉、自然语言处理、语音识别、机器翻译、语义分析等领域取得了迅速的发展,引起了研究者对计算机自动生成图像描述的广泛关注。目前图像描述存在的主要问题有输入文本数据稀疏、模型存在过拟合、模型损失函数震荡难以收敛等问题。文中使用NIC作为基线模型,针对数据稀疏问题,改变了基线模型中的文本one-hot表示,使用word2vec对文本进行映射,为了防止过拟合,在模型中加入了正则项和使用Dropout技术,并在词序记忆方面取得创新,引入联想记忆单元GRU,用于文本生成。在试验中使用AdamOptimizer优化器进行参数迭代更新。实验结果表明:改进后的模型参数减少且收敛速度大幅加快,损失函数曲线更加平滑,损失最大降至2.91,模型的准确率比NIC提高了接近15%。实验有效地验证了在模型当中使用word2vec对文本进行映射可明显缓解数据稀疏问题,加入正则项和使用Dropout技术可有效防止模型过拟合,引入联想记忆单元GRU能够大幅减少模型训练参数,加快算法收敛速度,进而提高整个模型的准确率。 相似文献