排序方式: 共有9条查询结果,搜索用时 0 毫秒
1
1.
2.
3.
计算机计算性能的提升使得深度学习成为了可能。作为计算机视觉领域的重要发展方向之一的目标检测也开始结合深度学习方法并广泛应用于各行各业。受限于网络的复杂度和检测算法的设计,目标检测的速度和精度成为一个trade-off。目前电商领域的飞速发展产生了大量包含商品参数的图片,使用传统方法难以有效地提取出图片中的商品参数信息。针对这一问题,本文提出了一种将深度学习检测算法和传统OCR技术相结合的方法,在保证了识别速度的同时大大提升了识别的精度。本文研究的问题包括检测模型、针对特定数据训练、图片预处理以及文字识别等。本文首先比较了现有的目标检测算法,权衡其优缺点,然后使用YOLO模型完成检测任务,并针对YOLO模型中存在的不足进行了一定的改进和优化,得到了一个专用于检测图片中商品参数的目标检测模型,最后使用tesseract完成文字提取任务。在将整个流程结合到一起后,我们的系统不仅有着较好的识别精度,而且是高效和健壮的。本文最后还讨论了优势和不足之处,并指出了未来工作的方向。 相似文献
4.
5.
6.
7.
随着生成式对抗网络的出现,从文本描述合成图像最近成为一个活跃的研究领域.然而,目前文本描述往往使用英文,生成的对象也大多是人脸和花鸟等,专门针对中文和中国画的研究较少.同时,文本生成图像任务往往需要大量标注好的图像文本对,制作数据集的代价昂贵.随着多模态预训练的出现与推进,使得能够以一种优化的方式来指导生成对抗网络的生成过程,大大减少了对数据集和计算资源的需求.提出一种多域VQGAN模型来同时生成多种域的中国画,并利用多模态预训练模型WenLan来计算生成图像和文本描述之间的距离损失,通过优化输入多域VQGAN的隐空间变量来达到图片与文本语义一致的效果.对模型进行了消融实验,详细比较了不同结构的多域VQGAN的FID及R-precisoin指标,并进行了用户调查研究.结果表示,使用完整的多域VQGAN模型在图像质量和文本图像语义一致性上均超过原VQGAN模型的生成结果. 相似文献
8.
9.
1