排序方式: 共有115条查询结果,搜索用时 46 毫秒
111.
112.
使用摄像头进行文字识别最大的问题在于图像抖动。为了有效地消除图像抖动并正确实现文字识别,提出了一种基于统计熵功率的新的识别算法。这种方法将采集到的数据作为随机信号处理。实验证明,此算法计算复杂度低,识别率高,适用于低成本嵌入式系统,在中国台湾俊亿公司24 MHZ 16位DMCU嵌入式系统上,获得了94%以上的正确识别率。 相似文献
113.
基于iPhone平台的骨骼动画研究与实现 总被引:1,自引:0,他引:1
针对目前iPhone平台上只支持无碰撞检测的网格动画和基于图片调用的帧动画的现状,提出了一种新的基于iPhone平台的具有碰撞检测的骨骼动画实现方法.将关节动画与网格动画相结合,生成具有光滑皮肤的逼真骨骼动画.并采用iPhone平台上所使用的SIO2引擎对骨骼动画的数据进行调度和运算,把骨骼动画数据转化为SIO2引擎的物体格式,最后以60帧每秒的速率不断更新数据,从而在iPhone平台上实现了具有碰撞检测功能的骨骼动画.实验结果表明,该方法可以实现具有很强的真实感的动画效果,并继承了SIO2引擎的碰撞检测功能.实现和增强了iPhone平台上骨骼动画及其交互功能. 相似文献
114.
人脸素描照片合成是异质图像变换重要分支,近年来受到广泛关注,在数字娱乐和执法领域都得到了广泛应用。近几年基于生成对抗网络的方法在图像跨域转换方面取得了较大的进步,但合成图像会产生噪声、伪影等问题。以U-Net网络为基础,提出了一种融合多尺度梯度特征的人脸素描照片合成方法,该方法结合了MSG-GAN的思想:允许判别器不仅使用生成器最终输出的梯度,而且还使用从上采样中间层输出的不同分辨率的梯度。同时在U-Net网络中加入了残差学习单元,来缓解深度神经网络训练过程中产生的梯度消失和梯度爆炸的问题。此外还加入了基于MRF-CNN的伪人脸特征生成器,采用块匹配的方法来生成伪人脸图像用于监督生成器的人脸生成。最后在CUFS和CUFSF数据集上的实验结果表明所提出方法的有效性。 相似文献
115.
在描述图像时,阅读视觉场景中的文本对于理解关键信息至关重要。传统的视觉语言预训练任务都无法指导模型关注图像中的文本信息,以及图像中的文本信息和图像内容的关系。针对此问题,提出基于图像文本信息的预训练任务,包括掩模语言建模(MLM)、图像-文本匹配(ITM)以及相对空间位置预测(RPP)。在解码过程中,为解决生成语句冗余问题,提出重复掩码模块,以避免预测语句中出现重复的单词。最后在Textcaps数据集上的实验结果表明,所提的方法可以有效地提高生成描述语句的准确率。 相似文献