排序方式: 共有26条查询结果,搜索用时 15 毫秒
1.
针对说话时发音和口形的异步问题,提出了一个多流异步动态贝叶斯网络(DynamicBayesian Network,DBN)模型,以实现基于音视频特征的连续语音识别,在这个模型中,音频流和视频流在词节点同步,而在词节点之间,音视频流有各自独立的拓扑结构以及节点变量之间的条件依赖关系,同时词转移节点变量由音视频流共同确定,模型在词级别上体现了音视频流的异步性.采用连续数字音视频数据库的实验结果表明,在信噪比为O~30 dB的测试环境下,比较单流DBN模型和多流隐马尔可夫模型,平均识别率分别提高了8.68%和10.07%. 相似文献
2.
目的针对从单幅人脸图像中恢复面部纹理图时获得的信息不完整、纹理细节不够真实等问题,提出一种基于生成对抗网络的人脸全景纹理图生成方法。方法将2维人脸图像与3维人脸模型之间的特征关系转换为编码器中的条件参数,从图像数据与人脸条件参数的多元高斯分布中得到隐层数据的概率分布,用于在生成器中学习人物的头面部纹理特征。在新创建的人脸纹理图数据集上训练一个全景纹理图生成模型,利用不同属性的鉴别器对输出结果进行评估反馈,提升生成纹理图的完整性和真实性。结果实验与当前最新方法进行了比较,在Celeb A-HQ和LFW(labled faces in the wild)数据集中随机选取单幅正面人脸测试图像,经生成结果的可视化对比及3维映射显示效果对比,纹理图的完整度和显示效果均优于其他方法。通过全局和面部区域的像素量化指标进行数据比较,相比于UVGAN,全局峰值信噪比(peak signal to noise ratio,PSNR)和全局结构相似性(structural similarity index,SSIM)分别提高了7.9 d B和0.088,局部PSNR和局部SSIM分别提高了2.8 d B和0... 相似文献
3.
语音和唇部运动的异步性是多模态融合语音识别的关键问题,该文首先引入一个多流异步动态贝叶斯网络(MS-ADBN)模型,在词的级别上描述了音频流和视频流的异步性,音视频流都采用了词-音素的层次结构.而多流多状态异步DBN(MM-ADBN)模型是MS-ADBN模型的扩展,音视频流都采用了词-音素-状态的层次结构.本质上,MS-ADBN是一个整词模型,而MM-ADBN模型是一个音素模型,适用于大词汇量连续语音识别.实验结果表明:基于连续音视频数据库,在纯净语音环境下,MM-ADBN比MS-ADBN模型和多流HMM识别率分别提高35.91%和9.97%. 相似文献
4.
5.
针对现有使用均匀矩形阵列或稀疏矩形阵列的二维无格波达方向估计方法的性能欠佳的问题,提出一种基于二阶特普利茨矩阵重构和二维旋转不变参数估计技术的无格波达方向估计方法。使用均匀矩形阵列或稀疏矩形阵列,对其接收信号的协方差矩阵进行二阶特普利茨结构表达,通过log-det稀疏测度与正定约束构造约束优化问题,并使用优化最小算法求解,最后通过二维旋转不变参数估计技术估计源的二维波达方向,即方位角与俯仰角。这种方法需要多次求解半定规划问题,计算复杂度相对较高,但能获得更好的波达方向估计性能。在仿真实验中,这种方法在均匀矩形阵列或稀疏矩形阵列条件下均有非常低的均方根误差,接近克拉美罗界,证明了其良好的波达方向估计性能。 相似文献
6.
椭球封头圆柱形爆炸容器振动特性研究 总被引:2,自引:1,他引:2
对椭球封头圆柱形爆炸容器在中心点爆炸状态下的 19次有效炮实验给予了介绍并对实验结果的壳体振动特性进行了分析。理论和实验分析表明 ,在封闭容器内爆炸冲击载荷具有明显的脉冲激励特征 ;容器壳体的振动频谱主要受前 10阶固有频率的影响 ;随着冲击载荷的增加 ,其壳体的主振频率将趋于相应壳体的呼吸频率 ,其应变增长具有减少的趋势 ;联接螺栓的振动模态主要受相应圆柱壳体和封头轴向振动模态的影响 ,并出现了在时域上其振动模态在圆柱壳振动模态和封头轴向振动模态间跳变的现象。 相似文献
7.
研究了一种基于动态贝叶斯网络(dynamic bayesian networks, DBN)的语音识别建模方法,利用GMTK(graphical model tool kits)工具构建音素级音频流DBN语音训练和识别模型,同时与传统的基于隐马尔可夫的语音识别结果进行比较,并给出词与音素的切分结果.实验表明,在各种信噪比测试条件下,基于DBN的语音识别结果与基于HMM的语音识别结果相当,并表现出一定的抗噪性,音素的切分结果也比较准确. 相似文献
8.
9.
10.
描述一种3维人脸模型的单视频驱动方法。该方法在传统肌肉模型的基础上,根据嘴部运动特性采用机构学原理建立嘴部运动控制模型,通过视频图像序列跟踪得到特征点的运动规律曲线,进而驱动眼部、嘴部及面部其他部分的网格点运动,产生具有真实感的面部表情动作。仿真结果表明,采用此方法可以得到逼真的人脸表情模拟动画。 相似文献