共查询到16条相似文献,搜索用时 78 毫秒
1.
高斯混合模型在语音转换中得到了广泛应用,但其随着模型阶数和特征维数的提高,估计参数的数目会急剧增加,使参数估计的准确性和稳定性大为降低。本文提出将特征向量去相关之后,将向量之间的转换转化为标量之间的转换,以此来减少估计参数个数。实验表明,采用该方法的语音转换算法能有效改善转换语音的性能。 相似文献
2.
3.
4.
语音转换技术主要应用于计算机语音合成、计算机语音翻译、语音编辑、广播及多媒体等方面。高斯混合模型(GMM)是目前语音转换的主流方法,但它的最大不足是会导致转换频谱的过平滑。其中GMM转换函数中的均值项和相关项共同导致了过平滑现象,并且均值项的影响更大。为此提出了结合码本映射法和GMM方法的修正均值法,实验表明,使用修正均值法能够有效抑制过平滑问题。改善转换性能。 相似文献
5.
针对传统谱算法在数据降维计算复杂度高的缺点,提出一种基于高斯过程隐变量模型的图像数据降维算法。首先,通过高斯过程(Gaussian Process,GP)建立图像数据的概率模型,得到图像数据的隐变量模型;其次,利用概率最大化原则得到最优超参数,通过最优超参数求取最优数据降维结果;最后,实现图像数据降维。选取Yale,ORL两类数据集与传统算法进行人脸识别对比实验,实验结果表明:所提出的算法针对图像数据降维问题有较好的效果,结合支持向量机算法,可有效地对人脸图像进行识别,且有较高的识别率,从而体现出算法对高维数据降维的准确性。 相似文献
6.
为了降低群体动画中生成大量自然而又相似的人体运动的难度和复杂性,研究了一种基于学习的群体动画生成技术。该技术首先通过建立基于高斯过程隐变量模型和隐空间动态模型的运动姿势学习模型,将高维运动姿势映射到低维隐空间中,并在低维隐空间对相邻姿势的动态演化进行建模;然后通过对已有运动数据的学习来获得组成该运动的姿势的概率分布,再通过隐空间中的动态预测和Hybrid Monte Carlo采样来得到符合给定概率分布的隐轨迹;最后通过姿势重构来得到与原运动非常相似但又不同的一系列自然的运动,以产生群体动画,从而避开了传统的基于几何和物理约束的逆运动方法固有的困难和复杂性。 相似文献
7.
声道归一化是语音识别中说话人自适应的方法之一,在噪声环境下对其进行了研究并做了一系列的实验.在实现过程中,首次在噪声环境下采用了基于单高斯混合模型选择弯折因子的方法,并取得了良好的结果.实验基于AURORA语音数据库,并用其所带的汽车噪声环境下的测试集对模型进行了识别验证.实验结果表明,采用声道归一化后的识别结果在各个噪声下均比原来有不同程度的改善,迭代训练能改进单轮声道归一化的结果,最佳结果出现在迭代训练的第三轮.噪声环境下基于一个高斯混合模型选择的弯折因子相比其他高斯混合模型选择的弯折因子,句子平均识别率提高了近1.68%.经过声道归一化后的性别独立模型的识别结果能接近于未经声道归一化后的性别依赖模型的识别结果,如果训练数据充分,声道归一化后的性别独立模型的识别结果能更好. 相似文献
8.
高斯过程隐变量模型(GPLVM)作为一种无监督的贝叶斯非参数降维模型,无法有效利用数据所包含的语义标记信息,同时其建模过程中假设观测变量的各特征相互独立,忽略了特征之间的空间结构信息。为解决上述问题,采用图像池化操作获得不同尺度的特征表示,利用线性投影方式将不同尺度的图像投影到低维隐空间进行特征融合,并将融合特征和数据标记分别作为输入和输出,构建多尺度多核高斯过程隐变量模型(MSMK-GPLVM),通过图像数据与数据标记的关联实现模型监督学习,同时对GPLVM和线性投影权重矩阵进行联合学习以提高分类性能。实验结果表明,MSMK-GPLVM能够有效利用图像空间结构信息和语义标记信息,相比其他隐变量模型具有更强的数据降维和分类能力。 相似文献
9.
10.
EM算法是高斯混合模型参数估值的常用方法,该算法有局部收敛的特性,易造成模型的参数估计对于初值较为敏感,往往得到一个局部的最优值.为了对EM算法进行优化,文中将具有全局寻优和并行搜索特性的遗传算法与EM算法相结合,对其加以改进,并用到语音转换过程之中,最后通过仿真实验分析了算法的性能,结果表明使用优化算法得出的高斯混合模型所转换出来的语音,相对于传统EM估计算法得出的高斯混合模型所转换出来的语音,具有较小的失真测度值,证明使用该优化算法能够改善转换后的语音质量. 相似文献
11.
驾驶辅助系统被认为是解决交通安全问题的有效手段, 开发驾驶辅助系统的基础是对车辆的行为进行准确的识别, 以应用于车辆安全预警, 路径规划, 智能导航等方面. 目前存在的基于支持向量机模型, 隐马尔科夫模型, 卷积神经网络等行为识别方法还存在计算量与精度平衡的问题. 本文结合了隐马尔科夫模型与高斯混合模型, 提出了高斯混合隐马尔科夫模型, 利用美国联邦公路管理局NGSIM数据集对此方法进行了实验验证, 结果表明该方法对自由换道行为识别具有较高的精度. 本文还对高斯混合隐马尔科夫模型的实验参数进行了优化, 以期达到最好的识别效果, 为未来智能驾驶的车辆行为识别提供了参考. 相似文献
12.
13.
With the increasing demands of visual surveillance systems, human identification at a distance has gained more attention from the researchers recently. Gait analysis can be used as an unobtrusive biometric measure to identify people at a distance without any attention of the human subjects. We propose a novel effective method for both automatic viewpoint and person identification by using only the silhouette sequence of the gait. The gait silhouettes are nonlinearly transformed into low-dimensional embedding by Gaussian process latent variable model (GP-LVM), and the temporal dynamics of the gait sequences are modeled by hidden Markov models (HMMs). The experimental results show that our method has higher recognition rate than the other methods. 相似文献
14.
HMM模型具有良好的适应性,可以自动学习,对预测随机时序数据性能良好。场景是足球视频的基本特征,场景的转换体现了足球视频的摄制、编辑模式,表现了足球视频的语义。提出了一种基于场景分析和HMM的视频语义分析框架,用于识别足球视频中的一些语义事件。为了克服以往基于主颜色和其他底层特征的视频场景分析中存在的较大误差,又提出基于视觉注意模型对足球视频中的场景进行分析。实验结果表明,基于场景分析和HMM的事件识别方法对足球视频中的任意球事件有良好的识别效果 相似文献
15.
从含有复杂背景的单幅灰度图像中精确定位人眼仍是一个尚未完全解决的复杂问题.为了对图像中的人眼进行精确定位,提出了一种基于动态HMM概率分布模型的人眼精确定位方法,该方法采用了含状态持续时间的动态观测符号概率分布HMM模型,首先用虹膜网格采样方式和特殊的特征提取办法来抽取观测序列;然后通过对观测序列进行评估来控制采样网格大小,并动态修正观测符号概率分布.这样无需对图像进行旋转、缩放和匹配运算,即可对图像中的人眼进行精确定位.实验结果表明,该方法检测效率较高、算法鲁棒,并具有较高的定位精度. 相似文献
16.
随着互联网的不断发展,大多数社会网络已逐渐显示出动态特性,动态社会网络社团分析对理解现实生活中社会网络结构和功能具有非常重要的意义.针对动态社会网络中的社团发现问题,提出一种基于隐Markov模型(hidden Markov model, HMM)的HMM_DC算法.该算法考虑到社会网络的动态特性,结合历史信息,将社团发现转化为求解隐马尔可夫模型中的最优状态序列问题,将网络中的社团结构和节点信息分别采用状态链和观察链表示,在无须指定额外参数的情况下实现动态网络的社团结构发现.最后,利用该算法和其他算法对VAST数据集、ENRON数据集和Facebook social network数据集进行实验仿真.仿真结果表明:该算法能够快速、准确地发现真实动态网络中的社团,其模块度Q值和互信息NMI值有很大提升. 相似文献