期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于音素绑定码本映射的说话人声音转换方法 总被引：1，自引：0，他引：1

王子祥戴礼荣王玉平王仁华《模式识别与人工智能》2006,19(3)

介绍说话人声音转换系统框架,并对传统的基于码本映射的说话人声音转换方法进行讨论.指出传统的码本映射方法由于对谱的转换采用所有码本加权叠加,因此会产生转换后语音频谱平滑效应过重的问题,从而使转换后语音音质较差.为了克服这种问题,本文提出基于音素绑定的码本加权叠加方法来完成语音谱的转换,同时利用决策树来完成韵律的转换.实验表明,即使在数据量较少的情况下,该方法也能较好地完成说话人声音转换,并能得到较高的语音音质. 相似文献

2.

一种改进高斯混合模型均值项的语音转换方法

赵义正《微型机与应用》2012,31(19)

语音转换技术主要应用于计算机语音合成、计算机语音翻译、语音编辑、广播及多媒体等方面。高斯混合模型（GMM）是目前语音转换的主流方法,但它的最大不足是会导致转换频谱的过平滑。其中GMM转换函数中的均值项和相关项共同导致了过平滑现象,并且均值项的影响更大。为此提出了结合码本映射法和GMM方法的修正均值法,实验表明,使用修正均值法能够有效抑制过平滑问题。改善转换性能。相似文献

3.

汉语语音合成中的一种声调修正方法

王兵苏恩泽《计算机工程》1996,22(1):6-8

提出一种汉语音的声调修正方法，该方法由声调规则的应用和声调平滑两部分组成。方方法在我们研制的基于基音同步叠加的语间合成系统中使用在改善合成语句的自然度和可度方面取得了较好的效果。相似文献

4.

一种改进的基于码本和高斯混合模型的视频背景分离

《微型机与应用》2017,(19):48-51

文章提出一种基于改进的码本(CB)和高斯混合模型(GMM)的视频背景分离方法。该方法是以自适应的高斯混合模型背景为基础,为每个颜色像素构建混合高斯背景模型,可以对视频帧中每个像素的高斯分布数进行动态控制,并且通过CB(Codebook)算法得到每个像素的时间序列模型,从而对高斯分布的各参数进行学习。实验结果表明,该方法在背景分离的精确度和处理时间上都表现出优异的性能,此外还具有良好的适用性,对复杂场景的变化,可以有效快速地分离视频的前景和背景。相似文献

5.

一种基于改进码本模型的快速运动检测算法 总被引：3，自引：0，他引：3

徐成田峥李仁发《计算机研究与发展》2010,47(12)

从视频序列中分割出运动目标是计算机视觉应用领域中一个基础和关键的任务.针对现有码本模型(codebook model)在RGB颜色空间下不能很好地契合其计算特性,且无法兼顾抗扰动能力和分割质量的问题,提出一种基于改进码本模型的快速运动检测算法.首先将像素从RGB空间转换到YUV空间来建立码本模型;然后单独对每个码字中的亮度分量进行单高斯建模,使得整个码本具有高斯混合模型(Gaussian mixture model)的特性.典型测试序列和扰动检测率(perturbation detection rate)曲线的对比实验表明,该算法是高效和实用的. 相似文献

6.

基于隐马尔可夫模型和高斯混合模型结合的声音转换方法

岳振军邹翔王浩《数据采集与处理》2009,24(3)

针对隐马尔可夫模型较强的语音信号表征能力和高斯混合模型良好的声音转换效果,提出了一种了隐马尔可夫模型和高斯混合模型相结合转换线谱频率的方法,给出了理论推导和算法流程,并利用高斯建模实现了韵律特征的转换.利用所述算法对录制的两段语音进行了仿真实验,转换语音有较好的自然度和清晰度,ABX测试结果显示,文中算法得到的语音在听觉上有90.2%的概率更接近目标说话人语音. 相似文献

7.

一种新的分维高斯混合模型语音转换方法

赵义正《计算机与现代化》2010,(9):82-84

高斯混合模型在语音转换中得到了广泛应用,但其随着模型阶数和特征维数的提高,估计参数的数目会急剧增加,使参数估计的准确性和稳定性大为降低。本文提出将特征向量去相关之后,将向量之间的转换转化为标量之间的转换,以此来减少估计参数个数。实验表明,采用该方法的语音转换算法能有效改善转换语音的性能。相似文献

8.

基于混合码书映射的高效语音转换方法

李海燕王程程徐宁胡芳《数据采集与处理》2016,31(3):512-524

目前主流语音转换算法计算量大,复杂度高,难以在内核小的嵌入式系统上运行。为了降低语音转换的计算复杂度,缩短训练时间,提出一种基于混合码书映射的高效语音转换方法。在训练阶段,根据不同的参与训练的语音数据量建立不同的码书映射关系,节约训练时长,提高准确度。在转换阶段,系统依据训练阶段建立的码书映射关系对浊音帧的声道参数进行转换。另外,为了提高转换语音的主观音质,系统对清音帧的特征参数也作了相应转换,并且修正了转换语音的共振峰频率以克服帧间共振峰抖动的问题。主客观测试结果表明：在保证转换音质的前提下,本文提出的语音转换方法降低了计算复杂度、明显缩减了训练时间。相似文献

9.

基于GMM和概率修正码本的源-目标说话人声门波转换

孙俊戴蓓蒨张剑《数据采集与处理》2007,22(1):19-24

提出了一种用于源-目标说话人声门波导数参数转换的、基于勒让德正交分解的声门波导数波形参数提取方法。该方法将声门波导数波形在6维正交勒让德坐标系中的投影构成了描述其形状的特征矢量,并采用基于GMM的概率分类加权转换算法,使每个特征矢量的转换规则可由多个类所对应的规则的线性加权组合得到,可以使转换性能得到较大的提高。在此基础上,又给出了一种基于GMM的声门波导数波形的码本修正算法,以弥补声门波导数波形参数化而损失的含有说话人个性特征的高频送气分量和波纹分量。实验结果表明,本文方法转换性能明显好于基于矢量量化(VQ)的码本映射算法。相似文献

10.

一种基于曲线拟合的二音节汉语声调识别方法 总被引：1，自引：0，他引：1

曹卫华《计算技术与自动化》1998,17(1):39-42

本文提出了一种利用曲线拟合的方法，对连续二音节汉语语音进行了声调识别，并且加以实现。它采用倒频谱分析技术提取语音的基音周期，并利用倒频谱参数及短时功率进行音节分界。实验证明．基于曲线拟合的汉语声调识别方法，具有算法简单，可适用不同的说话人、高识别正确率等优点，是一种行之有效的方法。相似文献

11.

A Psychophysical Evaluation of Inverse Tone Mapping Techniques

Francesco Banterle Patrick Ledda Kurt Debattista Marina Bloj Alessandro Artusi Alan Chalmers 《Computer Graphics Forum》2009,28(1):13-25

In recent years inverse tone mapping techniques have been proposed for enhancing low-dynamic range (LDR) content for a high-dynamic range (HDR) experience on HDR displays, and for image based lighting. In this paper, we present a psychophysical study to evaluate the performance of inverse (reverse) tone mapping algorithms. Some of these techniques are computationally expensive because they need to resolve quantization problems that can occur when expanding an LDR image. Even if they can be implemented efficiently on hardware, the computational cost can still be high. An alternative is to utilize less complex operators; although these may suffer in terms of accuracy. Our study investigates, firstly, if a high level of complexity is needed for inverse tone mapping and, secondly, if a correlation exists between image content and quality. Two main applications have been considered: visualization on an HDR monitor and image-based lighting. 相似文献

12.

在汉语语音识别中应用声调信息的研究 总被引：6，自引：0，他引：6

乔春雷吴及王作英《计算机工程与应用》2002,38(12):51-53

声调信息在汉语普通话语音识别系统中,具有非常重要的意义。文章实现了声调特征提取的算法,并主要研究了如何应用这些特征,才能最大限度地发挥声调信息的作用,提高识别系统的性能。实验结果表明,声调特征可以和识别系统原有的特征很好地结合,合理应用声调信息能有效地提高识别系统的性能,系统的误识率下降了22.26%。相似文献

13.

一种基于码书映射的高效语音转换方法

王志卫徐宁刘小峰《微处理机》2014,(1):65-69

为了使机器人在人一机语音交互过程中更为自然,利用语音转换技术改变源语音个性特征（机械音）．进而变化为自然的目标人语音,是一种可行的方案。然而,当前的语音转换主流方法在实时性要求高且内核小的嵌入式机器人中并不适用。引入一种高效的改进型码书转换方法。该方法首先通过匹配线性谱频率参数的相对距离来求取加权系数,进而实现码字的预测重构;其次．对预测的码字进行带宽修正。克服频谱偏移问题。实验结果表明：该方法相比较传统方法,在转换性能相当的条件下,运行时间缩短75％左右。相似文献

14.

一种保肤色的压缩类色域匹配方法

王醒谢晶曾平《计算机工程》2003,29(16):50-51,96

肤色是一种重要的习惯色,打印时应尽量保其不变。文章在实验提取肤色域几何特征的基础上,通过对比分析肤色域与打印机色域的几何关系,提出一种保肤色的压缩类色域匹配算法。该算法以肤色域和打印机色域的分布知识为基础,随色调连续调整内核系数,可保大部分肤色不变,对包含肤色的图像有更理想的匹配效果。相似文献

15.

语音转换关键技术研究

ZHANG Zhao-kun 《数字社区&智能家居》2008,(7)

语音转换技术在语音处理领域是一个比较新的研究方向,也是近年来语音领域的研究热点。语音转换技术是指改变源说话人的语音特征使之具有目标说话人特征的一项技术。本文说明了语音转换的定义,介绍了语音的个性特征,列举了频谱包络的几种主要的转换算法以及韵律转换的主要算法。最后说明了语音转换今后的研究方向。相似文献

16.

基于字典学习与结构自相似性的码本映射超分辨率算法

潘宗序禹晶肖创柏孙卫东《计算机辅助设计与图形学学报》2015,(6)

图像的空间分辨率受成像环境、硬件制造水平和成本等多方面因素的影响,存在一定的局限性.为了提高图像的空间分辨率,提出一种基于字典学习与结构自相似性的码本映射超分辨率算法.首先利用训练集构建与图像高低频分量对应的高低频码本,将高低频码本作为训练样本获取高低频字典;然后在初始重建图像中搜索目标图像块的相似图像块,利用相似图像块构建非局部约束项;最后通过求解含有非局部约束项的l0范数最小化问题获取目标图像块的稀疏表示系数,并利用高低频字典重建高分辨率图像块.该算法利用高低频字典表示目标图像块,而不是直接采用高低频码本,提高了算法的运算效率;利用相似图像块构建正则化约束项,提高了重建图像的质量.实验结果表明,与LLE,Sc SR和NARM等算法相比,文中算法取得的超分辨率重建效果更好. 相似文献

17.

基于音素HMM模型语音转换

钱开华《数字社区&智能家居》2008,(4):132-134

通过对语音转换的研究,提出了一种把源说话人特征转换为目标说话人特征的方法。语音转换特征参数分为两类：（1）频谱特征参数;（2）基音和声调模式。分别描述信号模型和转换方法。频谱特征用基于音素的2维HMMS建模,F0轨迹用来表示基音和音调。用基音同步叠加法对基音厨期、声调和语速进行变换。相似文献