共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
汉语语音变换技术的目的是将汉语语音中源说话人的语音特征转换为目标说话人语音特征。提出的适用于汉语说话人的变换算法分为3个部分:前两部分用高斯混合模型实现了语音的谱包络(线性预测编码)及其激励(残差)的转换;第三部分采用支持向量回归算法实现语音的韵律变换规则建模,结合汉语语音特点利用基音同步叠加算法实现语音的超音段特征调整。与现有的语音变换算法进行比较,算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音变换并得到高自然度合成语音,是一种有效的汉语语音变换算法。 相似文献
3.
语音转换是近年来随着语音识别与语音合成技术的发展而诞生的,属于语音信号处理领域的一个新方向.语音转换技术不仅能够为很多行业提供便利,还能为语音研究领域提供理论和技术支持.本文首先对语音转换的基本原理和系统进行相应的分析,最后研究通过GMM模型进行语音的转换来合成语音. 相似文献
4.
在实际应用中,待分析的语音信号一般是被噪声污染的语音,很大程度上影响了语音处理系统的性能。为此,需要我们对带噪语音进行语音增强处理,抑制噪声,恢复纯净语音。本文就谱减法对带噪语音进行处理,并利用matlab行仿真,验证了谱减法的语音增强的效果。 相似文献
5.
《现代电子技术》2017,(4)
由于语音通信受环境的影响较大,导致传统的语音通信控制系统无法满足用户需求,控制质量较低。因此,构建远程无线网络语音通信控制系统,系统中的语音识别模块利用CG6565语音卡进行语音信号的收集,并对其进行降噪处理。降噪后的语音信号被转换成便于处理的数字信号,并将数字信号的特性参数提取出来。语音识别模块对特性参数进行识别、调整和测量后组成语音文件夹,并将语音文件夹反馈到远程无线网络控制模块。远程无线网络控制模块对语音文件夹中的语音文件进行一系列的处理,处理后的语音文件被传输到用户手中,实现系统对用户设备的远程语音控制。软件给出了语音通信信号的目标函数,以及该目标函数的调用代码。实验结果表明,所设计的系统具有较高的控制效率和控制准确率,控制质量总体较高。 相似文献
6.
7.
8.
当前智能语音客服质检方法无法安全转换语音信息,语音质检过程优先级混乱,导致质检过程流量消耗较大。为此,提出基于置信区间的智能语音客服质检方法。构建智能语音客服质检信息的算术编码模型,实现智能语音客服质检信息的模糊聚类和特征提取。建立智能语音客服质检信息的统计特征辨识参数模型,完成对智能语音信息的安全转换控制。分析智能语音客服质检信息参数,根据智能语音客服质检等级实现对质检置信度区间设置,实现对智能语音客服质检优化控制。仿真实验结果表明,所提方法的输出可靠性较好,质检置信度水平较高。 相似文献
9.
10.
沈伟 《信息技术与信息化》2014,(8):194-196
对语音数据库进行标注的目的是为语言工程和与语音研究提供可靠的数据。对语料库进行统计的方法一直是目前语音分析和语音技术的主流;同时,语音的基础研究,也很少使用实验室语音进行定性分析,而趋向采用大量自然语料的定量统计分析,所以语音数据库的标注显得尤为重要。 相似文献
11.
由于目前语音增强方法或算法难以对语音频谱在时频域上的结构化信息进行有效建模和利用。然而,深度学习中的RBM、DNN等模型擅长对数据中的结构化信息进行建模,而且具有从数据的低层结构化信息提取更高层的结构化信息的能力。基于分类深度神经网络的语音增强,该方法对于低信噪比非平稳语音增强可得到高可懂度的增强语音,但语音音质损失严重。基于DNN的最小均方误差回归拟合语音增强方案,该语音增强方案还说明大语音数据训练能保证DNN较充分学习到噪声语音谱和干净语音谱之间复杂的非线性关系。 相似文献
12.
为了有效抑制非平稳背景噪音对语音处理系统的严重干扰,提出了一种基于长短时能量均值的活动语音检测算法.该算法基于两个合理的假设,一个是基于语音隐含成分集的稀疏分解,不但能尽可能地保留含噪语音中的语音信息,还能在一定程度上消除非语音类噪音的干扰;另一个是对上述稀疏分解的语音进行重构,该重构信号中语音段的时域能量高于非语音段... 相似文献
13.
语音增强用来降低抑制住背景噪声,达到改善语音质量和可懂度的目标,使听者乐于接受语音增强的同时可以更好的听懂语音。目前大部分语音增强算法在实验室环境下效果都比较好,但面对复杂背景噪声环境,语音质量和可懂度下降非常明显。针对复杂背景噪声环境,使得增强语音随噪声时变而变化,一般采用自适应算法对语音进行处理,改善语音质量。 相似文献
14.
15.
传统变换域语音增强方法对语音做短时平稳性假设,这会造成对语音信号和噪声信号谱估计不准确,从而导致语音失真和残留噪声。本文提出一种从联合时频域进行语音增强的方法,该算法无需对语音做短时平稳假设。算法采用具有最佳能量聚集特性的高斯变换核函数,利用能快速实现的实值离散Gabor变换(RDGT)将语音信号变换到联合时频域,然后利用语音和噪声谱服从高斯分布的假设和无语音概率的思想进行基于最小均方误差的语音对数谱估计,采用改进的最小受控递归平均算法(IMCRA)进行噪声时频谱估计,在得到纯净语音的谱估计后利用实值离散Gabor逆变换获得纯净语音估计。实验表明,该算法相比频域变换算法具有较好的语音去噪度和较低的语音失真度。 相似文献
16.
17.
18.
19.