首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
介绍了采用连续M元高斯混合密度的隐式马尔柯夫模型的语音识别实验系统,对语音特征矢量用非线性归一化算法进行预处理。另一,还提出一种基于语音识别的模型初始化方法。实验证明:语音的预处理和模型初始化方法都取得了较明显的效果。  相似文献   

2.
基于支持向量机的变异语音分类研究   总被引:6,自引:0,他引:6  
变异语音的训练样本有限,采用传统的分类方法进行分类,效果不够理想,而支持向量机方法在有限样本情况下可以保持很好的分类推广能力.采用支持向量机方法进行变异语音分类,提取基频和TE0基频作为变异语音分类的特征,讨论了样本预处理和参数选择等问题.提出了直接截取和DTW规正两种方法来解决语音样本特征向量长度不一致的问题.基于TE0基频特征,采用指数径向基函数(ERBF)内核,对应力(G—force)影响下的变异语音进行分类,分类正确率可达到99.2%,比传统的贝叶斯分类器和HMM分类器,分类性能分别平均提高了12.6%和6.0%.实验结果表明,采用支持向量机方法进行变异语音分类是可行的.  相似文献   

3.
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数元,使似然概率最大。通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降.采用能覆盖话者语音的高斯混合模型-通用背景模型(GMM—UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。  相似文献   

4.
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数λ,使似然概率最大。文中通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降,本文采用能覆盖话者语音的高斯混合模型.通用背景模型(GMM-UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。  相似文献   

5.
基于时频分步处理的PSOLA韵律合成方法   总被引:2,自引:0,他引:2  
结合FD-PSOLA和TD-PSOLA算法的优势,提出一种音高、时长分步处理的语音韵律拼接合成方法.根据韵律生成模型计算得到的基频参数和时长参数,分别在频域和时域对语音拼接单元进行调整,在保持音库语音拼接单元清晰度和自然度基本不变的情况下,合成语音的韵律调控能力得到提高.以汉语短语词组合成实验证明了该方法实现的有效性.  相似文献   

6.
本文提出了维纳滤波算法和生成对抗网络相结合的语音去噪方法.首先用维纳滤波算法对带噪声语音信号进行预处理,提高语音信号的识别度,然后将预处理后的语音信号作为深度学习生成对抗网络的输入,进一步去除噪声信号.实验结果表明,本文提出的去噪方法将带噪声语音信号的分段信噪比从4. 83 db提升到了5. 09 db,去噪效果较为明显.  相似文献   

7.
利用小波的带通性质 ,给出了一种新的小波预处理方法 .实验表明 ,经过小波预处理后提取的特征 ,提高了语音的识别率  相似文献   

8.
仿生模式识别基本原理应用到非特定人连续语音识别中,在构建语音模型时,将高维空间点覆盖的理论应用到非特定人的连续语音识别的学习过程中,在识别时,采用高维空间覆盖动态搜索的方法,对连续语音进行动态搜索,这样就可以避免因分割错误而带来的错误识别.通过实验得到了较为满意的识别结果。  相似文献   

9.
传统语音识别系统中,基于循环神经网络的语音声学模型对长距离历史信息记忆能力有限,难以利用语音的上下文相关性信息,标准长短时记忆单元参数规模庞大,神经网络训练收敛速度较慢。针对以上问题提出一种基于改进门控循环单元的双向循环神经网络的语音识别声学模型。改进模型使用ReLU函数代替双曲正切激活函数,选取单位正交矩阵作为网络初始化参数,结合批量规范化方法,在维持网络长期依赖关系的同时加快训练收敛速度。在TIMIT和LibriSpeech数据集上的实验结果表明:与基线系统相比,改进的门控循环单元模型有2.8%的绝对音素错误率的下降;与标准长短时记忆单元模型相比,神经网络训练的平均迭代周期减少了16.6%,在识别性能和计算效率上均有提升。  相似文献   

10.
4.8kbps多带激励语音编码器的模拟实现   总被引:1,自引:0,他引:1  
文章阐述了多带激励(MBE)语音产生模型与以往单一激励语音产生模型的区别及其优越性。研究了以MBE模型为基础进行语音分析合成的基本原理和实现的算法。提出了4.8kbpsMBE语音编码方案,并在计算机上进行了模拟实现。实验结果表明,所模拟的4.8kbpsMBE语音编码器系统是成功的。其合成语音在可懂度与自然度方面,与以往的线性预测(LPC)、码激励线性预测(CELP)语音编码系统相比都有了明显的改善。  相似文献   

11.
针对语音信号处理中语音短时幅度谱分布模型过于单一的问题,提出了一种基于隐马尔科夫模型的语音幅度谱分布估计算法。该算法利用瑞利混合模型作为语音幅度谱分布,采用隐马尔科夫模型将语音分成不同的状态,在每一状态中有一组瑞利混合模型参数与之相对应,通过把语音信号分成不同的状态对语音进行分类,为语音短时谱幅度建立更为准确的模型。  相似文献   

12.
语音增强是解决噪声污染的有效方法,它的首要目标是在接收端尽可能从带噪语音中恢复纯净的语音信号.Sweldens等人引入了基于提升法的小波变换,也称为第二代小波变换.提升法是一种柔性的小波构造方法,它可以使用许多线性,非线性或者空间变化的预测和更新算子,而且可以确保变换的可逆性.该文讨论强背景噪声下的基于自适应提升小波变换的语音增强方法,并与自相关相减法语音增强算法进行比较.计算机仿真结果表明,该方法在大大消除背景噪声同时保持语音信号较好的可懂度.  相似文献   

13.
语音信号的端点检测是语音识别过程中的重要环节,端点检测结果精确与否直接关系着语音识别的准确度。使用车载语音作为测试数据,利用传统双门限法进行端点检测,发现传统双门限方法在静音条件下和带噪条件下获得语音端点检测信息存在较大误差。针对上述问题,提出了一种改进的双门限法进行语音端点检测,针对语音信号以及短时平均能量和过零率进行处理,并通过Matlab进行仿真,实验结果说明提出的改进方法与传统方法相比,在静音和带噪条件下,都更接近测试数据中真正的语音端点。  相似文献   

14.
基于深度神经网络的语音增强模型的训练一般采用均方误差作为代价函数,没有针对语音增强问题进行优化。针对这一问题,从相邻帧网络输出之间的相关性和各时频单元的语音存在情况两方面进行考虑;通过在代价函数中对相邻帧的网络输出进行关联,并设计一个反映时频单元语音存在情况的感知系数,提出了一种感知联合优化的深度神经网络语音增强方法。实验结果表明,相比基于均方误差的语音增强方法,该方法显著地提高了增强语音的语音质量和可懂度,具有更好的语音增强性能。  相似文献   

15.
针对不同编码算法对语音质量的影响,采用语音质量改进参数构造特征矢量,提出了一种基于SVM多级判决的语音编码检测算法,实现了对不同信道的识别。采用统计方法对这组参数的区分性进行了分析,在此基础上设计了一种高效的信道检测方案,结合实际数据,测试了算法性能,并分析了语音长度对性能的影响。实验结果表明,该算法能有效地提高信道检测准确率。  相似文献   

16.
针对基于语音识别的语音检索方法对语言模型的强依赖问题,通过改进声学模型学习框架提出了一种新的朝鲜语语音检索方法.该方法首先修改KoSpeech框架的网络模型,通过训练得到了朝鲜语的声学模型; 其次通过语音文档分割方法构建了语音文档索引库; 最后利用编辑距离匹配的方法实现了语音检索.实验结果表明,改进的朝鲜语声学模型学习框架降低了语音检索方法对语言模型的依赖和大规模数据集的要求.当k取9时, top -k评价方法的检索均值平均精度达到86.74%, 召回率达到95.25%, 该结果表明本文提出的方法是有效的,具有一定的实际应用价值.  相似文献   

17.
为了从声学语音学角度比对朝鲜语与蒙古语的相似性,提出了一种利用相似单元音在连续语音段中出现的概率分布来对比分析语音相似程度的方法.首先,采用双门限静音段检测方法将连续语音自动划分为一系列的语音段,然后采用模式识别方法检测和统计5对相似单元音在语音段首、段中和段尾的概率分布,最后通过对比分析概率分布比较了朝鲜语和蒙古语的语音相似性.对比分析结果表明,朝鲜语与蒙古语语音之间存在差异性,这两种语音的声学特征不具有相似性.本文研究方法和结果可为进一步研究朝鲜语与蒙古语的语音对比提供参考.  相似文献   

18.
为了提高语音识别系统的顽健性,在对应力影响下语音数据分析的基础上,提出一种新的基于MF-CC系数加权的变异语音识别方法。它首先通过正常语音和应力影响下变异语音的差异求得一个变异影响因子,然后对该因子的倒数进行规正作为MFCC特征不同维的权值,从而减弱受变异影响较大的特征对识别性能的影响。对航空模拟飞行器中采集的特定话者小词表孤立词的实验表明,与传统的多重风格训练方法相比,该方法的识别率提高了10.9%;将其和倒谱平均减方法相结合,可进一步将识别率提高5.4%。  相似文献   

19.
The human ear can only accept one sound signal at one time, and the signal with the highest energy will shield other signals with low energy. According to the above principle, this paper combines the self-attention and the multi-head attention to propose a speech enhancement method based on the multi-head self-attention mechanism. By applying multi-head self-attention calculation to the input noisy speech features, the clean speech part and the noise part of the input speech feature can be clearly distinguished, thereby enabling subsequent processing to suppress noise more effectively. Experimental results show that the proposed method significantly outperforms the method based on the recurrent neural network in terms of both speech quality and intelligibility.  相似文献   

20.
获取复杂声学背景下的语音流以得到有用信息是一些部门极其重要的工作.研究了在无线话带通信中实现语音流的机器自动检出.结合人的听觉外周和听觉心理的研究,提出了一种基于人耳听觉感知特性的噪声环境下语音流检测方法.该实验采用来自现场的大量的无线话带录音作为测试数据,结果表明,这种新的方法可很好地排除各种噪声的干扰,强噪声环境下表现良好.无论在抗噪方法还是在实际应用中,都有很好的应用前景.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号