首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
《通讯世界》2005,(3):70
端点检测在语音识别系统中的作用作为一个完整的语音识别系统,其最终实现及使用的效果不仅仅限于识别的算法,许多相关因素都直接影响着应用系统的成功与否。语音识别的对象是语音信号,端点检测的目的就是在复杂的应用环境下的信号流中分辨出语音信号和非语音信号,并确定语音信号的开始及结束。一般的信号流都存在一定的背景声,而语音识别的模型都是基于语音信号训练的,语音信号和语音模型进行模式匹配才有意义。因此从信号流中检测出语音信号是语音识别的必要的预处理过程。详细说来,端点检测有两个过程:1.基于语音信号的特征,用能量、过零…  相似文献   

2.
吴亚琴 《电子世界》2014,(3):119-119
在实际应用中,待分析的语音信号一般是被噪声污染的语音,很大程度上影响了语音处理系统的性能。为此,需要我们对带噪语音进行语音增强处理,抑制噪声,恢复纯净语音。本文就谱减法对带噪语音进行处理,并利用matlab行仿真,验证了谱减法的语音增强的效果。  相似文献   

3.
基于BP神经网络的耳语音转换为正常语音的研究   总被引:1,自引:1,他引:0  
提出了一种基于BP神经网络的汉语耳语音转换为正常语音的方法.首先提取正常语音、耳语音的共振峰参数,使用BP神经网络训练出耳语音到正常语音共振峰参数的转换模型;然后根据模型求出与耳语音对应的正常语音共振峰参数,采用共振峰合成的方法将耳语音转换为正常语音.实验结果表明:使用该方法转换的正常语音DRT得分为80%,MOS得分为3.5,在可懂度和音质方面均达到了满意的效果.  相似文献   

4.
语音识别的发展现状   总被引:5,自引:0,他引:5  
语音识别基础让机器听懂人类的语音,这是人们长期以来梦寐以求的事情。语音识别是一门交叉学科,关系到多学科的研究领域,不同领域上的研究成果都对语音识别的发展作了贡献。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。计算机语音识别过程与人对语音识别处理过程基本上是一致的。目前主流的语音识别技术是基于统计模式识别的基本理论。一个完整的语音识别系统可大致分为三部分:(1)语音特征提取:目的是从语音波形中提取随时间变化的语音特征序列。(2)声学模型与模式匹配(识别算法):声学模型是识别系…  相似文献   

5.
姚瑶 《信息通信》2010,23(3):59-61
语音增强目的是从带噪语音中尽可能纯净的原始语音,即消除含噪语音信号中的噪声成份,提高输入信号的信噪比.在实际应用环境中,语音都会不同程度受到噪声的干扰,噪声会影响语音质量,严重的情况下将语音完全淹没到噪声中,无法分辨.本文将读入的语音信号加入正态随机噪声,然后对含噪声的语音信号进行小波分解,估计噪声的方差,然后获取去噪的阈值并对小波分解的高频系数进行阈值量化,得到去噪后的语音信号.仿真证明此方法具有很好的增强效果.  相似文献   

6.
语音转换是近年来随着语音识别与语音合成技术的发展而诞生的,属于语音信号处理领域的一个新方向.语音转换技术不仅能够为很多行业提供便利,还能为语音研究领域提供理论和技术支持.本文首先对语音转换的基本原理和系统进行相应的分析,最后研究通过GMM模型进行语音的转换来合成语音.  相似文献   

7.
常见的语音控制系统多采用单片机和专用的语音处理芯片来完成,其缺点是语音处理芯片的性价比普遍不高,导致开发成本高,且开发周期较长.在深入研究凌阳SPCE061A单片机在语音处理方面的优越性能后,设计了一套智能交通灯语音播报控制系统.给出了控制系统方案设计,并重点讲述系统语音设计方案,包括语音输入电路、语音输出电路以及语音输入和语音输出的流程图等.  相似文献   

8.
戴礼荣  宋彦  王仁华 《电子学报》2002,30(10):1552-1554
重叠语音在本文中定义为由两个及两个以上原始语音叠加所形成的混合语音.重叠语音分离,由于不能利用方位信息,困难更大.但人的听觉系统却能够有效感知和分离这种重叠语音.本文利用语音的谐波特性对重叠语音分离进行研究.提出基于语音信号谐波分析的帧同步分离方法,并给出实验结果.  相似文献   

9.
多功能网话机是计算机技术与电话技术集成CTI的最新应用成果.通过语音的压缩方法将模拟语音信号转化为数字语音信号,通过对语音数字信号数据编码进行压缩处理.把这些语音数据按TCP/IP标准进行打包,经过Internet网络把数据包送至接收地,再把这些语音数据包串起来,经过解压处理后,恢复成原来的语音信号,从而达到由互联网传送语音的目的。  相似文献   

10.
由于目前语音增强方法或算法难以对语音频谱在时频域上的结构化信息进行有效建模和利用。然而,深度学习中的RBM、DNN等模型擅长对数据中的结构化信息进行建模,而且具有从数据的低层结构化信息提取更高层的结构化信息的能力。基于分类深度神经网络的语音增强,该方法对于低信噪比非平稳语音增强可得到高可懂度的增强语音,但语音音质损失严重。基于DNN的最小均方误差回归拟合语音增强方案,该语音增强方案还说明大语音数据训练能保证DNN较充分学习到噪声语音谱和干净语音谱之间复杂的非线性关系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号