首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 312 毫秒
1.
为了进一步提高针对汉语语音的唇形特征识别效果,分析实际汉语语音发音过程中声母韵母之间音素的变换规律,以及连读等发音习惯而造成的口形变化,利用唇形特征所对应的音素帧间的相关性,采用二阶隐马尔可夫模型来对唇形特征参数序列进行学习和识别,从而分析汉语唇形识别效果.基于独立汉字发音的实验表明,在针对特定人的识别条件下,在最优的加权因子(m∶n=1.5∶1)特征组合条件下,针对同一组融合得到的特征向量,考虑了音素帧间的相关性后,识别率提高了1.2%.可见汉语音节中音素帧间的相关性与唇形特征的变化规律相对应,有利于提高唇形识别的效果.  相似文献   

2.
端点检测和声韵母分离是汉语语音信号处理的一个重要预处理步骤.针对单门限算法在检测过程中出现的漏检问题,提出了一种基于双门限算法的汉语语音信号端点检测和单音节声韵母检测方法,通过短时能量与过零率相结合,弥补单门限算法的不足,并对检测方法进行仿真,验证了该方法的准确性和有效性.  相似文献   

3.
基于小波变换的静音与语音分割新算法   总被引:6,自引:1,他引:6  
含噪语音信号的静音与语音分割,即端点检测问题是语音识别至关重要 的一步,为了提高语音分割对环境的适应性,提出了一种利用小波变换分割含噪语音信号中静音与语音的新算法,该算法首先将语音信号进行小波变换,利用小波系数去噪,然后选择小波部分子带跟踪信号的能量变化以分割语音与静音,仿真实验表明该算法在低信噪比条件下也能够有效分割语音。  相似文献   

4.
利用小波变换多分辨率分析的特点对汉语语音信号进行分析,成功地提取了一个反映声母和韵母之间过渡段信息的特征参数-过渡帧,利用该参数进行声/韵切分。通过对289个音节的实验,结果表明,小波变换能较好地捕促声韵母间的过渡信息。  相似文献   

5.
应用连续隐马尔可夫模型(CHMM)为识别算法,采用MFCC(MEL频率倒谱系数)为主要语音特征参数,建立了一个汉语连续数码串语音识别系统,其中包括语音信号的预处理、特征参数的提取、识别模板的训练以及识别匹配算法,文中就系统的各个部分的具体实现进行了阐述.同时,利用MATLAB的语音工具箱voice box对系统进行了仿真,并给出了系统识别结果,指出了系统进一步改进的方法.  相似文献   

6.
汉语语音识别中,较关键的问题之一是正确地抽取声母(辅音)和韵母(元音、复合元音、鼻韵母)的声学特征。而声和韵两者的声学特征是不同的,所以预分汉语语音的声和韵,以便各段找出其声学特征是很有必要的。本文在采用线性预测(LPC)分析法的前提下,利用已求得的部分相关系数(PARCOR),根据部分相关系数与无损声管模型的关系,选择部分相关系数 K_1,求始端声门处的相邻两节声管的面积比 g_1,根据 g_1的大小来判别声和韵,试验表明此法对区别22个辅音及36个韵母均适用。  相似文献   

7.
汉语语音转换技术的目的是在保持语义信息不变的前提下将汉语语音中源说话人的语音特征转换为目标说话人的语音特征.提出的适用于汉语说话人高自然度语音转换算法主要分为三个部分:前两部分用VQ模型实现了语音的谱包络及其激励的转换,第三部分采用BP算法实现语音的韵律转换规则建模.算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音转换并得到高自然度合成语音.实验表明本文提出的转换方法是一种有效的汉语语音转换算法.  相似文献   

8.
“汉语拼音发音教学仪”是根据汉语拼音方案规定的声母、韵母、拼音、音节,模拟人体发音器官,按照普通话的标准发音规范,将发音时唇、齿、舌、腭、喉、鼻、气流与声音形成的同步动程图象全部反映在一块显示电路板上,为小学汉语拼音教学,高、中等师范学校汉语语音教学、培训师资以及在社会上推广普通话,提供了一种直观、形象且集发音、演示、讲解、训练为一体的教学仪器。这一成果由西北轻工业学院自动控制工程系和陕西省成阳教育学院联合研制。经双方研  相似文献   

9.
在语音增强系统中,当一个语音信号相对于背景噪声很强时,采用传统的LMS算法存在剩余均方误差随有用信号功率线性增加的问题,因此提出B-WSLMS算法。与传统的语音增强算法不同,B-WSLMS算法将WSLMS算法应用到组合FIR滤波器中,算法的权值根据输出功率变化进行更新,并且权值更新收敛系数与输出功率成反比进行变化,有效弥补了LMS算法的缺点。同时,通过在组合FIR滤波器中选取不同的辅助变量收敛系数,B-WSLMS算法可以使语音增强系统得到更好的信噪比提高量。仿真结果表明,在语音增强系统中,B-WSLMS算法优于LMS算法及WSLMS算法.  相似文献   

10.
彝语的语音识别与处理是语音信号处理领域的一个新方向.本文在深入分析彝语特点的基础上,对用于汉语孤立词识别的经典端点检测算法进行了改进.探讨了动态时间规整算法(Dynamic Time Warping,DTW)和高效动态时间规整算法(Efficient DTW,EDTW)在彝语孤立词识别中的应用,并提出了两种新算法:基于音节个数的动态时间规整算法(Syllable Number Based Improved DTW,SDTW)和基于音节个数的高效动态时间规整算法(Syllable Number Based Improved EDTW,SEDTW),对特定的彝语语音信号进行识别.实验结果表明,所提出的两种新算法分别在信号识别率和识别时间上比经典算法优越.  相似文献   

11.
0 INTRODUCTIONInordertodevelopaChineseorderrecognitionsystemtocontrolspaceteleoperatingmanipulatorsbysound,itisveryimportant...  相似文献   

12.
普通话语音识别中的基本音素分析   总被引:2,自引:1,他引:2  
分析普通话发音的基本音素,选取8个元音音素和22个辅音音素作为发音构成的基础,列出了由音素构成汉语拼音声母和韵母的方法,从而为形成从音素到拼音的两步式识别法奠定了基础.  相似文献   

13.
针对智能化计算机中汉语语音识别这一重要研究课题,利用小波分析方法,以神经网络为基础,提出了基于能量的汉语语音音节划分的自动实现的方法,这是实现汉语语音识别的基础和前提。  相似文献   

14.
针对语音识别过程中环境噪声干扰大的问题,提出一种基于经验模态分解(EMD)与动态时间规整 (DTW)相结合的孤立词识别算法。该方法利用EMD 算法,首先将提取的性能不好的语音信号分解成若干个基本模函数(IMF),去掉原始信号中的干扰和噪声。然后,基于DTW 算法,采用短时过零率和短时能量对语音信号进行端点检测,提取语音特征参数后与参考模板进行匹配。将参考模板与待测模板之间的最短路径作为识别结果。仿真结果表明,该算法能够提高语音的识别效率和识别的正确率。  相似文献   

15.
针对声韵母相同但声调不同的近音字识别问题和声韵母及声调都相同的同音字识别问题,提出在语音模型和语言模型中分别引入声调和字转移概率,以提高近音字和同音字的识别率。首先将声调划分为5种表现形式添加到汉语音节的最后一个音素中构成新音素,使用高斯混合隐马尔科夫模型建模新音素。然后通过统计方法计算特定语境下的字间转移概率。最后使用HTK工具包实现了带声调的语音模型和有字转移概率的语言模型。实验结果证明添加声调可以提高近音字的识别率,使用特定语境下字间转移概率可以提高同音字的识别率。  相似文献   

16.
提出了一种实时高效的手写人群速记符三级识别策略,在以声符和韵符为识别基元的基础上,将基于速记符知识的特征规则法和基于速记符生成模型的模板匹配法有效地结合起来,对速记符的297 年基本音符进行了识别实验结果表明,系统达到了较高的性能指标本方案已在286 和486 等微机上实现,经训练识别率可达97% 以上  相似文献   

17.
在LABVIEW平台上,通过声卡获得语音信号,设计了以美尔频率倒谱系数及其差分作为语音识别的特征参数,通过动态时间规整算法来识别的与文本有关的说话人辨认系统.  相似文献   

18.
This paper focuses on acoustic features that effectively improve the recognition of emotion in human speech. The novel features in this paper are based on spectral-based entropy parameters such as fast Fourier transform (FFT) spectral entropy, delta FFT spectral entropy, Mel-frequency filter bank (MFB) spectral entropy, and Delta MFB spectral entropy. Spectral-based entropy features are simple. They reflect frequency characteristic and changing characteristic in frequency of speech. We implement an emotion rejection module using the probability distribution of recognized-scores and rejected-scores. This reduces the false recognition rate to improve overall performance. Recognized-scores and rejected-scores refer to probabilities of recognized and rejected emotion recognition results, respectively. These scores are first obtained from a pattern recognition procedure. The pattern recognition phase uses the Gaussian mixture model (GMM). We classify the four emotional states as anger, sadness, happiness and neutrality. The proposed method is evaluated using 45 sentences in each emotion for 30 subjects, 15 males and 15 females. Experimental results show that the proposed method is superior to the existing emotion recognition methods based on GMM using energy, Zero Crossing Rate (ZCR), linear prediction coefficient (LPC), and pitch parameters. We demonstrate the effectiveness of the proposed approach. One of the proposed features, combined MFB and delta MFB spectral entropy improves performance approximately 10% compared to the existing feature parameters for speech emotion recognition methods. We demonstrate a 4% performance improvement in the applied emotion rejection with low confidence score. Supported by MIC, Korea under ITRC IITA-2009-(C1090-0902-0046) and the Korea Science and Engineering Foundation (KOSEF) funded by the Korea government (MEST) (Grant No. 20090058909)  相似文献   

19.
针对特定人汉语元音的语音识别,提出一种基于非齐次隐马尔可夫模型的识别方法.该方法首先提取声道频率响应作为特征参数,然后建立非齐次隐马尔可夫模型来更为精确地刻画真实的语音现象,接着进行语音识别实验,并与齐次隐马尔可夫模型进行比较.实验结果表明该方法可以使特定人的元音的识别率达到98.73%,明显改变了识别系统的性能.该方法具有很好的理论研究前景和实际应用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号