期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王蒙军田间王霞李刚《河北工业大学学报》2010,39(3)

为了进一步提高针对汉语语音的唇形特征识别效果,分析实际汉语语音发音过程中声母韵母之间音素的变换规律,以及连读等发音习惯而造成的口形变化,利用唇形特征所对应的音素帧间的相关性,采用二阶隐马尔可夫模型来对唇形特征参数序列进行学习和识别,从而分析汉语唇形识别效果.基于独立汉字发音的实验表明,在针对特定人的识别条件下,在最优的加权因子(m∶n=1.5∶1)特征组合条件下,针对同一组融合得到的特征向量,考虑了音素帧间的相关性后,识别率提高了1.2%.可见汉语音节中音素帧间的相关性与唇形特征的变化规律相对应,有利于提高唇形识别的效果. 相似文献

2.

基于双门限算法的语音端点检测和声韵母分离研究

陆东钰周萍《桂林电子科技大学学报》2011,31(6):480-484

端点检测和声韵母分离是汉语语音信号处理的一个重要预处理步骤.针对单门限算法在检测过程中出现的漏检问题,提出了一种基于双门限算法的汉语语音信号端点检测和单音节声韵母检测方法,通过短时能量与过零率相结合,弥补单门限算法的不足,并对检测方法进行仿真,验证了该方法的准确性和有效性. 相似文献

3.

基于小波变换的静音与语音分割新算法 总被引：6，自引：1，他引：6

梅晓丹孙圣和《哈尔滨工业大学学报》2002,34(3):408-411

含噪语音信号的静音与语音分割，即端点检测问题是语音识别至关重要的一步，为了提高语音分割对环境的适应性，提出了一种利用小波变换分割含噪语音信号中静音与语音的新算法，该算法首先将语音信号进行小波变换，利用小波系数去噪，然后选择小波部分子带跟踪信号的能量变化以分割语音与静音，仿真实验表明该算法在低信噪比条件下也能够有效分割语音。相似文献

4.

基于小波变换的自动声／韵切分的研究

李永光李雪耀《哈尔滨工程大学学报》1998,19(3):75-81

利用小波变换多分辨率分析的特点对汉语语音信号进行分析,成功地提取了一个反映声母和韵母之间过渡段信息的特征参数－过渡帧,利用该参数进行声／韵切分。通过对２８９个音节的实验,结果表明,小波变换能较好地捕促声韵母间的过渡信息。相似文献

5.

连续数码串语音识别系统的MATLAB实现

张培玲王福忠刘群坡《河南理工大学学报(自然科学版)》2009,28(2):211-216

应用连续隐马尔可夫模型(CHMM)为识别算法,采用MFCC(MEL频率倒谱系数)为主要语音特征参数,建立了一个汉语连续数码串语音识别系统,其中包括语音信号的预处理、特征参数的提取、识别模板的训练以及识别匹配算法,文中就系统的各个部分的具体实现进行了阐述.同时,利用MATLAB的语音工具箱voice box对系统进行了仿真,并给出了系统识别结果,指出了系统进一步改进的方法. 相似文献

6.

汉语语音识别预分声和韵的一种有效方法

柴佩琪《西北工业大学学报》1985,(4)

汉语语音识别中,较关键的问题之一是正确地抽取声母(辅音)和韵母(元音、复合元音、鼻韵母)的声学特征。而声和韵两者的声学特征是不同的,所以预分汉语语音的声和韵,以便各段找出其声学特征是很有必要的。本文在采用线性预测(LPC)分析法的前提下,利用已求得的部分相关系数(PARCOR),根据部分相关系数与无损声管模型的关系,选择部分相关系数 K_1,求始端声门处的相邻两节声管的面积比 g_1,根据 g_1的大小来判别声和韵,试验表明此法对区别22个辅音及36个韵母均适用。相似文献

7.

采用谱包络与超音段韵律调整的高自然度语音转换

丁耀娥俞一彪《苏州大学学报(工科版)》2009,29(4)

汉语语音转换技术的目的是在保持语义信息不变的前提下将汉语语音中源说话人的语音特征转换为目标说话人的语音特征.提出的适用于汉语说话人高自然度语音转换算法主要分为三个部分:前两部分用VQ模型实现了语音的谱包络及其激励的转换,第三部分采用BP算法实现语音的韵律转换规则建模.算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音转换并得到高自然度合成语音.实验表明本文提出的转换方法是一种有效的汉语语音转换算法. 相似文献

8.

“汉语拼音发音教学仪”通过技术鉴定

《陕西科技大学学报》1990,(2)

“汉语拼音发音教学仪”是根据汉语拼音方案规定的声母、韵母、拼音、音节,模拟人体发音器官,按照普通话的标准发音规范,将发音时唇、齿、舌、腭、喉、鼻、气流与声音形成的同步动程图象全部反映在一块显示电路板上,为小学汉语拼音教学,高、中等师范学校汉语语音教学、培训师资以及在社会上推广普通话,提供了一种直观、形象且集发音、演示、讲解、训练为一体的教学仪器。这一成果由西北轻工业学院自动控制工程系和陕西省成阳教育学院联合研制。经双方研相似文献

9.

组合FIR滤波器的语音增强算法研究

伍彩云《沈阳理工大学学报》2011,(6):78-81,91

在语音增强系统中,当一个语音信号相对于背景噪声很强时,采用传统的LMS算法存在剩余均方误差随有用信号功率线性增加的问题,因此提出B-WSLMS算法。与传统的语音增强算法不同,B-WSLMS算法将WSLMS算法应用到组合FIR滤波器中,算法的权值根据输出功率变化进行更新,并且权值更新收敛系数与输出功率成反比进行变化,有效弥补了LMS算法的缺点。同时,通过在组合FIR滤波器中选取不同的辅助变量收敛系数,B-WSLMS算法可以使语音增强系统得到更好的信噪比提高量。仿真结果表明,在语音增强系统中,B-WSLMS算法优于LMS算法及WSLMS算法. 相似文献

10.

基于改进DTW的彝语孤立词识别研究

余炜周娅万代立杨喜敬《昆明理工大学学报(自然科学版)》2014,(5):47-53

彝语的语音识别与处理是语音信号处理领域的一个新方向.本文在深入分析彝语特点的基础上,对用于汉语孤立词识别的经典端点检测算法进行了改进.探讨了动态时间规整算法(Dynamic Time Warping,DTW)和高效动态时间规整算法(Efficient DTW,EDTW)在彝语孤立词识别中的应用,并提出了两种新算法:基于音节个数的动态时间规整算法(Syllable Number Based Improved DTW,SDTW)和基于音节个数的高效动态时间规整算法(Syllable Number Based Improved EDTW,SEDTW),对特定的彝语语音信号进行识别.实验结果表明,所提出的两种新算法分别在信号识别率和识别时间上比经典算法优越. 相似文献

11.

A new acoustic model used in Chinese order recognition system for space teleoperating manipulator

贺怀清洪炳熔《哈尔滨工业大学学报(英文版)》1999,(4)

０　ＩＮＴＲＯＤＵＣＴＩＯＮＩｎｏｒｄｅｒｔｏｄｅｖｅｌｏｐａＣｈｉｎｅｓｅｏｒｄｅｒｒｅｃｏｇｎｉｔｉｏｎｓｙｓｔｅｍｔｏｃｏｎｔｒｏｌｓｐａｃｅｔｅｌｅｏｐｅｒａｔｉｎｇｍａｎｉｐｕｌａｔｏｒｓｂｙｓｏｕｎｄ,ｉｔｉｓｖｅｒｙｉｍｐｏｒｔａｎｔ... 相似文献

12.

普通话语音识别中的基本音素分析 总被引：2，自引：1，他引：2

黄中伟杨磊徐明冯杉杉《深圳大学学报(理工版)》2006,23(4):356-357

分析普通话发音的基本音素,选取8个元音音素和22个辅音音素作为发音构成的基础,列出了由音素构成汉语拼音声母和韵母的方法,从而为形成从音素到拼音的两步式识别法奠定了基础. 相似文献

13.

基于能量的汉语语音音节自动划分方法的研究

滕虹刘江《哈尔滨理工大学学报》1999,4(6):1-4

针对智能化计算机中汉语语音识别这一重要研究课题,利用小波分析方法,以神经网络为基础,提出了基于能量的汉语语音音节划分的自动实现的方法,这是实现汉语语音识别的基础和前提。相似文献

14.

基于DTW 和EMD的孤立词语音识别研究

徐必伟苏成利杨微曹江涛《辽宁石油化工大学学报》2018,38(1):74-78

针对语音识别过程中环境噪声干扰大的问题,提出一种基于经验模态分解(EMD)与动态时间规整 (DTW)相结合的孤立词识别算法。该方法利用EMD 算法,首先将提取的性能不好的语音信号分解成若干个基本模函数(IMF),去掉原始信号中的干扰和噪声。然后,基于DTW 算法,采用短时过零率和短时能量对语音信号进行端点检测,提取语音特征参数后与参考模板进行匹配。将参考模板与待测模板之间的最短路径作为识别结果。仿真结果表明,该算法能够提高语音的识别效率和识别的正确率。相似文献

15.

基于HMM的声调语音模型研究

下载免费PDF全文

易雪蓉黄巍胡迪蒋怡《武汉工程大学学报》2018,40(6):691-695

针对声韵母相同但声调不同的近音字识别问题和声韵母及声调都相同的同音字识别问题,提出在语音模型和语言模型中分别引入声调和字转移概率,以提高近音字和同音字的识别率。首先将声调划分为5种表现形式添加到汉语音节的最后一个音素中构成新音素,使用高斯混合隐马尔科夫模型建模新音素。然后通过统计方法计算特定语境下的字间转移概率。最后使用HTK工具包实现了带声调的语音模型和有字转移概率的语言模型。实验结果证明添加声调可以提高近音字的识别率,使用特定语境下字间转移概率可以提高同音字的识别率。相似文献

16.

手写中文速记符的多级识别策略

陈小苹乔谊正戴汝为《山东大学学报(工学版)》1999,(1)

提出了一种实时高效的手写人群速记符三级识别策略,在以声符和韵符为识别基元的基础上,将基于速记符知识的特征规则法和基于速记符生成模型的模板匹配法有效地结合起来,对速记符的２９７年基本音符进行了识别实验结果表明,系统达到了较高的性能指标本方案已在２８６和４８６等微机上实现,经训练识别率可达９７％以上 相似文献

17.

基于Labview平台的与文本有关的说话人辨认系统的实现

杨纪刚华宇宁赵雷《沈阳理工大学学报》2005,24(1):36-39,49

在LABVIEW平台上，通过声卡获得语音信号，设计了以美尔频率倒谱系数及其差分作为语音识别的特征参数，通过动态时间规整算法来识别的与文本有关的说话人辨认系统．相似文献

18.

Novel acoustic features for speech emotion recognition

ROH Yong-Wan KIM Dong-Ju LEE Woo-Seok HONG Kwang-Seok 《中国科学E辑(英文版)》2009,52(7):1838-1848

This paper focuses on acoustic features that effectively improve the recognition of emotion in human speech. The novel features in this paper are based on spectral-based entropy parameters such as fast Fourier transform (FFT) spectral entropy, delta FFT spectral entropy, Mel-frequency filter bank (MFB) spectral entropy, and Delta MFB spectral entropy. Spectral-based entropy features are simple. They reflect frequency characteristic and changing characteristic in frequency of speech. We implement an emotion rejection module using the probability distribution of recognized-scores and rejected-scores. This reduces the false recognition rate to improve overall performance. Recognized-scores and rejected-scores refer to probabilities of recognized and rejected emotion recognition results, respectively. These scores are first obtained from a pattern recognition procedure. The pattern recognition phase uses the Gaussian mixture model (GMM). We classify the four emotional states as anger, sadness, happiness and neutrality. The proposed method is evaluated using 45 sentences in each emotion for 30 subjects, 15 males and 15 females. Experimental results show that the proposed method is superior to the existing emotion recognition methods based on GMM using energy, Zero Crossing Rate (ZCR), linear prediction coefficient (LPC), and pitch parameters. We demonstrate the effectiveness of the proposed approach. One of the proposed features, combined MFB and delta MFB spectral entropy improves performance approximately 10% compared to the existing feature parameters for speech emotion recognition methods. We demonstrate a 4% performance improvement in the applied emotion rejection with low confidence score. Supported by MIC, Korea under ITRC IITA-2009-(C1090-0902-0046) and the Korea Science and Engineering Foundation (KOSEF) funded by the Korea government (MEST) (Grant No. 20090058909) 相似文献

19.

基于非齐次隐马尔可夫模型的特定人元音的识别方法

陈立伟赵春晖白玉孙岩《哈尔滨工程大学学报》2006,27(2):296-300

针对特定人汉语元音的语音识别,提出一种基于非齐次隐马尔可夫模型的识别方法.该方法首先提取声道频率响应作为特征参数,然后建立非齐次隐马尔可夫模型来更为精确地刻画真实的语音现象,接着进行语音识别实验,并与齐次隐马尔可夫模型进行比较.实验结果表明该方法可以使特定人的元音的识别率达到98.73%,明显改变了识别系统的性能.该方法具有很好的理论研究前景和实际应用价值. 相似文献