期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

黄中伟杨磊徐明冯杉杉《深圳大学学报(理工版)》2006,23(4):356-357

分析普通话发音的基本音素,选取8个元音音素和22个辅音音素作为发音构成的基础,列出了由音素构成汉语拼音声母和韵母的方法,从而为形成从音素到拼音的两步式识别法奠定了基础. 相似文献

2.

成德源张小绵《深圳大学学报(理工版)》1996,13(1):24-26

基于帧能量参数和帧与稳态背景噪声状态之间的失真度，将连续的电话频带汉语语音信号分割至用隐马尔可夫链模型表示的以字为单位的语音，采用动态时间规正算法和最小失真度准则，作以字为单位的语音识别，从而实现连续语间识别。实验表明电话频带连续语音识别正确率达７５％。相似文献

3.

普通话智能测试系统的语音识别网络研究

陈彩华《西华大学学报(自然科学版)》2014,33(2):17-21

现行的计算机辅助普通话水平测试系统主要采用隐马尔科夫模型的对数后验概率算法来衡量考生的发音质量,但是HMM模型之间易混淆。为提高系统测试的效度和信度,将普通话发音中的语言学知识引入测试系统,重构算法的识别网络,对算法的概率空间进行优化。实验结果表明,改进后的识别网络能够显著缩短系统的运算时间,有效降低概率空间对评分的影响,提高系统的评测性能。相似文献

4.

一种基于MASM的口形轮廓特征提取方法及听视觉语音识别 总被引：1，自引：0，他引：1

谢磊冯伟赵荣椿《西北工业大学学报》2004,22(5):674-678

提出了一种用于听视觉语音识别的基于MASM的口形轮廓提取方法，这种方法只需要少量的训练数据就可以实现对大量口形轮廓的准确提取。还引入了一种口形轮廓的平滑修正方法，该方法利用口形连续变化的特点，对错误轮廓进行修正。实验证明，利用该方法提取轮廓的准确率比常规ASM模型高出20个百分点；将该口形轮廓特征引入到听视觉语音识别中，可以有效地提高噪音环境下的识别率。相似文献

5.

一个微型汉语语音识别装置的设计

佟伟光畅玉亮《沈阳建筑工程学院学报(自然科学版)》1990,6(3):63-68

在分析汉语语音特点的基础上,对微型汉语语音识别装置的硬件结构,软件识别算法等进行了较详细的讨论和说明。相似文献

6.

基于汉语声母韵母发音模型的语音识别

鲍欣张英芳等《西北工业大学学报》1992,10(2):174-180

每个汉字的发音都是由声母、韵母两部分构成的，声母部分发音时音短，信号变化剧烈；而韵母部分发音时间长、信号相对比较平稳。传统的孤立字识别方案是以线性预测系数作为语音模型系数，用动态时间弯折算法进行模式匹配，但它不完全适用于汉语的单音节识别。本文中利用语音信号相邻帧间LPC距离的变化进行声母、韵母分割，并根据声母、韵母的不同特性分别建立模式，提高了声母部分在整个音节模式中的比重，同时大幅度降低了模式的数据量，实验结果表明，汉语单音节的识别速度较传统的PLC/DTW算法提高一倍以上，识别正确率达到95%。相似文献

7.

基于小波分析的汉语语音识别 总被引：4，自引：0，他引：4

许开宇张曙《哈尔滨工程大学学报》1996,17(4):20-26

将小波分析这一崭新的理论工具应用于汉语语音识别中，并提出了一些应用于语音处理的方法。相似文献

8.

汉语语音识别研究与实践

黄顺珍《深圳大学学报(理工版)》1987,(Z2)

本文介绍了汉语语音识别及其实例—电话声控查号系统,并在该系统中采用了高效压缩信息的“分块四值化法”提取特征,信息压缩率达100:1;利用分级识别,提高识别率;设置辅助功能键,保证报号完全准确。相似文献

9.

基于神经网络的汉语孤立词语音识别 总被引：3，自引：0，他引：3

孙光民董笑盈《北京工业大学学报》2002,28(3):289-292

研究了基于神经网络的中文孤立词语音识别技术;将时间规整算法与神经网络相结合,组成一个混合级联神经网络语音识别系统. 在这个模型中,第一级是时间规整神经网络. 其作用是完成时间规整功能,从输入不等长的语音信号特征矢量序列中提取固定长度的特征矢量;然后将这组特征矢量馈入后一级BP网络完成语音识别. 利用该方法对小词表汉语孤立词进行语音识别实验,获得了98.25%的正确识别率. 实验结果表明,该系统不仅利用神经网络解决了语音识别中的时间规整难题,而且识别性能明显得到改善,识别率和训练速度均优于采用线性时间规整的神经网络语音识别方法. 相似文献

10.

语音识别技术研究

刘德平李欣生《郑州工业大学学报》1998,19(1):117-120

介绍一种实时语音识别系统,对语音识别系统的硬件组成及软件技术进行了分析,所开发的系统具有较高的识别精度,有较为广阔的应用前景。相似文献

11.

基于语音识别的朝鲜语语音检索方法

徐博文金小峰《延边大学学报(自然科学版)》2021,(3):273-278

针对基于语音识别的语音检索方法对语言模型的强依赖问题,通过改进声学模型学习框架提出了一种新的朝鲜语语音检索方法.该方法首先修改KoSpeech框架的网络模型,通过训练得到了朝鲜语的声学模型; 其次通过语音文档分割方法构建了语音文档索引库; 最后利用编辑距离匹配的方法实现了语音检索.实验结果表明,改进的朝鲜语声学模型学习框架降低了语音检索方法对语言模型的依赖和大规模数据集的要求.当k取9时, top -k评价方法的检索均值平均精度达到86.74%, 召回率达到95.25%, 该结果表明本文提出的方法是有效的,具有一定的实际应用价值. 相似文献

12.

Novel acoustic features for speech emotion recognition

ROH Yong-Wan KIM Dong-Ju LEE Woo-Seok HONG Kwang-Seok 《中国科学E辑(英文版)》2009,52(7):1838-1848

This paper focuses on acoustic features that effectively improve the recognition of emotion in human speech. The novel features in this paper are based on spectral-based entropy parameters such as fast Fourier transform (FFT) spectral entropy, delta FFT spectral entropy, Mel-frequency filter bank (MFB) spectral entropy, and Delta MFB spectral entropy. Spectral-based entropy features are simple. They reflect frequency characteristic and changing characteristic in frequency of speech. We implement an emotion rejection module using the probability distribution of recognized-scores and rejected-scores. This reduces the false recognition rate to improve overall performance. Recognized-scores and rejected-scores refer to probabilities of recognized and rejected emotion recognition results, respectively. These scores are first obtained from a pattern recognition procedure. The pattern recognition phase uses the Gaussian mixture model (GMM). We classify the four emotional states as anger, sadness, happiness and neutrality. The proposed method is evaluated using 45 sentences in each emotion for 30 subjects, 15 males and 15 females. Experimental results show that the proposed method is superior to the existing emotion recognition methods based on GMM using energy, Zero Crossing Rate (ZCR), linear prediction coefficient (LPC), and pitch parameters. We demonstrate the effectiveness of the proposed approach. One of the proposed features, combined MFB and delta MFB spectral entropy improves performance approximately 10% compared to the existing feature parameters for speech emotion recognition methods. We demonstrate a 4% performance improvement in the applied emotion rejection with low confidence score. Supported by MIC, Korea under ITRC IITA-2009-(C1090-0902-0046) and the Korea Science and Engineering Foundation (KOSEF) funded by the Korea government (MEST) (Grant No. 20090058909) 相似文献

13.

语音识别中的加性噪声补偿研究

田斌田红心等《西安电子科技大学学报(自然科学版)》2001,28(3):292-296

针对语音识别中的加性噪声进行研究，提出了动态自适应多模板谱减法和多模板谱加训练补偿法。动态自适应多模板谱减法和噪声动态自适应方法的有效结合，使谱减法既能适应环境中存在多种噪声的情况，又能有效利用当前得到的噪声环境信息。而多模板谱补偿法从谱减法的逆向角度，并基于多模式训练的思想，有效地使模板适应多种噪声情况，该方法不增加识别时的运算量，有利于考虑噪声的各种复杂情况。相似文献

14.

混合抗噪语音识别模型的设计与仿真

张丽王福忠张涛《焦作工学院学报》2007,26(6):694-699

为解决语音识别过程中的抗噪声及抗干扰问题,提高系统的识别精度,利用隐马尔可夫模型HMM优异的时序建模能力及小波变换可以对信号进行多尺度分析并有效提取信号的局部信息的特点,建立了混合语音识别模型.考虑到在语音信号识别过程中信号的非平稳性,采用并行的识别方法分别获取分类信息,根据混合模型的识别算法做出识别决策,减小了系统对环境的依赖性,提高了其自适应能力.仿真实验结果表明,混合模型识别结果比单一HMM模型或小波模型识别结果更佳,提高了整体的识别速度和识别率. 相似文献

15.

基于仿生模式识别的非特定人连续语音识别的研究

叶虹《浙江工业大学学报》2006,34(4):433-435

仿生模式识别基本原理应用到非特定人连续语音识别中，在构建语音模型时，将高维空间点覆盖的理论应用到非特定人的连续语音识别的学习过程中，在识别时，采用高维空间覆盖动态搜索的方法，对连续语音进行动态搜索，这样就可以避免因分割错误而带来的错误识别．通过实验得到了较为满意的识别结果。相似文献

16.

普通话语音情感识别的特征选择技术 总被引：3，自引：0，他引：3

谢波陈岭陈根才陈纯《浙江大学学报(工学版)》2007,41(11):1816-1822

谢波，陈岭，陈根才，陈纯针对情感声学特征在语音情感识别中的重要性问题，运用优先选择、序列前向、序列后向和逐步判别分析进行了特征选择.对说话人和文本均无关、说话人相关2组普通话情感语音进行特征选择，然后利用线性判别分析和支持向量机进行实际识别效果的分析比较.特征选择结果表明，基频、对数能量、语速和第一共振峰均值对普通话情感语音具有较强的判别能力，但情感声学特征的判别力随着说话人的不同而有所差异.特征选择方法比较实验表明，逐步判别分析比其他3种方法具有更高的平均准确率，当特征个数为9~12时分类器的平均准确率最高.效用分析表明，特征选择在小样本时更加有效. 相似文献

17.

端点自由DP应用于语音识别中的时间轴校正

李宛州吕维雪《浙江大学学报(工学版)》1990,24(6):927-932

本文介绍了一种新的时间轴校正方法,克服了传统端点固定DP在语音起止区间存在的固有误差,有效的提高了语音识别率。相似文献

18.

Improved hidden Markov model for speech recognition and POS tagging

袁里驰《中南工业大学学报(英文版)》2012,19(2):511-516

In order to overcome defects of the classical hidden Markov model (HMM), Markov family model (MFM), a new statistical model was proposed. Markov family model was applied to speech recognition and natural language processing. The speaker independently continuous speech recognition experiments and the part-of-speech tagging experiments show that Markov family model has higher performance than hidden Markov model. The precision is enhanced from 94.642% to 96.214% in the part-of-speech tagging experiments, and the work rate is reduced by 11.9% in the speech recognition experiments with respect to HMM baseline system. 相似文献