首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
汉语普通话声母的分类与识别   总被引:2,自引:0,他引:2       下载免费PDF全文
本文提出了一种实时高效的汉语声母识别新方法。采用声母二次识别的策略, 即先用五个时域特征参量将声母分类, 然后用语音分布知识及模板匹配法对类内元素进一步进行处理以最后确定识别结果, 这种新方法已应用于基于声、韵识别的汉语声控打字机, 它也适合于不认人识别系统, 本方案已在IBM PC/XT、286等机上实现, 经训练识别率可达95%以上。  相似文献   

2.
基于HMM的汉语语音识别中,易混淆语音的识别率仍然不高.在分析HMM固有缺陷的基础上,本文提出一种使用SVM在HMM系统上进行二次识别来提高易混淆语音识别率的方法.通过引入置信度估计环节,提高系统性能和效率.通过充分利用Viterbi解码获得的信息来构造新的分类特征,从而解决标准SVM难以处理可变长数据的问题.详细探讨这种两级识别结构中置信度估计、分类特征提取和SVM识别器构造等问题.语音识别实验的结果显示,与采用HMM/SVM混合结构的模型相比,本文方法在对识别速度影响很小的情况下可以使识别率有明显提高.这表明所提出的具有置信估计环节的HMM/SVM两级结构用于易混淆语音识别是可行的.  相似文献   

3.
该文针对短语音(语段时长小于等于1s)和易混淆语音的语种识别进行研究。选取东方多语种识别竞赛数据集为实验数据集,对比了音素对数似然比特征、梅尔频率倒谱系数特征、深度瓶颈层特征(DBF)在短语音及易混淆语种识别中的性能,证明DBF在两种识别任务中均具有较好的性能。为提升识别准确率提出DBF-I-VECTOR语种识别改进系统,该系统分别将基线DBF-I-VECTOR系统的短语音识别等错误率最优结果从12.26%降低为10.55%,易混淆语音识别等错误率(EER)最优结果从5.53%降低为2.86%。在对比改进系统后端的余弦距离(CDS)、概率线性判别分析(PLDA)、支持向量机(SVM)、极端梯度提升(XGBoost)、随机森林(RF)分类性能时发现RF在短语音任务中分类效果最好,SVM在易混淆任务中分类效果最好。  相似文献   

4.
语音识别中谱包自相关技术   总被引:1,自引:0,他引:1  
提出了一种语音识别线性预测分析方法:基于谱自相关和频率抽样获得谱包,即由归一化频率估计谱包,此谱包规定在Mel频率级;再由语音信号谱包估计抽样自相关,用IDFT提取抽样自相关估计。从抽样自相关的结果,最终获得谱包倒谱系数。HMM识别试验显示:谱包倒谱系数与其他算法相比较,在低信噪比时,识别率可提高10%以上,识别性能明显提高,在噪声环境下也能达到好的识别效果。  相似文献   

5.
汉语连续语音识别之音素声学模型的改进   总被引:3,自引:1,他引:3  
研究基于主元音音素基元的声学模型的改进。由于汉语语音特点,主元音模型得到了广泛的应用。通过分析主元音音素模型,发现该模型存在词组音节序列字界线有歧义,从而提出主元音的改进方法以明确音节序列中字的分界,减小基元规模,提高语音系统识别率。为了描述连续语意中的协同发音现象,还针对改进后的主元音基元,设计了相应的有调问题集,利用决策树的参数共享策略建立了上下文相关的音素模型。实验结果表明,改进后的有调音素集合在削减了原有基元个数的基础上,字误识率(CER)有0.4%-0.6%的明显改善。  相似文献   

6.
特征提取是虹膜识别的关键技术;由于虹膜图像具有丰富的纹理,提出了基于小波包分解的虹膜识别算法。小波包分解不仅包含了图像的低频部分而且还保留了高频部分,它能够有效地提取虹膜纹理特征,并按hamming距离对虹膜进行匹配。实验结果表明,该算法具有良好的鲁棒性。  相似文献   

7.
该文实现了线性判别分析在汉语连续语音识别系统中的应用。通过将多帧原始特征联合后进行特征选择,特征之间的帧间相关性得到了有效的利用,从而提高了语音的识别率。实验结果表明,系统误识率下降16.90%。  相似文献   

8.
9.
小波包分解在虹膜识别中的应用研究   总被引:3,自引:0,他引:3  
甘俊英  梁宇 《计算机应用》2006,26(5):1006-1008
小波包分解是从小波变换延伸而来的一种更精细的信号分析算法,具有分析高频特征信息的优势。文中结合小波包分解的特点,提出了一种基于小波包分解的虹膜识别算法。该算法首先对虹膜图像实行分窗小波包分解,并对各窗口的子带图像作筛选处理;然后通过奇异值分解对筛选后的各子带图像作进一步的特征提取和压缩,得到虹膜识别特征;最后利用加权欧氏距离分类器进行识别。实验结果表明了该算法的有效性。  相似文献   

10.
该文根据云南境内少数民族同胞说普通话时明显带有民族口音的语言使用现状,介绍了一个以研究非母语说话人汉语连续语音识别为目的的云南少数民族口音汉语普通话语音数据库,并在其基础上开展了发音变异规律、说话人自适应和非母语说话人口音识别研究,是汉语语音识别中用户多样性研究的重要补充。  相似文献   

11.
针对大容量模板库条件下固定音频检索面临检索速度慢的问题,提出一种基于模板子空间的快速固定音频检索方法.利用相同或相似音频数据间存在一定相关性的特点,采用基于模板子空间的方法快速筛选出相似度较高的候选模板集,对候选集内的所有模板进行精细检索以得到最终结果.实验结果表明,与已有方法相比,该方法可以在几乎不损失精度的情况下大幅提高检索速度.  相似文献   

12.
针对在采用LPC-10e和MELP两种不同的语音编码算法标准的通信系统中实现相互通信,提出一种从LPC-10e语音编码到MELP语音编码的参数直接转换方案,实现LPC-10e语音编码的基音周期、清浊音判决参数等转换成MELP语音编码相应参数。仿真结果表明,参数直接转换方案不仅提高了合成语音质量,而且降低了15%左右的编码运算量。  相似文献   

13.
基于阈值的小波域语音增强新算法   总被引:1,自引:0,他引:1  
提出了一种新的基于阈值的小波域语音增强算法,采用Bark尺度小波包对含噪语音进行分解,以模拟人耳的听觉特性.采用结点阈值法,用基于谱熵的方法估计结点噪声,实验表明,该算法在多种噪声,尤其是有色噪声和非平稳噪声条件下均有较好的语音增强效果.  相似文献   

14.
基于级联离散小波变换的信号去噪方法研究   总被引:1,自引:0,他引:1  
提出了基于级联离散小波变换的信号去噪方法。该方法通过对带噪信号作一层离散小波变换(DWT)后提取的低频部分和高频部分分别作一层DWT和四层DWT,然后,对低频部分提取的低频成分和高频成分均作三层DWT,接着,对所有分解的小波系数进行阈值处理,最后,完成信号重构。实验结果表明:在同样的小波分解层次下,本方法去噪效果好于DWT法和WPD法。  相似文献   

15.
语音增强主要用来提高受噪声污染的语音可懂度和语音质量,它的主要应用与在嘈杂环境中提高移动通信质量有关.传统的语音增强方法有谱减法、维纳滤波、小波系数法等.针对复杂噪声环境下传统语音增强算法增强后的语音质量不佳且存在音乐噪声的问题,提出了一种结合小波包变换和自适应维纳滤波的语音增强算法.分析小波包多分辨率在信号频谱划分中...  相似文献   

16.
基于复解析子波变换(CAWT)的汉语语音谱图   总被引:1,自引:0,他引:1  
复解析子波变换(CAWT)紧密地将希尔伯特变换(HT)与子波变换(WT)结合在一起,在信号分析处理方面具有良好的表现。本文将复解析子波复换应用于汉语语的谱分析中,实验结果表明,文中所构造的复子波语音谱图可以清晰地表征汉语语音的动态谱结构,谱图中的语音形态为进一步的语音识别提供了一种新的途径。  相似文献   

17.
提出一种基于小波包分解和马氏距离的IGBT状态识别方法,并应用于地铁车辆辅助逆变电路。首先建立Matlab电路模型,分别对该电路的不同故障临界状态和正常状态进行仿真分析,提取输出电流信号进行小波包分解得到信号特征向量,作为特征样本。利用特征样本计算各临界故障与正常情况下的马氏距离,作为识别阈值。实际应用时,将待测电路与正常状态做马氏距离,对比阈值区间完成电路状态识别。实验表明,此方法能简单有效检测区分软硬故障,实现IGBT状态识别。  相似文献   

18.
基于小波子带分解的特征参数对语音自动切分的改进   总被引:2,自引:0,他引:2  
秦欢  柴佩琪  陈锴 《计算机应用》2005,25(6):1345-1346
采用了基于小波子带分解的特征提取方法,根据DCT和DWT两种去相关方法的不同,得到语音信号的特征参数分别为SubbandBasedCepstral(SBC)和WaveletPacketParameters(WPP)。实验切分结果表明,基于小波子带分解的特征参数比MFCC取得更好的切分效果。  相似文献   

19.
徐攀  苏光伟 《计算机工程与应用》2012,48(28):178-182,213
提出了一种基于小波包分解和小波系数相关性的通用型图像隐写分析方法。对差分处理后的图像进行小波包分解;提取图像及其小波子带的高阶统计量作为特征。利用图像小波系数在尺度方向和空间方向的相关性;使用马尔可夫模型挖掘小波系数层内和层间相关性;提取转移概率矩阵作为特征。针对H4PGP、F5和OutGuess隐写算法的实验表明;方法对上述三种隐写算法具有较好的检测效果。  相似文献   

20.
马娥娥  刘颖  王成儒 《计算机工程》2009,35(18):283-285
针对语音驱动的唇动合成系统进行基于小波包分析的语音特征提取,采用特征差分和口形帧前后关联的多帧语音表征语音的动态特性,利用主成分分析降低输入语音的特征维数。采用基于输入输出隐马尔可夫模型(IOHMM)的音视频映射模型构建语音驱动唇动合成系统,实验表明提取的语音参数比传统Mel倒谱系数鲁棒性更好,合成的口形序列更连贯、自然。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号