共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
基于HMM的汉语语音识别中,易混淆语音的识别率仍然不高.在分析HMM固有缺陷的基础上,本文提出一种使用SVM在HMM系统上进行二次识别来提高易混淆语音识别率的方法.通过引入置信度估计环节,提高系统性能和效率.通过充分利用Viterbi解码获得的信息来构造新的分类特征,从而解决标准SVM难以处理可变长数据的问题.详细探讨这种两级识别结构中置信度估计、分类特征提取和SVM识别器构造等问题.语音识别实验的结果显示,与采用HMM/SVM混合结构的模型相比,本文方法在对识别速度影响很小的情况下可以使识别率有明显提高.这表明所提出的具有置信估计环节的HMM/SVM两级结构用于易混淆语音识别是可行的. 相似文献
3.
该文针对短语音(语段时长小于等于1s)和易混淆语音的语种识别进行研究。选取东方多语种识别竞赛数据集为实验数据集,对比了音素对数似然比特征、梅尔频率倒谱系数特征、深度瓶颈层特征(DBF)在短语音及易混淆语种识别中的性能,证明DBF在两种识别任务中均具有较好的性能。为提升识别准确率提出DBF-I-VECTOR语种识别改进系统,该系统分别将基线DBF-I-VECTOR系统的短语音识别等错误率最优结果从12.26%降低为10.55%,易混淆语音识别等错误率(EER)最优结果从5.53%降低为2.86%。在对比改进系统后端的余弦距离(CDS)、概率线性判别分析(PLDA)、支持向量机(SVM)、极端梯度提升(XGBoost)、随机森林(RF)分类性能时发现RF在短语音任务中分类效果最好,SVM在易混淆任务中分类效果最好。 相似文献
4.
5.
汉语连续语音识别之音素声学模型的改进 总被引:3,自引:1,他引:3
研究基于主元音音素基元的声学模型的改进。由于汉语语音特点,主元音模型得到了广泛的应用。通过分析主元音音素模型,发现该模型存在词组音节序列字界线有歧义,从而提出主元音的改进方法以明确音节序列中字的分界,减小基元规模,提高语音系统识别率。为了描述连续语意中的协同发音现象,还针对改进后的主元音基元,设计了相应的有调问题集,利用决策树的参数共享策略建立了上下文相关的音素模型。实验结果表明,改进后的有调音素集合在削减了原有基元个数的基础上,字误识率(CER)有0.4%-0.6%的明显改善。 相似文献
6.
特征提取是虹膜识别的关键技术;由于虹膜图像具有丰富的纹理,提出了基于小波包分解的虹膜识别算法。小波包分解不仅包含了图像的低频部分而且还保留了高频部分,它能够有效地提取虹膜纹理特征,并按hamming距离对虹膜进行匹配。实验结果表明,该算法具有良好的鲁棒性。 相似文献
7.
该文实现了线性判别分析在汉语连续语音识别系统中的应用。通过将多帧原始特征联合后进行特征选择,特征之间的帧间相关性得到了有效的利用,从而提高了语音的识别率。实验结果表明,系统误识率下降16.90%。 相似文献
8.
9.
小波包分解在虹膜识别中的应用研究 总被引:3,自引:0,他引:3
小波包分解是从小波变换延伸而来的一种更精细的信号分析算法,具有分析高频特征信息的优势。文中结合小波包分解的特点,提出了一种基于小波包分解的虹膜识别算法。该算法首先对虹膜图像实行分窗小波包分解,并对各窗口的子带图像作筛选处理;然后通过奇异值分解对筛选后的各子带图像作进一步的特征提取和压缩,得到虹膜识别特征;最后利用加权欧氏距离分类器进行识别。实验结果表明了该算法的有效性。 相似文献
10.
该文根据云南境内少数民族同胞说普通话时明显带有民族口音的语言使用现状,介绍了一个以研究非母语说话人汉语连续语音识别为目的的云南少数民族口音汉语普通话语音数据库,并在其基础上开展了发音变异规律、说话人自适应和非母语说话人口音识别研究,是汉语语音识别中用户多样性研究的重要补充。 相似文献
11.
12.
针对在采用LPC-10e和MELP两种不同的语音编码算法标准的通信系统中实现相互通信,提出一种从LPC-10e语音编码到MELP语音编码的参数直接转换方案,实现LPC-10e语音编码的基音周期、清浊音判决参数等转换成MELP语音编码相应参数。仿真结果表明,参数直接转换方案不仅提高了合成语音质量,而且降低了15%左右的编码运算量。 相似文献
13.
14.
基于级联离散小波变换的信号去噪方法研究 总被引:1,自引:0,他引:1
提出了基于级联离散小波变换的信号去噪方法。该方法通过对带噪信号作一层离散小波变换(DWT)后提取的低频部分和高频部分分别作一层DWT和四层DWT,然后,对低频部分提取的低频成分和高频成分均作三层DWT,接着,对所有分解的小波系数进行阈值处理,最后,完成信号重构。实验结果表明:在同样的小波分解层次下,本方法去噪效果好于DWT法和WPD法。 相似文献
15.
语音增强主要用来提高受噪声污染的语音可懂度和语音质量,它的主要应用与在嘈杂环境中提高移动通信质量有关.传统的语音增强方法有谱减法、维纳滤波、小波系数法等.针对复杂噪声环境下传统语音增强算法增强后的语音质量不佳且存在音乐噪声的问题,提出了一种结合小波包变换和自适应维纳滤波的语音增强算法.分析小波包多分辨率在信号频谱划分中... 相似文献
16.
17.
提出一种基于小波包分解和马氏距离的IGBT状态识别方法,并应用于地铁车辆辅助逆变电路。首先建立Matlab电路模型,分别对该电路的不同故障临界状态和正常状态进行仿真分析,提取输出电流信号进行小波包分解得到信号特征向量,作为特征样本。利用特征样本计算各临界故障与正常情况下的马氏距离,作为识别阈值。实际应用时,将待测电路与正常状态做马氏距离,对比阈值区间完成电路状态识别。实验表明,此方法能简单有效检测区分软硬故障,实现IGBT状态识别。 相似文献
18.
19.
提出了一种基于小波包分解和小波系数相关性的通用型图像隐写分析方法。对差分处理后的图像进行小波包分解;提取图像及其小波子带的高阶统计量作为特征。利用图像小波系数在尺度方向和空间方向的相关性;使用马尔可夫模型挖掘小波系数层内和层间相关性;提取转移概率矩阵作为特征。针对H4PGP、F5和OutGuess隐写算法的实验表明;方法对上述三种隐写算法具有较好的检测效果。 相似文献