共查询到19条相似文献,搜索用时 78 毫秒
1.
语音识别系统及其特征参数的提取研究 总被引:2,自引:0,他引:2
在语音识别系统中,特征参数的选择对系统的识别性能有关键性的影响,本文主要研究几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、基于小波分析的参数等,并对这些参数进行了分析和比较,最后对语音识别的研究未来进行了展望. 相似文献
2.
3.
论文针对强噪音环境提出一种PZT振动拾音器作为语音识别的前端输入。在同步采样前提下,比较了其信号与麦克风信号在时、频域上抗噪声性能上的差异。为弥补部分语音信息的丢失,提出了一种混合倒谱系数作为语音识别的特征,并分析了其抗噪声性能。 相似文献
4.
研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率.但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低.为解决上述副作用,提出在说话人识别系统中,使用一种动态时频倒谱系数参数的方法.上述方法在不减少反应话者个体特征分布特性的前提下,可消除冗余信息并降低样本特征的维度.利用上述方法提取语音特征参数并输入混合高斯-通用背景模型进行说话人语音分类.在Matlab上仿真结果表明,动态时频倒谱系数可有效改进话者语音识别系统的识别正确率. 相似文献
5.
6.
用于神经网络说话人识别的PCA-GA研究 总被引:1,自引:1,他引:0
针对用于神经网络说话人识别的海量特征参数带来的识别率和网络训练稳定性的问题,提出了一种用于神经网络的基于语音特征参数的PCA新方法.该方法提取出的新特征参数在神经网络中的识别率和训练速度得到较大提高.结合GA能有效防止网络收敛于局部极小点,缩短训练时间,提高网络稳定性.从而全面提高了基于NN的说话人识别效果. 相似文献
7.
8.
9.
时频比是混合信号在时频域幅值特性的比值,利用时频比寻找混合信号中的单源点,对相应的比值构成的矩阵求逆可以得到对源信号的估计。针对基于时频比的盲源分离将信号变换到时频域后计算量大且对算法有效的时频窗较少的问题,提出用重复结构周期内的时频点代替整个时频域进行单源点的检测,重复结构内的时频点在每个周期内都有相似的值,通过减少一个周期内时频点的检测,由单源点对应的时频比恢复出源信号。用相似系数矩阵评价分离效果,仿真实验结果表明,在达到几乎相同的相似系数的情况下,运行时间可减少45.43%,可有效降低运算量。 相似文献
10.
本文的目的是阐明一种Mel频率倒谱参数特征的改进算法。该算法是通过线性预测的方法从语音信号中提取出残差相位,同时将残差相位与传统的MFCC相结合,并应用到语音识别系统中。该改进算法比传统的MFCC算法具有更好的识别率。 相似文献
11.
12.
针对语音信号线性预测分析经典算法的缺陷,提出了线性预测分析的改进算法,分析其原理、运算步骤及求解方法。研究了算法的FPGA实现,采用Verilog HDL语言对算法完成建模,使用QuartusII进行综合编译,通过Modelsim进行仿真验证。实验结果表明,FPGA实现结构简单,消耗资源少,运算速度较软件实现大幅提高,稳定性与参数精度满足理论要求。 相似文献
13.
14.
15.
16.
针对船载综合信息显示系统在实体船舶内开发不方便的问题,提出了一种半实物仿真系统的设计与实现方法.结合"科学三号"海洋科学考察船的综合信息显示系统的设计和开发过程,从体系结构、信息流程和实现方法3个方面对半实物仿真系统的设计和实现过程进行了探索.实践结果表明,这种半实物仿真系统一方面可以为实际系统的体系结构、信息流程设计提供支持,另一方面可以为实际系统应用软件的开发提供较为真实的环境,有效的缩短开发时间和降低开发风险. 相似文献
17.
短时谱特征的汉语重音检测方法研究 总被引:1,自引:0,他引:1
重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTA-PLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chi-nese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于 MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。 相似文献
18.
针对目前一部分残障人士(如盲人等)面临的上网困难问题,本文通过语音识别和文本-语音转换两个部分的设计及运用,设计一个基于语音识别的盲人上网辅助系统。系统的语音识别部分,采用了线性预测(LPC)及矢量量化的距离(VQ)方法,过滤和识别人的语音信号;文本-语音转换部分,通过对每个动态打开的网页,采用文字转化成语音(text-to-speech,TTS)技术及语音合成平台完成语音合成,将其网页文本内容朗读出来,同时也可对用户进行语音提示。 相似文献
19.
Identification of different specific signal components, produced by one or more sources, is a problem encountered in many signal processing applications. This can be done by applying the local time-frequency-based Rényi entropy for estimation of the instantaneous number of components in a signal. Using the spectrogram, one of the most simple quadratic time-frequency distributions, the paper proves the local applicability of the counting property of the Rényi entropy. The paper also studies the influence of the entropy order and spectrogram parameters on the estimation results. Numerical simulations are provided to quantify the observed behavior of the local entropy in the case of intersecting components. The causes of decrements in the local number of time supports in the time-frequency plane are also studied. Finally, results are provided to illustrate the findings of the study and its potential use as a key step in multicomponent instantaneous frequency estimation. 相似文献