首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
语音识别系统及其特征参数的提取研究   总被引:2,自引:0,他引:2  
魏星  周萍 《计算机与现代化》2009,(9):167-168,172
在语音识别系统中,特征参数的选择对系统的识别性能有关键性的影响,本文主要研究几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、基于小波分析的参数等,并对这些参数进行了分析和比较,最后对语音识别的研究未来进行了展望.  相似文献   

2.
基于LPCMCC的音频数据检索方法   总被引:1,自引:0,他引:1       下载免费PDF全文
江基华  李应 《计算机工程》2009,35(11):246-247
LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法的检索精度高于LPCC,检索效率高于美尔倒谱系数(MFCC)。  相似文献   

3.
论文针对强噪音环境提出一种PZT振动拾音器作为语音识别的前端输入。在同步采样前提下,比较了其信号与麦克风信号在时、频域上抗噪声性能上的差异。为弥补部分语音信息的丢失,提出了一种混合倒谱系数作为语音识别的特征,并分析了其抗噪声性能。  相似文献   

4.
研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率.但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低.为解决上述副作用,提出在说话人识别系统中,使用一种动态时频倒谱系数参数的方法.上述方法在不减少反应话者个体特征分布特性的前提下,可消除冗余信息并降低样本特征的维度.利用上述方法提取语音特征参数并输入混合高斯-通用背景模型进行说话人语音分类.在Matlab上仿真结果表明,动态时频倒谱系数可有效改进话者语音识别系统的识别正确率.  相似文献   

5.
融合LPC与MFCC的特征参数   总被引:1,自引:1,他引:1       下载免费PDF全文
张学锋  王芳  夏萍 《计算机工程》2011,37(4):216-217
在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一阶差分、MFCC及其一阶差分和基于小波包分析的特征参数(WPDC)及其一阶差分作为识别参数进行对比实验。结果表明,以LPMFCC作为特征参数的系统具有较高的识别率。  相似文献   

6.
用于神经网络说话人识别的PCA-GA研究   总被引:1,自引:1,他引:0  
针对用于神经网络说话人识别的海量特征参数带来的识别率和网络训练稳定性的问题,提出了一种用于神经网络的基于语音特征参数的PCA新方法.该方法提取出的新特征参数在神经网络中的识别率和训练速度得到较大提高.结合GA能有效防止网络收敛于局部极小点,缩短训练时间,提高网络稳定性.从而全面提高了基于NN的说话人识别效果.  相似文献   

7.
为提高说话人识别的性能,提出将CCA与PCA联合用于说话人特征降维的方法:先用CCA融合基于声道模型的LPC特征和基于听觉模型的MFCC特征,提升这两类不同特征的相关性;然后用PCA进一步去除冗余特征,降低有效特征的维数。实验显示,这两种降维方法联合的降维效果与单一的CCA降维、PCA降维或手动降维的效果比有明显提高。  相似文献   

8.
一种基于MFCC和LPCC的文本相关说话人识别方法   总被引:1,自引:0,他引:1  
于明  袁玉倩  董浩  王哲 《计算机应用》2006,26(4):883-885
在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。通过与动态时间规整算法和传统的矢量量化方法进行比较表明,在系统响应时间并未明显增加的基础上,该模型识别率有一定提高。  相似文献   

9.
时频比是混合信号在时频域幅值特性的比值,利用时频比寻找混合信号中的单源点,对相应的比值构成的矩阵求逆可以得到对源信号的估计。针对基于时频比的盲源分离将信号变换到时频域后计算量大且对算法有效的时频窗较少的问题,提出用重复结构周期内的时频点代替整个时频域进行单源点的检测,重复结构内的时频点在每个周期内都有相似的值,通过减少一个周期内时频点的检测,由单源点对应的时频比恢复出源信号。用相似系数矩阵评价分离效果,仿真实验结果表明,在达到几乎相同的相似系数的情况下,运行时间可减少45.43%,可有效降低运算量。  相似文献   

10.
MFCC特征改进算法在语音识别中的应用   总被引:2,自引:0,他引:2       下载免费PDF全文
本文的目的是阐明一种Mel频率倒谱参数特征的改进算法。该算法是通过线性预测的方法从语音信号中提取出残差相位,同时将残差相位与传统的MFCC相结合,并应用到语音识别系统中。该改进算法比传统的MFCC算法具有更好的识别率。  相似文献   

11.
传感器节点用于采集轮轨作用下钢轨的振动信号以分析钢轨振动特性。为了测试传感器节点的工作性能,设计并实现了能提供稳定振动信号的测试系统。测试系统基于MSP430单片机,由控制单元、激振器、简支梁结构以及监控软件组成。实验表明:在给定加载条件下测试系统可稳定提供10N的激振力,产生峰值为93×10-6的动态应变和97 gn 的振动加速度。通过分析采集数据的时频特性,可以有效发现故障节点。  相似文献   

12.
针对语音信号线性预测分析经典算法的缺陷,提出了线性预测分析的改进算法,分析其原理、运算步骤及求解方法。研究了算法的FPGA实现,采用Verilog HDL语言对算法完成建模,使用QuartusII进行综合编译,通过Modelsim进行仿真验证。实验结果表明,FPGA实现结构简单,消耗资源少,运算速度较软件实现大幅提高,稳定性与参数精度满足理论要求。  相似文献   

13.
语音信号基音检测的二次谱方法   总被引:2,自引:1,他引:1  
对基音检测的倒谱法进行了分析,指出其在基音检测计算及其数字实现时存在不足。为 了克服这些不足,提出了一种功率谱二次处理的二次谱基音检测方法,该方法在克服了倒谱法在基音 检测中不足之处的同时还提高了计算速度,基音轨迹曲线估计的准确性也得到了改善。  相似文献   

14.
基于LabVIEW的多功能虚拟频谱分析仪的设计   总被引:1,自引:0,他引:1  
针对传统频谱分析仪器价格昂贵、维护成本高、操作复杂等问题,根据虚似仪器的设计理论,介绍了一种基于USB2.0总线的多功能虚拟频谱分析仪的设计过程,该设计采用ADI公司的AD9288BST-40芯片实现信号的采集功能,主控卡的FPGA芯片将采集的信号传送至上位机,然后在上位机实现多功能频谱分析仪的功能开发。最后通过功能测试结果验证了设计的可行性和准确性。  相似文献   

15.
根据语音信号的特点,提出了一种基于线性预测分析的合成矩阵作为语音信号的稀疏变换域,并验证了语音信号在该域上的稀疏特性。由语音信号和随机高斯矩阵构造相应的观测,采用正交匹配追踪算法重构原始语音信号。实验表明,语音信号在新的变换域上的重构性能要优于DCT域,且具有较高的分段信噪比和平均意见得分。  相似文献   

16.
针对船载综合信息显示系统在实体船舶内开发不方便的问题,提出了一种半实物仿真系统的设计与实现方法.结合"科学三号"海洋科学考察船的综合信息显示系统的设计和开发过程,从体系结构、信息流程和实现方法3个方面对半实物仿真系统的设计和实现过程进行了探索.实践结果表明,这种半实物仿真系统一方面可以为实际系统的体系结构、信息流程设计提供支持,另一方面可以为实际系统应用软件的开发提供较为真实的环境,有效的缩短开发时间和降低开发风险.  相似文献   

17.
短时谱特征的汉语重音检测方法研究   总被引:1,自引:0,他引:1  
重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTA-PLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chi-nese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于 MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。  相似文献   

18.
针对目前一部分残障人士(如盲人等)面临的上网困难问题,本文通过语音识别和文本-语音转换两个部分的设计及运用,设计一个基于语音识别的盲人上网辅助系统。系统的语音识别部分,采用了线性预测(LPC)及矢量量化的距离(VQ)方法,过滤和识别人的语音信号;文本-语音转换部分,通过对每个动态打开的网页,采用文字转化成语音(text-to-speech,TTS)技术及语音合成平台完成语音合成,将其网页文本内容朗读出来,同时也可对用户进行语音提示。  相似文献   

19.
Identification of different specific signal components, produced by one or more sources, is a problem encountered in many signal processing applications. This can be done by applying the local time-frequency-based Rényi entropy for estimation of the instantaneous number of components in a signal. Using the spectrogram, one of the most simple quadratic time-frequency distributions, the paper proves the local applicability of the counting property of the Rényi entropy. The paper also studies the influence of the entropy order and spectrogram parameters on the estimation results. Numerical simulations are provided to quantify the observed behavior of the local entropy in the case of intersecting components. The causes of decrements in the local number of time supports in the time-frequency plane are also studied. Finally, results are provided to illustrate the findings of the study and its potential use as a key step in multicomponent instantaneous frequency estimation.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号