期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

南洋柏逢明《长春光学精密机械学院学报》2013,(3):131-133,147

在传统Mel倒谱系数提取过程的基础上,结合离散小波变换,提出了改良动态Mel倒谱系数及基于小波改良的Mel倒谱系数,给出了相应的算法。不同语音长度和信噪比实验表明,该算法使得系统识别率和鲁棒性得到了提高。相似文献

2.

王吉林《安徽工业大学学报》2005,22(3):282-285

利用矢量量化(VQ)技术实现了与文本有关的说话人识别。系统采用语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,对语音库中语音的平均识别率达到了92％,实时识别率达到90％以上。实验结果表明该系统具有识别精度高、速度快等特点,是一种有效的说话人自动识别的实现方法。相似文献

3.

基于改进型DTW算法和MFCC的语音识别

《安徽工程大学学报》2014,(1)

采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对0~9这10个数字语音进行仿真实验.在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一定的鲁棒性.分别采集普通话语音和湖北、闽南、安徽3地方言的语音数据,体现了数据的完备性和系统的适用性.实验结果表明,基于改进型DTW算法和MFCC的语音识别系统具有较高识别率,取得了良好效果. 相似文献

4.

基于共稀疏模型的MAG焊熔透状态的识别

郭鹏孙章龙高继民张烨《南昌大学学报(工科版)》2018,40(4):390

利用焊接过程中产生的电弧声信号,提出了一种基于修正的梅尔频率倒谱系数(Mel frequency cepstrum coefficient,MFCC)共稀疏表示的焊接熔透状态的识别方法。通过对电弧声信号频谱的分析,修正梅尔滤波器组的各个中心频率,提取不同熔透状态下电弧声信号的MFCC特征参数;采用共稀疏表示模型,对提取的电弧声特征参数做判决稀疏表示,实现不同熔透状态的识别。实验表明,该算法具有较高识别率。相似文献

5.

一种改进的LBG算法在声纹识别中的应用 总被引：1，自引：0，他引：1

张煜睿常学义冯涛《上海第二工业大学学报》2007,24(4):317-322

提出一种改进的矢量量化VQ(Vector Quantization)算法,优化了现有的声纹识别技术,并已经得到了应用。对基于LBG(Linde Buzo Gray)算法中现有的倒谱参数MFCC(Mel-Frequency Ceptral Coefficients)在声纹识别中的提取以及声纹模型建立的相关改进,使得矢量量化局部最优的特点在新的声纹模型建立时得到更好的应用。在保证识别率的情况下减少了匹配次数,降低了运行时间。经过测试,语音的平均识别率达到了92%以上,实时识别率达到90%以上。实验结果表明,相对于LBG算法原型,改进的算法的识别精度和速度都有所提高,是一种有效的声纹自动识别的实现方法。相似文献

6.

基于谱熵梅尔积的语音端点检测方法

吴新忠夏令祥张旭周成《北京邮电大学学报》2019,42(2):83-89

为了克服传统语音端点检测算法在低信噪比环境下准确率低的问题,提出一种基于谱熵梅尔积（MFPH）的语音端点检测算法.首先,提取带噪语音信号的梅尔频率倒谱系数中的第一维参数MFCC₀,将其与谱熵的乘积作为最终区分语音段和背景噪声段的融合特征参数;然后,结合模糊C均值聚类算法和贝叶斯信息准则（BIC）算法对MFPH特征参数门限值进行自适应估计;最后,采用双门限法进行语音端点检测.实验结果证明,与传统方法比较,该方法在-5~15 dB低信噪比环境下的语音端点检测准确率有较大提高. 相似文献

7.

基于Mel倒谱特征和RBF网络的孤立词语音识别方法

侯雪梅田磊《西安邮电学院学报》2008,13(3):114-117

Mel谱失真测度是一种弯折频率谱失真测度,用Mel频率尺度可较充分地反映人耳对频率及幅度的非线性感知特性,以及人耳在听到复杂声音时所表现的频率分析和谱合成特性。本文针对孤立词语音识别,对常规LPC倒谱特征提取方法进行改进,即将LPC倒谱按符合人耳听觉特性的Mel尺度进行非线性变化,得到LPC Mel倒谱系数(LPCMCC)作为特征参数。识别网络使用RBF神经网络,进行了孤立词语音识别。实验结果表明此种方法抗噪性能好,识别效果高。相似文献

8.

基于分层增长语音活动检测的鲁棒性说话人识别

解焱陆张劲松刘明辉黄中伟《深圳大学学报(理工版)》2012,29(4):328-334

基于欧洲电信标准化协会颁布的分布式语音识别和前端标准(ETSI-DSR-AFE).针对分布式说话人识别噪声鲁棒性较差的问题,提出一种新的前端处理方法.该方法以似然距离为测度,对语音进行无监督聚类,为减少计算量,采用分层增长(level-building)方法进行逐层分割,从而准确找出语音和静音的边界点.实验结果表明,用该方法改进ETSI-DSR-AFE标准后,信噪比在大于0 dB时,说话人辨认系统识别率相对改进了18.9%,相对原有的Mel频率倒谱系数(Mel-frequenly Ceptral coefficients,MFCC)系统识别率改进了60.7%. 相似文献

9.

四川口音普通话的声学建模

黄苏雨《适用技术之窗》2008,(1):9-12

考虑到对因受地方口音导致的相近、相似、模糊发音的语音的识别困难,本文以易受四川口音（含有特定的声母zh-z/ch-c/sh-s）孤立词语音为识别语音,对其进行声学建模。通过对初始的49维特征参数分三个步骤进行二次特征提取,得到对特定四川口音敏感的特征参数。最后采用矢量量化技术对初始特征参数和通过二次特征提取得到的特征参数进行对比实验。实验表明,经过二次特征提取得到的特征参数有效地改进了易受四川口音（含有特定的声母zh-z/ch-c/sh-s）影响的语音的识别效果,提高了识别率。相似文献

10.

基于DSP的声纹识别技术的研究

李波《辽宁工学院学报》2010,(4):218-221

论述了声纹识别技术的基本原理,采用DSP及其他可编程芯片设计出声纹识别系统的硬件部分,阐述了其结构及工作原理。基于隐马尔可夫模型为算法,以线性预测倒谱系数和Mel频域倒谱系数为特征矢量进行了系统仿真。结果表明,在结合使用两种倒谱系数及差分时,系统具有较高的识别率。相似文献

11.

语音信息查询虚拟仪器的设计

朱立忠华宇宁范长青《沈阳理工大学学报》2009,28(4):6-10

在虚拟仪器开发软件LABVIEW平台上,利用LABVIEW和MATLAB混合编程,通过声卡获得原始语音信号,经过小波消噪处理、预加重处理和端点检测处理得到干净的语音信号,提取语音信号的美尔频率倒谱系数及其一阶、二阶差分系数作为语音识别的特征参数,通过矢量量化（VQ）与隐马尔可夫模型（HMM）实现非特定人连续语音的训练与识别,构建了基于LabVIEW平台的连续语音识别系统．实验表明,系统的识别速度较快,识别率达到90％左右,而且成本比较低廉,具有一定的应用价值．相似文献

12.

基于Labview平台的与文本有关的说话人辨认系统的实现

杨纪刚华宇宁赵雷《沈阳理工大学学报》2005,24(1):36-39,49

在LABVIEW平台上，通过声卡获得语音信号，设计了以美尔频率倒谱系数及其差分作为语音识别的特征参数，通过动态时间规整算法来识别的与文本有关的说话人辨认系统．相似文献

13.

基于声道频谱参数的语种识别

邵玉斌刘晶龙华杜庆治李一民《北京邮电大学学报》2021,44(3):112-119

针对低信噪比下语种识别正确率低的问题,提出了一种声道冲激响应频谱参数和Teager能量算子倒谱参数融合的识别方法.根据语音中不同特征信息量分布特性,首先在特征提取前端引入低通滤波器滤除信号高频部分,并采用重采样方法降低采样率,再基于信号频谱提取声道冲激响应频谱参数,然后融合Teager能量算子倒谱参数,最后通过高斯混合通用背景模型进行语种识别验证.不同信噪比条件下性能测试表明,所提方法相对于基于单一的梅尔频率倒谱系数特征、单一的伽玛通频率倒谱系数特征和基于对数梅尔尺度滤波器组能量特征,在低信噪比下提升约15 dB,显著提高了识别正确率. 相似文献

14.

Algorithm for extraction of features of robot speech control in the factory environment

WANG Xiaohua YAO Pengchao MA Liping WANG Wenjie ZHANG Lei 《西安电子科技大学学报(自然科学版)》1996,47(2):16-22

In the real working environment,the mobile robots have a poor recognition performance to speech control commands due to the noise effect. Aiming at this issue,this paper proposes a new algorithm based on the gammatone frequency cepstral coefficient and the mixed feature extraction of the Teager energy operator. This algorithm replaces the common Mel filter with the Gammatone filter. In the process of extracting gammatone frequency cepstral coefficients,the Teager energy operator reflecting the energy of speech signal is added to form a new feature, with the dynamic characteristics of the speech signal considered. It is combined with the first-order difference parameters to form a mixed feature. And the principal component analysis is made to reduce the dimension,and the final mixed features are used to the speech recognition system for control command of the mobile robot. Experimental results show that,in the environment of the workshop noise and signal-to-noise ratio of 10dB,the recognition rate of mixed features is improved by 12.20% compared with the mel frequency cepstrum coefficient. The recognition rate of the mixed feature is increased by 1.02% when the dimension is reduced by principal component analysis. 相似文献

15.

基于MATLAB GUI的语音信号特征提取系统设计 总被引：1，自引：0，他引：1

王光艳赵晓群王霞《河北工业大学学报》2010,(4)

语音信号的典型时频特性和核心处理算法是语音识别、合成和说话人识别等系统中的关键问题.结合线性预测分析技术(LPC)和美尔倒谱参数(MFCC)的算法原理,基于MATLAB GUI技术,设计完成了语音信号典型特征提取系统的界面平台,可实现语音信号的装载、播放和波形显示,LPC和MFCC的计算结果显示和数据存储等功能.界面的人机交互性好,操作简单方便,可提高对算法或数据处理效果的直观认识,对语音信号分析和处理等各个研究领域具有重要的现实意义. 相似文献

16.

融合AP和GMM的说话人识别方法研究

下载免费PDF全文

王波钟映春陈俊彬《广东工业大学学报》2015,32(4):145-149

针对在说话人识别过程中经典的高斯混合模型(Gaussian Mixture Model,GMM)阶数的确定具有很大随意性的问题,提出采用吸引子传播聚类方法(AP聚类)自动获取GMM的阶数,进而实现说话人识别的方法.首先,采用Mel频率倒谱系数法(MFCC)与差分倒谱相结合的方法,提取语音特征参数;其次,采用吸引子传播聚类方法(AP聚类)对语音特征参数进行聚类处理,从而自动获得GMM的阶数;在此基础上进行GMM模型的训练;最后,采用训练好的GMM模型对Timit标准语音库以及自制网络志愿者语音库进行说话人识别测试实验.实验结果为：使用了AP聚类算法获取GMM阶数的情况下,对Timit标准语音库的测试结果为100%;在自制网络志愿者语音库中,训练样本为168个,其中潮汕话样本10个,湖南话样本10个,测试样本为42个,测试结果为97.6%.实验结果表明,引入AP聚类自动获取GMM的阶数,可以显著提高说话人识别的精度和效率. 相似文献

17.

语音端点检测方法的分析与实现 总被引：1，自引：0，他引：1

马道钧陈天策高婕《北京电子科技学院学报》2007,15(4):66-69

本文在研究短时能量和短时过零率两种语音端点检测基本算法的基础上,编程实现了双门限的端点检测;并进一步根据小波变换的原理,利用小波变换和信号频域统计特性来精确地进行端点检测;最后,在研究了倒谱的相关理论基础上,实现了将语音数据进行倒谱变换,通过计算倒谱距离,在具有一定背景噪声环境下进行端点检测的实验. 相似文献

18.

一种基于EEMD的异常声音识别方法

韦娟顾兴权宁方立《北京邮电大学学报》2020,43(5):112-117

为了优化组合特征在异常声音识别中的效率,提出一种用集合经验模态分解（EEMD）对异常声音帧信号进行有效性检测和提取多层特征的算法.首先对异常声音帧信号进行集合经验模态分解,得到固有模态函数;然后根据给定的固有模态函数层数阈值,对该帧信号进行有效性检测;再对有效帧信号的每一层固有模态函数提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、线性预测倒谱系数、短时能量和能量比,并将它们归一化后拼接成多层特征.根据提取的特征,用深度卷积神经网络实现异常声音识别分类.仿真结果表明,提出的新方法在4类异常声音识别中的识别率可以达到98.65%. 相似文献

19.

基于倒谱集成学习的语音回声隐藏分析算法

戚银城张敬娜贾惠彬《华北电力大学学报(自然科学版)》2011,38(2):103-107

回声信息隐藏是语音信息隐藏的一种常用方法,针对语音回声信息隐藏的分析问题,提出了一种基于倒谱集成学习的隐藏分析方法.分析了回声隐藏及集成学习的原理,构建了基于倒谱AdaBoost集成学习算法的回声隐藏分析系统.对倒谱特征、倒谱一阶差分、二阶差分、梅尔倒谱特征、直方图联合特征、高阶矩特征分别采用支持向量机和AdaBoos... 相似文献