期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

林劼 Ji Ming 刘玓《计算机工程与应用》2006,42(11):41-44,79

众所周知,抗噪问题是现在语音识别研究中的重点。文章描述了一种新的抗噪语音识别方法,即通过改进型重复Wiener滤波结合后验概率联合模型PUM(PosteriorUnionModel)[3]实现在噪声环境下连续字语音识别的方法。这种方法先采用改进型重复Wiener滤波器对语音信号进行语音增强预处理,消除已知噪声,为PUM模型提供只有局部频带被噪声污染的语音信号,再利用PUM模型进行抗噪语音识别。试验表明在各种不同的噪声环境下新方法有更高的平均识别率。相似文献

2.

基于GFCC与RLS的说话人识别抗噪系统研究

茅正冲王正创黄芳《计算机工程与应用》2015,51(10):215-218

为了提高说话人识别抗噪系统的性能,提出了将RLS自适应滤波器作为语音信号去噪的预处理器,进一步提高语音信号的信噪比,再通过Gammatone滤波器组,对去噪后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC,进而将特征参数GFCC用于说话人识别系统中。仿真实验在高斯混合模型识别系统中进行。实验结果表明,采用这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显的提高。相似文献

3.

基于小波倒谱系数和概率神经网络的取证说话人识别模型

雷磊佘堃《计算机应用研究》2018,35(4)

取证说话人识别是一种利用犯罪现场留下的质疑语音来识别犯罪分子身份的技术。为了提高识别模型的抗噪能力,本论文提出了基于小波倒谱系数（WCC）和概率神经网络（PNN）的取证说话人识别模型。该模型包含WCC特征提取和PNN分类两个步骤。WCC对噪音不敏感,所以使得我们的模型有抗噪能力。PNN是一种高效的分类算法,从而提高了模型识别性能。实验表明,该模型以提高时间消耗为代价提高了识别率和抗噪能力。相似文献

4.

基于深度神经网络的语音识别系统研究

李伟林文剑马文凯《计算机科学》2016,43(Z11):45-49

语音识别是人机交互模式识别领域的一个重要课题,构建了一种基于深度神经网络的语音识别系统,使用了抗噪对比散度法和抗噪最小平方误差法对模型进行无监督训练;使用了均值归一化进行模型优化, 提高了网络对训练集的拟合度,并且降低了语音识别的错误率;使用多状态激活函数进行了模型优化,这不仅使得不带噪测试和带噪声测试的语音识别错误率进一步下降,并能在一定程度上减轻过拟合现象;并通过奇异值分解和重构的方法对模型进行了降维。实验结果表明,此系统可以在不影响语音识别错误率的基础上极大地降低系统的复杂性。相似文献

5.

基于卷积神经网络的面罩语音识别

王霞杜桂明王光艳张艳《传感器与微系统》2017,36(10)

针对带噪面罩语音识别率低的问题,结合语音增强算法,对面罩语音进行噪声抑制处理,提高信噪比,在语音增强中提出了一种改进的维纳滤波法,通过谱熵法检测有话帧和无话帧来更新噪声功率谱,同时引入参数控制增益函数;提取面罩语音信号的Mel频率倒谱系数(MFCC)作为特征参数;通过卷积神经网络(CNN)进行训练和识别,并在每个池化层后经局部响应归一化(LRN)进行优化.实验结果表明:该识别系统能够在很大程度上提高带噪面罩语音的识别率. 相似文献

6.

基于去噪技术的DSP语音识别系统设计

韦高梧冯祖勇《传感器与微系统》2017,36(1)

针对语音识别系统对抗环境噪声的实际需求,提出一种二次组合抗噪技术,研究并设计了一种以数字信号处理器(DSP)为硬件平台,以隐马尔可夫模型(HMM)为算法的抗噪声嵌入式语音识别系统.DSP采用型号为TMS320VC5509A的芯片,配以外围硬件电路构成语音识别系统的硬件平台.软件设计以离散隐马尔可夫模型(DHMM)为识别算法进行编程,系统软件主要有识别、训练、学习和USB四个主要模块.实验结果表明:基于二次组合去噪技术的语音识别系统有更好的抗噪声效果. 相似文献

7.

混合语音识别模型的设计与仿真研究

宋志章马丽刘省非李奇楠《计算机仿真》2012,29(5):152-155

研究语音识别率问题,语音信号是一种非平稳信号,含有大量噪声信息,目前大多数识别算法线性理论,难以正确识别语音信号非线性变化过程,识别正确率低。通过将隐马尔可夫模型(HMM)和SVM相结合组成一个混合抗噪语音识别模型(HMM-SVM)。同时用HMM模型对语音信号时序进行建模,并得到待识别语音信号的输出概率,然后将输出概率作为SVM的输入进行学习,得到语音分类信息,最后通过利用HMM-SVM识别结果做出正确识别决策。仿真结果表明,HMM-SVM提高语音识别正确率,尤其在低信噪比环境下,明显改善了语音识别系统的性能。相似文献

8.

语音识别系统的抗噪前端处理及性能分析

王文为蒋保臣《计算机应用》2007,27(B06):138-139

对语音识别系统中信号的抗噪前端处理方法进行了研究。将线性预测（LP）分析与形态滤波结合作为语音识别的前端处理方法，并选用具有抗噪性的MFCC特征参数。将上述方法应用于基于隐马尔可夫模型（HMM）的孤立词识别系统中，结合使用NOISEX-92提供的四种噪声进行测试，结果证明系统的抗噪性得到了提高。相似文献

9.

语音情感智能识别的建模与仿真

黄晓峰彭远芳《计算机工程与应用》2012,48(29):142-146,238

语音情感信息具有非线性、信息冗余、高维等复杂特点,数据含有大量噪声,传统识别模型难以消除冗余和噪声信息,导致语音情感识别正确率十分低.为了提高语音情感识别正确率,利用小波分析去噪和神经网络的非线性处理能力,提出一种基于过程神经元网络的语音情感智能识别模型.采用小波分析对语音情感信号进行去噪处理,利用主成分分析消除语音情感特征中的冗余信息,采用过程神经元网络对语音情感进行分类识别.仿真结果表明,基于过程神经元网络的识别模型的识别率比K近邻提高了13％,比支持向量机提高了8.75％,该模型是一种有效的语音情感智能识别工具. 相似文献

10.

基于EMD与RLS的说话人识别抗噪算法

《计算机应用与软件》2016,(5)

语音信号是一种典型的非平稳信号。为了分析语音的非平稳特性,提出一种基于经验模态分解(EMD)与递推最小二乘算法(RLS)自适应滤波器相结合的语音信号去噪预处理器,进一步提高语音信号的信噪比和可懂度。再通过Gammatone滤波器组,对去噪后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC。仿真实验在高斯混合模型识别系统中进行。实验结果表明,采用这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显提高。相似文献

11.

Joint variable frame rate and length analysis for speech recognition under adverse conditions

《Computers & Electrical Engineering》2014,40(7):2139-2149

This paper presents a method that combines variable frame length and rate analysis for speech recognition in noisy environments, together with an investigation of the effect of different frame lengths on speech recognition performance. The method adopts frame selection using an a posteriori signal-to-noise (SNR) ratio weighted energy distance and increases the length of the selected frames, according to the number of non-selected preceding frames. It assigns a higher frame rate and a normal frame length to a rapidly changing and high SNR region of a speech signal, and a lower frame rate and an increased frame length to a steady or low SNR region. The speech recognition results show that the proposed variable frame rate and length method outperforms fixed frame rate and length analysis, as well as standalone variable frame rate analysis in terms of noise-robustness. 相似文献

12.

Towards robustness to speech rate in mandarin all-syllable recognition

下载免费PDF全文

陈一宁朱璇刘加刘润生《计算机科学技术学报》2003,18(6):0-0

In mandarin all-syllable recognition,many insert errors occur due to the influence of non-consonant syllables.Introducing the duration model into the recognition process is a direct way to lessen these errors.But that usually could not work well as expected,for the duration is sensitive to speech rate.Hence,aiming at this problem,a novel context dependent duration distribution normalized by speech rate is proposed in this paper and applied to a speech recognition system based on the frame of improved Hidden Markov Model (HMM).To realize this algorithm,the authors employ a new method to estimate the speech rate of a sentence; then compute the duration probability combined with speech rate;and finally implement this duration information in the post-processing stage.With little change in the recognition process and resource demand,the duration model is adopted efficiently in the system.The experimental results indicate that the syllable error rates decrease significantly in two different speech corpora.Especially for the insertions,the error rates reduce about sixty to eighty percent. 相似文献

13.

基于短时能量—LPCC的语音特征提取方法研究

王钟斐王彪《计算机与数字工程》2012,40(11):79-80,127

为了提高语音信号的识别率,提出了一种基于短时能量—LPCC的语音特征提取方法。该方法在LPCC参数的基础上,增加每帧信号的短时能量信息,使得新参数能够更为准确的表征语音信号。通过仿真实验,说明了新特征参数取得了较高的识别率。相似文献

14.

一种改进的隐马尔可夫模型在语音识别中的应用 总被引：1，自引：0，他引：1

胡磊卢珞先黄涛《信息与控制》2007,36(6):0-780

提出了一种新的马尔可夫模型——异步隐马尔可夫模型．该模型针对噪音环境下语音识别过程中出现丢失帧的情况，通过增加新的隐藏时间标示变量Ck，估计出实际观察值对应的状态序列，实现对不规则或者不完整采样数据的建模．详细介绍了适合异步HMM的前后向算法以及用于训练的EM算法，并且对转移矩阵的计算进行了优化．最后通过实验仿真，分别使用经典HMM和异步HMM对相同的随机抽取帧的语音数据进行识别,识别结果显示在抽取帧相同情况下异步HMM比经典HMM的识别错误率低．相似文献

15.

基于量子模距离的说话人识别方法 总被引：1，自引：0，他引：1

罗辉潘平王洋《计算机工程与科学》2014,36(1):39-43

概率测度和距离测度是模式识别最基本的两种测度,矢量量化算法是典型的基于距离测度的模式识别算法。根据量子模距离测度理论,在矢量量化算法的基础上,探索一种基于量子模距离的说话人识别方法。该方法针对说话人语音的时变性、随机性、特征维数较高等特点,将一帧语音信号视为一个量子态,并根据量子测量理论,对量子态之间进行模距离测量,从而对量子态进行有效的分类和聚类。研究表明该方法能有效地降低语音信号处理的复杂度。在经典计算机上的仿真表明,该方法在运行时间上略优于矢量量化算法,在识别率上明显优于矢量量化算法,为说话人识别的理论研究提供了新的途径。相似文献

16.

基于FPGA的关键词识别系统实现

下载免费PDF全文

阙大顺田犇赵永安《计算机工程与应用》2013,49(8):217-221

随着微电子技术的高速发展,基于片上系统SOC的关键词识别系统的研究已成为当前语音处理领域的研究热点和难点。运用Xilinx公司ViterxII Pro开发板作为硬件平台,结合ISE10.1集成开发环境,完成了语音帧输出、MFCC、VQ和HMM等子模块的设计;提出了一种语音帧压缩模块架构,有效实现了语音帧信息到VQ标号序列的压缩,实现了由语音帧压缩模块和HMM模块构建的FPGA关键词识别系统。仿真实验结果表明,该系统具有较高的识别率和实时性,为关键词识别系统的FPGA硬件电路的实现研究提供了实例。相似文献

17.

基于BIC的语音识别模型压缩算法

邹灿李柏岩《计算机与现代化》2014,(6):71-73,78

当对HMM(Hidden Markov Model,隐马尔科夫模型)语音模型进行GMM(Gaussian Mixture Model,混合高斯模型)区分训练增加组件时,语音模型的识别率会随着GMM的组件增多而增加,模型的大小也会增加,这就造成了语音模型的臃肿。而在移动端使用本地语音模型进行识别时,存放一个几百兆的模型很不合适。针对上述问题,本文提出将一个GMM组件数较多的语音模型利用BIC准则压缩到指定的组件数,从而在模型大小合适的情况下尽量保证模型的识别率。实验结果表明,使用本方法进行压缩之后的语音识别率比未压缩的相同组件数的语音识别模型的识别率要高。相似文献

18.

基于片上系统的孤立词语音识别算法设计 总被引：1，自引：0，他引：1

下载免费PDF全文

刘金伟 HUANG Zhangqin 侯义斌《计算机工程》2007,33(13):25-27,55

介绍了孤立词语音识别系统，针对片上系统进行了语音识别算法的选择。对基于语音帧的端点检测算法、线性预测编码倒谱系数LPCC算法和动态时间规整DTW算法进行了分析和设计。对于新型语音识别SoC芯片的开发研制和推动片上可编程系统(SoPC)的研究与发展具有一定的理论和实践意义。相似文献

19.

基于小波包的语音谱熵端点检测方法研究

王钟斐王彪李建文《计算机与数字工程》2011,39(4):1-4

端点检测是语音识别过程中的一个重要的环节,因此改善端点检测的效果一直是语音识别领域的一个重要课题。为了提高在背景噪声下语音信号端点检测的准确率,提出了一种基于小波包的谱熵端点检测方法。该方法对语音信号进行小波包变换,将每帧信号分解成多个子带,在此基础上计算每帧信号的子带能量,通过子带能量所占比例求出每帧信号的谱熵,最后确定新的门限值。仿真实验表明,该方法比传统方法更有效、更优越,能够比较准确地检测语音信号。相似文献

20.

连续语音识别中利用帧间相关性的研究

欧智坚王作英《计算机工程与应用》2001,37(15):25-27,79

尽管作为当前最为流行的语音识别模型,隐马尔可夫模型（HMM）由于采用了状态输出独立同分布假设,因此不能描述语音现象中固有的时间相关性。文章介绍了一个更为灵活的基于段长分布HMM（DDBHMM）的研究帧相关性的框架,并在此基础上提出了一个混合模型,采用一种将语音特征静态信息和动态变化信息分别描述又有机结合在一起的方式,以较小的计算代价更为合理地刻划了真实的语音现象。汉语大词汇量非特定人连续语音识别的实验表明,通过利用帧相关性识别系统的性能得到了明显改善。相似文献