期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《无线电工程》2019,(10):899-904

针对移动语音通信对语音区分性和内容保持操作鲁棒性,以及实时认证的要求,提出了一种基于短时自相关的语音感知哈希认证算法。该算法对语音进行预处理、分帧和加窗,进行短时自相关分析,并结合非负矩阵分解得到特征参数矩阵,利用特征参数矩阵生成感知哈希序列进行语音内容认证。实验结果表明,该算法具有较好的区分性和鲁棒性,能够满足语音通信实时认证的要求。相似文献

2.

人脸语音动画中语音特征参数提取算法研究

林睿樊养余《现代电子技术》2011,34(6):74-77

人脸语音动画是虚拟现实领域的热点,语音特征参数提取是实现语音同步动画的前提和关键所在。为了能够提取鲁棒性更好的语音特征参数,在小波变换的理论基础上,借鉴MFCC特征参数的提取方法,运用表征语音动态特征的特征差分算法,提出了一种基于离散小波变换的语音特征参数（DWTMFCC）提取方法,并与反映语音情感特征的韵律参数相结合。通过基于LGB算法的VQ模型进行说话人语音识别,可以得到组合特征参数的识别率较高。相似文献

3.

基于连续HMM的孤立语音鲁棒性识别方法 总被引：5，自引：1，他引：4

徐文盛戴蓓倩《电路与系统学报》1999,4(4):19-23

对于基于连续稳马尔可夫模的语音识别系统,为了提高系统在环境噪声下的鲁棒性,本文提出了一种能有效抑制加性平稳噪声和通道卷积噪声的相对自相关序列的Ｍｅｌ倒谱参数（ＲＡＳ＿ＭＦＣＣ＋△ＲＡＳ＿ＭＦＣＣ）,进行特征参数级的去噪,明显地改善了系统的噪声鲁棒性。相似文献

4.

基于不变集多小波的语音特征参数提取 总被引：1，自引：0，他引：1

莫家玲胡维平《电声技术》2009,33(7):63-67

在研究不变集多小波理论的基础上,借鉴Mel频率倒谱系数（MFCC）的提取算法,用多小波交换代替傅里叶变换及Mel滤波．构造了一种新的语音特征参数MWBC。汉语数字识别实验结果表明,提出的新语音特征参数MWBC的识别性能和抗噪性能均优于MFCC,为提高语音识别系统的噪声鲁棒性提供了一条新途径。相似文献

5.

一种基于小波变换的清浊音分类基音检测方法

胡瑛陈宁《电声技术》2006,(11):63-66

提出了一种基于小波变换的鲁棒性基音周期检测方法。首先结合平均能量频带分布和短时过零率这两个特征参数对语音信号进行清浊音判决,然后对浊音段采用空域相关函数提取基音周期。实验表明,与传统的小波变换和自相关算法相比,该方法鲁棒性好,对基音检测具有更高的准确性。相似文献

6.

基于小波变换的鲁棒型特征提取及说话人识别 总被引：4，自引：0，他引：4

芮贤义俞一彪《电路与系统学报》2005,10(5):129-132

说话人识别系统在实际应用中面临的主要困难之一是鲁棒性问题,干净语音环境下识别率很高的说话人识别系统,在有噪语音环境下识别性能显著降低。解决这一问题的方法之一是寻找具有鲁棒性的特征参数。本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的鲁棒型特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在加性高斯白噪声环境下进行的识别实验结果表明,本文提出的特征提取算法可以有效地提高说话人识别系统在噪声环境下的识别性能。相似文献

7.

基于小波Mel倒谱系数的抗噪语音识别

张小玫张雪英梁五洲《中国电子科学研究院学报》2008,3(2):187-190

将小波变换的多分辨率特性用于改进Mel频率倒谱系数MFCC的前端处理中,给出了一种新的语音特征参数——小波MFCC。其特点在于采用小波变换、分层FFT和频率合成代替原来MFCC中的FFT部分,使频谱分辨率提高了一倍。试验证明,小波MFCC特征参数在噪声环境和较大词汇量情况下,其抗噪性和识别率均优于MFCC特征参数的结果。相似文献

8.

一种鲁棒性音素分段算法

马建芬李鸿燕张雪英王华奎《电声技术》2006,(6):44-45,48

基于小波变换的鲁棒性因素分段算法的基本思想是在运用传统的参数滤波方法进行音素分段之前首先将语音信号在小波域中进行滤波,提出对听觉感知有效的语音分量,然后用传统的参数滤波方法进行分段。参数滤波是以一个变化的参数对信号进行滤波,得到信号在不同频带中的分量,可以证明,若滤波参数以一定的规律变化,则这些滤波分量的一阶自相关表示了信号的相关结构。利用新方法进行分段并测试其鲁棒性,实验证明新方法分段效果好且鲁棒性强,是一种有效的音素分段算法。相似文献

9.

基于LPC倒谱参数和支持向量机技术的说话人识别系统 总被引：1，自引：0，他引：1

但志平王以治黄艳李保华《电声技术》2004,(3):39-41,44

采用能够反映人对语音的感知特性的线性预测(LPC)倒谱参数为特征参数,同时针对支持向量机技术对模式识别中的非线性、高维数的样本问题有非常好的分类效果和学习推广能力,设计了一个支持向量机分类器来进行说话人识别。试验结果验证了该系统有很高的识别率和较强的鲁棒性。相似文献

10.

基于噪声整形的语音去噪算法

浦小祥董恩清《通信技术》2008,41(12)

针对非平稳环境噪声提出一种基于噪声整形的语音去噪算法.该算法以最小感知均方误差为准则,在Wiener滤波的基础上,采用听觉感知加权函数修正Wiener滤波方程,实现对噪声谱整形,使噪声谱分布特性跟随语音谱而变:同时引入频率补偿因子克服非平稳噪声谱对语音影响的不均匀性;采用快速噪声估计算法实现对非平稳的估计.实验表明,该算法能更有效地抑制背景噪声,提高了去噪后的语音质量. 相似文献

11.

Sparse Representation with Optimized Learned Dictionary for Robust Voice Activity Detection

Datao You Jiqing Han Guibin Zheng Tieran Zheng Jie Li 《Circuits, Systems, and Signal Processing》2014,33(7):2267-2291

Traditionally, most of voice activity detection (VAD) methods are based on speech features such as spectrum, temporal energy, and periodicity. The robustness of these features plays a critical role on the performance of VAD. However, since these features are always directly generated from observed signal, the robustness of these features would be significantly degraded in non-stationary noise environments, especially at low level signal-to-noise ratio (SNR) condition. This paper proposes a kind of robust feature for VAD based on sparse representation with an optimized learned dictionary. To do so, a speech dictionary and a noise dictionary are first learned from speech corpus and noise corpus, respectively. Then an optimization algorithm is designed to reduce the mutual coherence between the two learned dictionaries. After that the proposed feature is generated from the optimized dictionary-based sparse representation, and a VAD method is derived from the proposed feature. The proposed method is evaluated over seven types of noise and four types of SNR level, experimental results show that the optimized dictionary is important for enhancing the robustness of the proposed method, and the proposed method performs well under non-stationary noise, especially at low level SNR condition. 相似文献

12.

基于短时能量的语音端点检测算法研究 总被引：14，自引：1，他引：13

张仁志崔慧娟《电声技术》2005,(7):52-54,59

研究了噪声环境下，利用短时能量为特征进行语音端点检测的问题。在采用短时全带能量为特征的基础上，提出的算法将短时高频能量作为辅助特征，同时使用了最优边沿检测滤波以及双门限-三态转换判决机制，从而保证了算法在噪声环境下的端点检测准确性和对信号绝对幅度变化的稳健性。实验结果表明，与传统的能量闻值法以及G．729中使用的VAD算法相比，提出的算法在噪声环境下具有更好的性能，是一个简单、高效和稳健的语音端点检测算法。相似文献

13.

Improved perceptually non-uniform spectral compression for robust speech recognition

ZHANG Yi HE Chun-jiang LUO Yuan CHEN Kai XING Wu-chao 《中国邮电高校学报(英文版)》2013,20(4):122-126,132

According to the decline of recognition rate of speech recognition system in the noise environments, an improved perceptually non-uniform spectral compression feature extraction algorithm is put forward in this paper. This method can realize an effective compression of the speech signals and make the training and recognition environments more matching, so the recognition rate can be improved in the noise environments. By experimenting on the intelligent wheelchair platform, the result shows that the algorithm can effectively enhance the robustness of speech recognition, and ensure the recognition rate in the noise environments. 相似文献

14.

一种基于线性判别分析的稳健话音检测方法

张志华王炳锡彭煊《电声技术》2005,(5):52-54,69

给出一种新的话音检测方法，即在SNR算法的基础上，应用线性判别分析(LDA)对语音特征参数进行降维。在大噪声环境下，该方法提高了系统的稳健性。同时将这种新的方法与基于信噪比(SNR)和基于噪声／语音统计量(N＆S STAT)的算法做了比较，实验表明该方法可以提高检测效率。相似文献

15.

汉语语音识别的抗噪性前端算法及性能分析

林建臻孙甲松王作英《电声技术》2004,(3):45-48,52

讨论了欧洲电信标准委员会ETSI提出的分布式语音识别系统的抗噪前端特征提取算法,该算法融合多种抗噪技术。结合汉语语音的特点,进行了汉语语音识别整体框架下的算法实现,并进行了实验和分析,典型噪声环境下的识别结果证明,相对于基线MFCC特征提取算法,稳健性有较大提高。相似文献

16.

基于单高斯模型集的汉语美子带特征重建算法 总被引：2，自引：0，他引：2

下载免费PDF全文

罗宇杜利民《电子学报》2004,32(10):1654-1657

本文提出了基于单高斯模型集的汉语美子带特征重建(SGMDI)方法,并通过试验研究了该算法对提高语音识别系统加性噪声鲁棒性的作用.实验结果表明:SGMDI方法能够明显提高语音识别系统对各类音子尤其是容易被加性噪声破坏的清辅音音子的识别正确率,从而显著增强了语音识别系统的噪声鲁棒性. 相似文献

17.

一种基于倒谱均值减的语音端点检测改进方法

王帛冯新喜余侃民朱必浩《电光与控制》2011,18(7):77-80

端点检测是语音识别理论研究中的关键技术之一,为了提高语音端点检测方法的抗噪性和准确性,引入倒谱均值减(Cepstral Mean Subtraction,CMS)设计一种新的语音端点检测方法.在传统倒谱均值减算法的基础上,采用隐马尔可夫模型(Hidden Markov Model,HMM)提取最佳特征子集,利用二次分类... 相似文献

18.

Filtering of Filter‐Bank Energies for Robust Speech Recognition

Ho‐Young Jung 《ETRI Journal》2004,26(3):273-276

We propose a novel feature processing technique which can provide a cepstral liftering effect in the log‐spectral domain. Cepstral liftering aims at the equalization of variance of cepstral coefficients for the distance‐based speech recognizer, and as a result, provides the robustness for additive noise and speaker variability. However, in the popular hidden Markov model based framework, cepstral liftering has no effect in recognition performance. We derive a filtering method in log‐spectral domain corresponding to the cepstral liftering. The proposed method performs a high‐pass filtering based on the decorrelation of filter‐bank energies. We show that in noisy speech recognition, the proposed method reduces the error rate by 52.7% to conventional feature. 相似文献

19.

基于多时间尺度复合子带噪声语音识别新方法

下载免费PDF全文

蒋文建韦岗《电子学报》2001,29(Z1):1829-1832

本文根据多时间尺度分析与子带方法,提出了一种多时间尺度复合子带的噪声环境下语音识别新方法.新方法在不同的时间尺度下分别进行子带特征提取和全带特征提取,并分别进行识别,然后在识别概率层相结合得到最终识别结果.本方法兼有多时间尺度方法和子带方法的抗噪性能.此外,进一步引入频谱差分方法提高语音特征的抗噪性能.对E-SET在NoiseX92下白噪声的识别实验表明,新方法具有良好的抗噪性能. 相似文献