期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

齐峰岩鲍长春《信号处理》2005,21(Z1):172-175

本文提出了一种对于不同背景噪音具有鲁棒性的语音激活检测(VAD)算法.首先,该算法基于统计模型理论、线性预测原理以及自适应时变噪声参数估计方法,在时域和频域中共提取了四个特点不同的特征参数作为分类器的输入特征矢量,然后应用支持向量机(SVM)的方法,进行语音激活检测.最后,通过在不同噪音环境下的对比实验结果,验证了本文所提出的算法在中低信噪比情况下的检测性能要优于ITU G.729B中的VAD算法. 相似文献

2.

支持向量机在语音激活检测中的应用研究 总被引：7，自引：0，他引：7

董恩清赵鹤鸣周亚同张晓娣《通信学报》2003,24(3):70-77

提出将支持向量机(SVM)方法应用于语音激活检测(VAD),并验证SVM方法在VAD检测中的有效性。采用了快速训练支持向量机的序列最小最优化方法(SMO)进行训练。提出的基于SVM的VAD方法仍然采用G.729附件B(G.729B)中的VAD方法所采用的特征参数作为分类的特征参数。经过基于SVM的VAD方法与G.729B的VAD方法进行比较,表明SVM方法应用于VAD中是有效的。相似文献

3.

基于概率密度并联距离的话音检测算法

吴其前张雄伟邹霞《电子与信息学报》2008,30(12):2886-2889

该文提出了一种基于概率密度并联距离的话音激活检测算法。算法根据语音信号和噪声信号的Mel域子带能量概率密度的不同特性,引入并联距离定义构造判决函数,通过判断该函数的值来进行语音激活检测。实验结果表明,在不同信噪比情况下,该文算法性能优于G.729B VAD算法。相似文献

4.

联合循环平稳特征PCA与RVM的频谱感知

王鑫王峰孙军杜恺陈景川《电讯技术》2014,54(7)

针对无线信道环境中低信噪比情况下主用户信号检测率较低的问题,提出了一种基于循环平稳特征主成分分析(PCA)与相关向量机(RVM)的认知网络频谱感知算法。该算法结合了主成分分析算法与相关向量机分类方法,应用于解决认知网络频谱感知问题。首先对信号循环平稳特征参数进行特征提取,通过主成分分析进行降维提取信号主成分,生成训练样本和待测样本,并完成对相关向量机的训练,再采用训练完成的相关向量机算法分别对有无主用户情况下的信号进行分类检测,最后获得主用户信号存在性的感知判断。仿真实验表明,与人工神经网络、支持向量机和最大最小特征值算法相比较,所提算法在低信噪比情况下具有较高的分类检测性能,检测率最大可提高61.6%,有效地实现了对主用户信号的感知。相似文献

5.

运用高阶累积量和SVM的调制自动识别 总被引：1，自引：0，他引：1

闫朋展王振宇《电讯技术》2010,50(10)

针对数字信号调制模式识别问题,提出了运用高阶累积量和二叉树支持向量机（SVM）进行自动识别的算法。该算法首先使用信号的四阶、六阶、八阶累积量构造了5个新的分类特征 ,然后利用二叉树支持向量机分类器实现了8种信号的有效分类。仿真结果表明,该算法优于直接多类分类支持向量机算法,在信噪比大于5 dB时,识别率达到90%以上。相似文献

6.

基于语音静音段特征的手机来源识别方法 总被引：1，自引：0，他引：1

裴安山王让定严迪群《电信科学》2017,33(7)

手机来源识别已成为多媒体取证领域重要的热点问题.提出了一种基于语音静音段特征的手机来源识别方法,该方法先通过使用自适应端点检测算法得到语音的静音段;然后将静音段的梅尔频谱系数(MFC)的均值作为分类特征;最后结合WEKA平台的CfsSubsetEval评价函数按照最佳优先(BestFirst)搜索进行特征选择,并采用支持向量机(SVM)对手机来源进行识别.实验部分对23款主流型号的手机进行了分类,结果表明所提特征具有较好的分类性能,在TIMIT数据库和自建的CKC-SD数据库上,平均识别准确率分别为99.23％和99.00％.另外,与语音段MFC特征和梅尔倒谱系数(MFCC)特征进行了对比,实验结果证明所提特征具有更加优越的性能. 相似文献

7.

基于GDTW+SVM的语音识别 总被引：3，自引：0，他引：3

庞雄昌王喆《信息安全与通信保密》2007,(6):83-85

针对经特征提取后语音信号的特征参数的维数不同问题,文章提出了基于GDTW核 SVM算法的语音识别方法。这种方法先对语音信号进行特征提取,并通过GDTW核把特征矢量映射到高维特征空间,然后在高维特征空间中应用支持矢量机的分类方法进行识别。实验证明,与DTW算法和神经网络方法相比,这种方法是可行的,能显著提高语音信号的识别率。相似文献

8.

基于改进的蛙跳算法与支持向量机的实用语音情感识别

张潇丹胡峰赵力《信号处理》2011,27(5):678-689

支持向量机是一种基于统计学习理论的新型机器学习算法,在高维特征空间中寻找最优分类超平面,具有很好的分类精度和泛化性能。支持向量机的训练需要求解一个带约束的二次规划问题,针对数据规模很大情况下经典训练方法变得很困难的缺点,提出一种基于改进混合蛙跳算法的支持向量机分类器参数优化方法,既提高了混合蛙跳算法的收敛速度和精度,又能借助混合蛙跳算法的全局随机搜索能力,为支持向量机参数的优化选择提供一条有效途径。本文提取情感语句的韵律特征、音质特征和混沌特征参数,提出一种基于改进蛙跳算法的数据融合方法,并利用基于改进蛙跳算法的支持向量机进行实用语音情感的识别研究。在实验中比较了PCA方法、BP神经网络和数据融合方法用于语音情感识别的识别率,研究结果表明本文所提的各项改进机制能有效提升情感识别率,为实用语音情感的识别提供一种新方法和新思路。相似文献

9.

采用子带长时信号变化特征的稳健语音活动检测

蔡铁唐飞龙志军《电视技术》2014,38(19)

为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法.将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决.实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性.应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率. 相似文献

10.

网络电话语音质量提高的初探

朱晓东张载鸿《电子元器件应用》2003,5(5):26-30,58

在分析了分组交换网络中影响语音质量的几种因素之后，探讨如何对网络延迟进行分析与统计。并以支持静音消除功能的编码解码器G729AB为例，在分析网络抖动的统计方法的基础上，设计1种传输G729AB语音分组的构造系统和接收端的复现系统，及相应的抖动缓冲自适应算法，以求提高IP电话的语音质量，相似文献

11.

基于局部余弦变换的低比特变速率语音编码算法研究 总被引：1，自引：0，他引：1

董恩清蔡光跃李永利《通信学报》2005,26(5):122-127

提出将局部余弦变换(LCT)算法应用于语音编码中,系统设计了一个平均比特率近1.6kbit/s的低比特变速率语音编码器。在变比特率编码器设计中采用SVM算法进行VAD检测。激活语音帧的语音模式采用GSM半速率编码中的划分方法,但将其中的强浊音模式和中浊音模式合并为一个中强浊音模式。对各类语音模式和无声帧(背景噪声)的局部余弦变换系数采用分维矢量量化算法进行量化,码书设计采用LGB算法。编码中的码书搜索采用树形快速搜索算法。通过主观非正式听力测试表明设计的变比特率编码器编码的重建语音MOS约为3.15,与比特率为2.4kbit/s美国联邦声码器标准MELP的重建语音相当,具有较强的顽健性,适合于对存在各种环境噪声的语音进行编码。相似文献

12.

ITU-T Recommendation G.729 Annex B: a silence compression schemefor use with G.729 optimized for V.70 digital simultaneous voice anddata applications

Benyassine A. Shlomot E. Su H.-Y. Massaloux D. Lamblin C. Petit J.-P. 《Communications Magazine, IEEE》1997,35(9):64-73

相似文献

13.

Unvoiced/voiced classification and voiced harmonic parameters estimation using the third-order statistics

YING Na Communication Engineering College of Hangzhou Dianzi University Hangzhou China ZHAO Xiao-hui DONG Jing Communication Engineering College of Jilin University Changchun China 《中国邮电高校学报(英文版)》2007,14(1):85-89

Unvoiced/voiced classification of speech is a challenging problem especially under conditions of low signal-to-noise ratio or the non-white-stationary noise environment. To solve this problem, an algorithm for speech classification, and a technique for the estimation of pairwise magnitude frequency in voiced speech are proposed. By using third order spectrum of speech signal to remove noise, in this algorithm the least spectrum difference to get refined pitch and the max harmonic number is given. And this algorithm utilizes spectral envelope to estimate signal-to-noise ratio of speech harmonics. Speech classification, voicing probability, and harmonic parameters of the voiced frame can be obtained. Simulation results indicate that the proposed algorithm, under complicated background noise, especially Gaussian noise, can effectively classify speech in high accuracy for voicing probability and the voiced parameters. 相似文献

14.

基于幅度压缩滤波的清浊音分类及基音估计

徐静云赵晓群王峤王缔罡《电子与信息学报》2016,38(3):586-593

该文针对传统算法在实环境(不同噪声类型和信噪比)下容易发生清浊误判和基音估计错误问题,提出一种基于幅度压缩基音估计滤波(PEFAC)的清浊音分类及基音估计方法。首先,通过PEFAC削弱语音的低频噪声,提取出基音谐波;然后,采用基于对称平均幅度和函数的脉冲序列加权算法(SIM)确定谐波数目;最后,利用动态规划估计出基音,用基于3元素特征矢量的高斯混合模型对清浊音进行分类。仿真结果表明,在实环境下,所提方法能有效抑制清浊误判及基音估计错误现象的发生,性能优于传统方法。相似文献

15.

Reduction of musical noise in spectral subtraction method usingsubframe phase randomisation

Jong-Won Seok Keun-Sung Bae 《Electronics letters》1999,35(2):123-125

A subframe phase randomisation method is proposed and applied to the enhanced speech with spectral subtraction method to reduce musical noise in the nonvoicing region. The musical noise in the spectral subtraction method is largely due to narrowband tonal components appearing somewhat periodically in the spectrogram of unvoiced and silence regions. Thus, each synthesis frame in a nonvoicing region is divided into several subframes to broaden the narrowband spectrum, and then phases of silence and unvoiced regions are randomised to disrupt the tonal spectrum structure 相似文献

16.

融合统计模型与EMD的宽带话音增强方法

周璇鲍长春夏丙寅《通信学报》2013,34(8):13-101

提出了一种融合统计模型和经验模态分解(EMD)的宽带话音增强方法。该方法首先用统计模型增强算法消除含噪话音中的主要噪声成分,然后用一种基于活动话音检测(VAD)的EMD增强算法做后处理进一步抑制残留噪声,从而使以上2种方法的优点有效地结合。在ITU-T G.160标准下对算法进行了性能测试,测试结果表明,与经典的统计模型方法相比,在不同强度的背景噪声下,增强话音的信噪比提高都较为明显。同时,在低信噪比情况下,该方法能有效抑制增强话音高频部分的音乐噪声,提高了听觉舒适度。相似文献

17.

A robust voice activity detector for wireless communications usingsoft computing

Beritelli F. Casale S. Cavallaero A. 《Selected Areas in Communications, IEEE Journal on》1998,16(9):1818-1829

Discontinuous transmission based on speech/pause detection represents a valid solution to improve the spectral efficiency of new generation wireless communication systems. In this context, robust voice activity detection (VAD) algorithms are required, as traditional solutions present a high misclassification rate in the presence of the background noise typical of mobile environments. This paper presents a voice detection algorithm which is robust to noisy environments, thanks to a new methodology adopted for the matching process. More specifically, the VAD proposed is based on a pattern recognition approach in which the matching phase is performed by a set of six fuzzy rules, trained by means of a new hybrid learning tool. A series of objective tests performed on a large speech database, varying the signal-to-noise ratio (SNR), the types of background noise, and the input signal level, showed that, as compared with the VAD standardized by ITU-T in Recommendation G.729 annex B, the fuzzy VAD, on average, achieves an improvement in reduction both of the activity factor of about 25% and of the clipping introduced of about 43%. Informal listening tests also confirm an improvement in the perceived speech quality 相似文献

18.

基于LPCC和能量熵的端点检测

朱晓晶侯旭初崔慧娟唐昆《电讯技术》2010,50(6)

为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法.首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率的比较作出有声无声初判决;联合能量熵端点检测结果得到最终判决,最后通过Hangover机制最大限度的保护了语音.实验结果表明,此方法改善了能量熵端点检测法在babble噪声下的劣势,且在不同噪声环境下均优于G.729 Annex B的性能. 相似文献

19.

一种基于小波变换的清浊音分类基音检测方法

胡瑛陈宁《电声技术》2006,(11):63-66

提出了一种基于小波变换的鲁棒性基音周期检测方法。首先结合平均能量频带分布和短时过零率这两个特征参数对语音信号进行清浊音判决,然后对浊音段采用空域相关函数提取基音周期。实验表明,与传统的小波变换和自相关算法相比,该方法鲁棒性好,对基音检测具有更高的准确性。相似文献