基于噪声分类和双自适应阈值判决的语音活动检测方法 |
| |
引用本文: | 姚睿,曾泽清,杜君杰.基于噪声分类和双自适应阈值判决的语音活动检测方法[J].工程科学与技术,2018,50(4):170–178DOI:10.15961/j.jsuese.201700304 |
| |
作者姓名: | 姚睿 曾泽清 杜君杰 |
| |
作者单位: | .南京航空航天大学 自动化学院,江苏 南京 211106 |
| |
基金项目: | 国家自然科学基金资助项目(61402226) |
| |
摘 要: | 为了解决复杂背景噪声环境中语音活动检测(voiceactivitydetection,VAD)命中率较低的问题,提出具有环境意识的VAD算法。针对常用算法中采用单阈值抗噪性差的不足,对语音帧和噪声帧相互转换过程采用不同阈值,并对两个阈值进行自适应更新;为克服单一特征无法应对复杂环境的缺陷,提出将统计模型似然比、能量熵特征和平均谐波数量值特征等进行特征联合的方法;引入环境噪声分类的思想,利用支持向量机对噪声环境进行分类,并根据噪声类型选择最优特征组合,进一步提升算法性能。使用NOIZEUS语音库,以babble、pink、white、f16、volvo这5类噪声作为背景噪声,通过仿真实验评估了所提出算法的性能,比较了各类特征组合的命中率。实验结果证明,所提方法的识别效果优于现有算法,针对各种噪声可取得约80%的总体命中率,且能更好地平衡语音命中率和虚警率。
|
关 键 词: | 语音活动检测 双自适应阈值 噪声分类 特征联合 |
收稿时间: | 2017-04-18 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《工程科学与技术》浏览原始摘要信息 |
|
点击此处可从《工程科学与技术》下载全文 |
|