基于伽玛通滤波器的双谱特征语音可懂度算法 |
| |
作者姓名: | 陈晓梅 王晓玮 钟波 杨佳燕 商莹莹 |
| |
作者单位: | 华北电力大学 电气与电子工程学院,北京 102206;中国计量科学研究院力学与声学计量科学研究所,北京 100029;中国医学科学院北京协和医院 耳鼻喉科,北京 100730 |
| |
基金项目: | 国家重点研发计划基金项目(2020YFC2005200); |
| |
摘 要: | 针对现有的语音可懂度评价方法不能真实贴近人耳对语音的感知过程,提出一种基于人耳听觉特性的双谱特征预测语音可懂度评价(Gammatone-bspectral speech intelligibility metric, GBSIM)算法。充分利用双谱可以检测语音信号中的非线性相位耦合,抑制非高斯信号中的高斯噪声的特性,采用可以模拟人工耳蜗模型的Gammatone滤波器组,通过滤波处理将输入的语音信号分为32个听觉子频带,用三阶统计量对每个子频带的语音信号进行双谱估计并提取单一特征值来计算语音的可懂度。实例验证结果表明,该方法对信号失真变化敏感,其评价结果与主观评价具有很高的相关度,相对于传统的语音可懂度评价算法具有更好的评价效果。
|
关 键 词: | 语音可懂度 客观评价算法 非线性失真 听觉特性 Gammatone滤波器组 高阶统计量 双谱 |
本文献已被 万方数据 等数据库收录! |
|