语音识别中基于低秩约束的本征音子说话人自适应方法 |
| |
引用本文: | 张文林, 张连海, 陈琦, 李弼程. 语音识别中基于低秩约束的本征音子说话人自适应方法[J]. 电子与信息学报, 2014, 36(4): 981-987. doi: 10.3724/SP.J.1146.2013.00848 |
| |
作者姓名: | 张文林 张连海 陈琦 李弼程 |
| |
作者单位: | 解放军信息工程大学信息系统工程学院; |
| |
基金项目: | 国家自然科学基金(61175017);国家863计划项目(2012AA011603)资助课题 |
| |
摘 要: | 该文提出一种基于低秩约束的本征音子(Eigenphone)说话人自适应方法。原始的本征音子说话人自适应方法在自适应语料充分时具有很好的效果,然而当自适应语料不足时,出现严重的过拟合现象,导致自适应后的系统可能比自适应前的系统还要差。首先,对协方差矩阵为对角阵的隐马尔可夫-高斯混合模型语音识别系统,推导出一种简化的本征音子矩阵估计算法;然后,对本征音子矩阵引入低秩约束,采用矩阵的核范数作为矩阵秩的凸近似,通过调节核范数的权重因子以有效控制自适应模型的复杂度;最后,给出一种加速近点梯度算法以求解新算法中引入的带有核范数正则项的数学优化问题。汉语连续语音识别的说话人自适应实验表明,引入低秩约束后,本征音子说话人自适应方法的自适应效果得到了明显提高,在5~50 s的自适应数据条件下,均取得了比最大似然线性回归后接最大后验(MLLR+MAP)自适应更佳的识别效果。
|
关 键 词: | 语音识别 说话人自适应 本征音子 低秩约束 近点梯度法 |
收稿时间: | 2013-06-14 |
修稿时间: | 2013-12-26 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《电子与信息学报》浏览原始摘要信息 |
|
点击此处可从《电子与信息学报》下载免费的PDF全文 |
|