首页 | 本学科首页   官方微博 | 高级检索  
     

语音激活检测方法的分析和比较
引用本文:尹文昊,李晓松,齐彦西,任泓宇.语音激活检测方法的分析和比较[J].信息记录材料,2023(4):240-242+248.
作者姓名:尹文昊  李晓松  齐彦西  任泓宇
作者单位:1. 陆军工程大学指挥控制工程学院;2. 陆军工程大学通信工程学院
摘    要:语音激活检测(voice activity detection,VAD)是语音信号处理中的一个重要任务,旨在识别出语音信号中的语音段和非语音段。本文将通过实验分析和比较几种目前主流的VAD算法,包括基于多特征流(multiple feature streams,MFS),基于长短时记忆网络(longshort-termmemory,LSTM),基于集成深度神经网络(deep nueral network,DNN),基于自适应上下文注意力机制(adaptive context attention model,ACAM)的方法。综合来看,MFS模型简单、易于部署。当检测目标为含噪声时应尽可能采用深度模型,计算资源充足时可以采用DNN模型,反之则可以采用ACAM模型,它在损失了很少的精度下,将参数数目大幅压缩。

关 键 词:语音激活检测  长短时记忆网络  集成深度神经网络  注意力机制
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号