语音激活检测方法的分析和比较期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

语音激活检测方法的分析和比较

引用本文：	尹文昊,李晓松,齐彦西,任泓宇.语音激活检测方法的分析和比较[J].信息记录材料,2023(4):240-242+248.

作者姓名：	尹文昊李晓松齐彦西任泓宇

作者单位：	1. 陆军工程大学指挥控制工程学院;2. 陆军工程大学通信工程学院

摘要：	语音激活检测（voice activity detection,VAD）是语音信号处理中的一个重要任务，旨在识别出语音信号中的语音段和非语音段。本文将通过实验分析和比较几种目前主流的VAD算法，包括基于多特征流（multiple feature streams,MFS），基于长短时记忆网络（longshort-termmemory,LSTM)，基于集成深度神经网络（deep nueral network,DNN），基于自适应上下文注意力机制（adaptive context attention model,ACAM）的方法。综合来看，MFS模型简单、易于部署。当检测目标为含噪声时应尽可能采用深度模型，计算资源充足时可以采用DNN模型，反之则可以采用ACAM模型，它在损失了很少的精度下，将参数数目大幅压缩。
关键词：	语音激活检测长短时记忆网络集成深度神经网络注意力机制