期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

杨雪霁《自动化与仪器仪表》2023,(8):286-290

针对传统英语对话系统受环境噪声影响，出现多人混合语音分离现象，造成多人英语语音识别和对话效果降低的问题，提出一种基于深度学习的语音增强和传统阵列信号处理的多人英语语音分离系统。首先，采用基于长短时记忆网络LSTM的多目标语音增强算法捕捉英语语音序列的长时特性；然后建立一个两阶段的单通道多人语音分离框架提取目标说话人语音；最后将提取语音与阵列算法进行融合，并通过空间信息实现目标说话人英语语音精确估计。结果表明，相较于DNN-DM模型和LSTM-IRM模型，提出的LSTM-DM模型的信噪比指标明显更高，此模型的平均PESQ由2.66提升至2.95,增益为0.074%。由此说明，LSTM-DM模型的英语语音去噪和语音增强效果更好。提出的特定说话人前端系统的英语语音对话词错误率为65.3%,对比于Officoal Beamformlt系统和CGMM3Mask Fusion模型下降了14.6%和5.1%。说明此系统可实现多人混合英语语音分离，具备一定的有效性。相似文献

2.

基于麦克风阵列的嘈杂环境下的鲁棒语音增强算法

《电子制作．电脑维护与应用》2020,(15)

针对四元麦克风阵列结构,提出了一种可在嘈杂环境下有效提升语音识别系统性能的频域自适应噪声抵消语音增强方法。该算法对阵型设计和阵列失配有十分好的鲁棒特性,便于在各种设备及使用场景下使用。仿真结果表明,在无需噪声统计特性等先验信息的情况下,算法能显著改善麦克风阵列的噪声抑制效果,有效的提升智能交互设备的唤醒率和识别率。相似文献

3.

结合ICA预处理的麦克风阵列语音增强系统 总被引：1，自引：0，他引：1

杜军刘琚李万龙《数据采集与处理》2009,24(5)

在强背景噪声和强反射环境中,麦克风阵元接收的信号质量很差,从而影响麦克风阵列语音增强系统的性能.ICA能够仅从现测信号中提取出潜在的独立成分,基于此特性,本文将ICA引入麦克风阵列语音增强系统,利用ICA对麦克风阵元接收信号进行分析,从中提取出较纯净的目标语音作为系统的输入信号.ICA预处理可以有效抑制背景噪声和回声,提高输入信号的质量.真实环境中的实验表明,ICA预处理能够显著改善麦克风阵列语音增强系统的性能. 相似文献

4.

混合语音信号的声源分离

《信息与电脑》2019,(18):35-37

语言通讯是人类最基本的交流通讯手段之一,而作为收集语音的有效工具麦克风,可以录入人类语音信号。笔者研究一种基于麦克风阵列的说话分离技术,利用两个麦克风采集混合声音信号,使之分离出两个声源的语音内容,能够识别语音内容。本设计完成了由两个麦克风收集两段声源的混合声音信号,运用独立成分分析FastICA算法分离两段混合声源信号并可以进行播放,成功识别后以文本形式显示在7英寸的LCD。相似文献

5.

基于多基音跟踪的单声道混合语音分离*

李鹏关勇刘文举徐波《计算机应用研究》2008,25(6):1660-1662

针对许多计算听觉场景分析系统无法很好地解决多说话人混合语音信号分离的问题,提出了一种基于多基音跟踪的单声道混合语音分离系统。该系统充分利用了多基音跟踪研究的最新成果,通过将多基音跟踪得到的目标语音和干扰语音的基音轨迹信息结合到分离系统中,有效地改善了分离系统在包括多说话人混合在内的多种干扰情况下的分离效果,为多说话人语音分离问题的解决提供了新的思路。相似文献

6.

基于麦克风阵列的语音盲信号分离DSP系统的信号传输和处理技术

何培宇刘开文《测控技术》2004,23(Z1):206-207,211

本文构建了基于麦克风阵列的语音盲信号分离DSP实验平台,重点介绍了麦克风阵列的时分多路以及DMA结合McBSP的数据双向传输技术. 相似文献

7.

基于聚类的双说话人混合语音分离

吴春梁正友《计算机与现代化》2014,(4):86

针对许多基于训练模型的计算机听觉场景分析系统,在解决双说话人混合语音信号分离时需要依赖样本训练的有效性以及说话人的先验知识,提出一种基于聚类的单声道混合语音分离系统。系统先利用多基音跟踪算法对语音信号进行分析并产生同时流,然后通过最大化类内散布矩阵与类间散布矩阵的迹,搜索同时流的最佳分类,最终完成对双说话人的语音分离。该系统不需要训练语音模型,并且有效地改善了在双说话人混合语音信号的分离效果,为双说话人的语音分离提供了新的思路。相似文献

8.

基于子带可控响应功率的多声源定位方法

倪志莲蔡卫平张怡典《计算机工程与应用》2013,49(24):205-209

为了提高多个说话人情况下麦克风阵列的定位性能,提出基于子带可控响应功率的多声源定位算法。该算法将语音信号频域分为7个子带,在每个子带计算相位变换加权的可控响应功率函数,在声源空间搜索其最大值得到声源位置的初始估计。根据语音信号频率的稀疏性,这些初始估计包含多个声源的位置,运用会聚聚类算法得到最终的声源位置估计。仿真和实验表明,在有2个说话人,10 dB信噪比,较强混响的条件下,该算法比传统算法的定位正确率提高了约4%,额外率降低了约7%。相似文献

9.

复杂环境下基于自适应深度神经网络的鲁棒语音识别

张开生赵小芬《计算机工程与科学》2022,44(6):1105-1113

在连续语音识别系统中,针对复杂环境（包括说话人及环境噪声的多变性）造成训练数据与测试数据不匹配导致语音识别率低下的问题,提出一种基于自适应深度神经网络的语音识别算法。结合改进正则化自适应准则及特征空间的自适应深度神经网络提高数据匹配度;采用融合说话人身份向量i-vector及噪声感知训练克服说话人及环境噪声变化导致的问题,并改进传统深度神经网络输出层的分类函数,以保证类内紧凑、类间分离的特性。通过在TIMIT英文语音数据集和微软中文语音数据集上叠加多种背景噪声进行测试,实验结果表明,相较于目前流行的GMM-HMM和传统DNN语音声学模型,所提算法的识别词错误率分别下降了5.151%和3.113%,在一定程度上提升了模型的泛化性能和鲁棒性。相似文献

10.

基于听觉感知特性的信号子空间麦克风阵列语音增强算法

程宁刘文举《自动化学报》2009,35(12):1481-1487

针对麦克风阵列信号子空间语音增强算法的不足, 结合人耳的听觉掩蔽效应, 提出了改进的信号子空间算法. 提出了通过置信度判断来确定噪声子空间维度的方法, 在噪声子空间上, 通过条件概率的方法估计出噪声功率谱. 在此基础上, 结合人耳的听觉掩蔽效应给出了线性滤波器的一种合理估计. 实验结果表明所提的方法相对于传统算法, 更有效地抑制了噪声, 在多项语音质量评价指标上都有明显的改进. 相似文献