共查询到20条相似文献,搜索用时 78 毫秒
1.
2.
人耳听觉系统能够从嘈杂的环境中筛选出自己感兴趣的语音,基于计算听觉场景分析的方法,论文采用倒谱法提取语音基音周期轨迹,以连续的基音周期轨迹为线索,按基音频率的整数倍提取各次谐波的频谱,再通过傅里叶逆变换重构分离后的语音。实验表明,在几种典型噪音环境下,该方法能有效将目标语音从背景噪声中分离,信噪比(SNR)和评价意见分(MOS)得到一定的提升,平均增益分别为5.67dB和0.36。 相似文献
3.
4.
为了探究利用两个麦克风进行多声源分离和二维平面定位的可能性,提出了一种基于双麦克风的室内语音分离与声源定位系统。该系统根据麦克风采集的信号,建立了双麦克风时延-衰减模型,然后利用DUET算法估计了模型的时延-衰减参数,并绘制了参数直方图。在语音分离阶段,建立了二进制时频掩膜(BTFM),根据参数直方图,结合二值掩蔽的方法对混合语音进行了分离;在声源定位阶段,通过推导模型衰减参数与信号能量比之间的关系,得到了确定声源位置的数学方程组。利用Roomsimove工具箱模拟室内声学环境,通过Matlab仿真和几何坐标计算,在对多个声源目标分离的同时完成了二维平面中的定位。实验结果表明,该系统对多个声源信号的定位误差均在2%以下,有助于小型系统的研究和开发。 相似文献
5.
人耳听觉系统能够在强噪声的环境下区分出自己感兴趣的语音,基于计算听觉场景分析(CASA)的基本原理,其重点和难点是找到合适的声音分离线索,完成目标语音信号和噪声信号的分离.针对单通道浊语音分离的问题,提出了一种以基音为线索的浊语音信号分离算法.在白噪声、鸡尾酒会噪声等六种噪声干扰条件下,通过仿真实验结果表明,相比于传统的谱减法,语音分离算法的输出信噪比平均提高了7.47 dB,并有效抑制了干扰噪声,改善了分离效果. 相似文献
6.
提出了一种基于人类听觉系统的多频带非线性谱减法来进行语音增强。根据人耳听觉特性,将含噪语音信号分在24个临界频带内,由各频带的不同信噪比来确定对应的谱减参数值。实验结果证明,在相同实验条件下,与功率谱减法(PSS)、非线性谱减法(NSS)和传统多频带谱减法(MBSS)相比,该方法增强后的语音信号具有更高的输出信噪比;能更好地消除背景噪声,抑制残留噪声;增强后的语音具有更好的可懂度和清晰度。 相似文献
7.
基于机器人听觉的声源定位策略 总被引:1,自引:0,他引:1
针对机器人听觉定位,提出了五个传声器组成的阵列作为机器人的耳朵,其中四个传声器组成的平面阵确定声源空间位置,另外一个传声器辅助完成声源位于机器人前后方的判断,并在改进的时延算法上实现声源的空间定位。系统在室内环境下测试,实验结果证明在混响环境下机器人可以实现空间声源定位,该方法具有实时实现的有效性和应用性。 相似文献
8.
9.
针对许多基于训练模型的计算机听觉场景分析系统,在解决双说话人混合语音信号分离时需要依赖样本训练的有效性以及说话人的先验知识,提出一种基于聚类的单声道混合语音分离系统。系统先利用多基音跟踪算法对语音信号进行分析并产生同时流,然后通过最大化类内散布矩阵与类间散布矩阵的迹,搜索同时流的最佳分类,最终完成对双说话人的语音分离。该系统不需要训练语音模型,并且有效地改善了在双说话人混合语音信号的分离效果,为双说话人的语音分离提供了新的思路。 相似文献
10.
将单人语音从双人混合语音中完整地分离出来是一个具有挑战性的问题,当两个语音信号的能量差别较大时,若两个语音的谐波在频率上存在重合部分,直接利用反傅里叶变换法对分离后的语音进行重构,会因频率掩蔽效应对重构语音的音色造成极大的影响,出现窜音现象.论文尝试找到傅里叶变换后的双人语音中对应的单人的基音频率及其谐波,处理后进行傅里叶逆变换重构,得到分离后的单人语音信号.实验表明,该方法所得的语音具有较好的音质,同时能有效地消除窜音现象. 相似文献
11.
12.
基于传声器阵列和互相关算法的时间延迟技术对声源进行定位,互相关算法对宽频带信号(扫频信号)定位比较准确,对窄带信号(风琴信号)定位不显著,分析了影响声源定位精度的因素,并改进声源定位系统.通过实验验证了影响风琴信号声源定位的因素,实现了风琴信号的声源定位,并在NI CompactRIO系统上开发了一个实时声源定位系统. 相似文献
13.
14.
15.
稀疏性对多通道观测的信号源分离具有重要作用,现有的算法只能有效的分离稀疏域已知的信号源.为了解决这个问题,可以将字典学习与信号源分离相结合.定义一个代价函数,采用ELad等人提出的降噪方法使其最小化.由于直接采用降噪方法使代价函数最小化难于实现,可以采用一种分级的字典学习方法,根据每一个信号源建立一个自适应的局部字典.该方法能够在噪声条件下有效的提高信号源分离的效果,仿真结果表明了该方法的有效性. 相似文献
16.
17.
Source separation and up-mixing in real commercial music recordings is a challenging problem. In the last few years, some algorithms have provided interesting results, but the problem remains unsolved. In this paper we describe a method for separating the sources present in a two channel mixture based on the panning coefficients used in the stereo mixdown. The sources are separated by estimating time–frequency masks using the multilevel extension of the Otsu thresholding algorithm used in image segmentation. A refinement step is also carried out for extraction and reassignment of inter-source residuals. Examples of application and performance evaluation are also discussed. 相似文献
18.
蔺鹏 《计算机工程与设计》2008,29(11):2857-2858
提出了一种基于小波域和独立分量分析的盲分离数字水印算法.该算法将水印置乱并乘以相应的系数,将此信息嵌入到经过二级小波变换的原始图像的逼近子图中,提取时利用快速独立分量分析实现了原始图像和水印的盲分离.经过大量实验证明,重构后得到的水印图像具有良好的不可见性,对叠加了水印的图像经过多种干扰及信号处理后,能够有效地检测出水印的存在. 相似文献
19.
针对传感标签密集的多输入多输出型射频识别(MIMO-RFID)系统中标签同时响应导致一系列的碰撞问题,提出了一种并行识别传感标签的欠定盲分离的防碰撞算法(BFast-ICA).在快速独立分量分析(Fast-ICA)算法的基础上,采用更高阶次的迭代方法,实现碰撞传感标签信号的欠定盲分离.在分离性能和吞吐量两个方面进行性能仿真,实验结果表明:改进的防碰撞算法能够更快地分离传感标签信号;在阅读器天线数目相同的情况下,最大吞吐量比当前的盲分离标签防碰撞算法提高了40%以上. 相似文献