首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
提出一种基于人类听觉特性的自适应小波滤波算法。该方法用听觉感知小波变换对含噪语音信号进行小波分解,这样可以保证对信号频率和幅值的听觉特性,将经听觉感知小波变换所分离出来的噪声成分作为自适应滤波器的输入。通过采用递推最小二乘算法从而实现信噪分离的最佳滤波,以保证去除信号中的相关噪声。结果表明,该方法能实现非平稳信号在同频段对噪声成分和有用信号的最佳估计,提高了语音的清晰度和可懂度。  相似文献   

2.
受声学研究启发,结合人脑人耳听觉特性对语音的处理方式,建立了一个完整的模拟听觉中枢系统的语音分离模型.首先利用外周听觉模型对语音信号进行多频谱分析,然后建立重合神经元模型提取语音信号的特征,最后在脑下丘的神经细胞模型中完成对语音的分离.基于现有的语音识别方法,该模型能够很好地解决绝大多数的语音识别方法都只能在单声源和低噪声的环境下使用的问题.实验结果表明,该模型能够实现多声源环境下语音的分离并且具有较高的鲁棒性.随着研究的深入,基于人耳听觉特性的语音分离模型将有很广泛的应用前景.  相似文献   

3.
针对许多计算听觉场景分析系统无法很好地解决多说话人混合语音信号分离的问题,提出了一种基于多基音跟踪的单声道混合语音分离系统。该系统充分利用了多基音跟踪研究的最新成果,通过将多基音跟踪得到的目标语音和干扰语音的基音轨迹信息结合到分离系统中,有效地改善了分离系统在包括多说话人混合在内的多种干扰情况下的分离效果,为多说话人语音分离问题的解决提供了新的思路。  相似文献   

4.
基于频谱方差的抗噪声语音端点检测算法   总被引:1,自引:0,他引:1  
在语音识别系统中,对识别的准确性有很重要的作用.对于纯净语音信号,传统的端点检测算法能够很好地检测语音部分的起止点.由于在有噪声干扰的情况下,算法的检测准确度往往会急剧下降.为了改善噪声环境下的端点检测效果,从语音信号和噪声信号频域分布特性的差异出发,用频谱方差数值来区分语音和噪声,提出了基于频谱方差的端点检测算法,并进行了无噪声和噪声环境下的仿真,证明了这种算法在强噪声干扰的情况下也能够取得很好的效果.同时将新算法和传统的基于LPCC的端点检测算法进行了对比试验,实验结果表明,在噪声环境下,新算法的检测精度有明显提高.  相似文献   

5.
李鹏  关勇  刘文举  徐波 《自动化学报》2009,35(8):1087-1093
在回顾了基于语音客观质量评估和计算听觉场景分析的单声道混合语音分离方法的基础上, 针对该方法所采用的ITU-T P.563语音客观质量评估标准存在的使用限制以及计算量大的缺点, 提出了一种采用基于时域包络表示的语音客观质量评估算法来替代P.563算法的单声道混合语音分离方法. 该方法在几乎不降低原方法分离性能的前提下, 大大节约了算法运行所需的时间和资源消耗.  相似文献   

6.
听觉场景分析(AuditorySceneAnalysis,ASA)是一种模仿人的听觉特性实现对混叠声音信号进行分离的方法。作为ASA的基础研究,论文针对各种ASA系统存在的相近频带信号无法有效分离问题,提出了一种新的基于双基频多带激励分离模型的元音分离系统,该系统利用两语音信号的基音轨迹特性提取多带激励分离模型中两基频对应的语音的各次谐波参数,将两组参数代入多带激励合成模型从而得到两个分离的语音信号。文中给出了算法的原理与具体描述。仿真实验结果表明,系统对存在基音频率差异的元音信号能实现有效的分离。  相似文献   

7.
鸡尾酒会问题与相关听觉模型的研究现状与展望   总被引:2,自引:0,他引:2  
近些年,随着电子设备和人工智能技术的飞速发展,人机语音交互的重要性日益凸显.然而,由于干扰声源的存在,在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度.现阶段,开发一个具备较强自适应性和鲁棒性的听觉计算系统仍然是一件极具挑战性的任务.因此,鸡尾酒会问题的深入探索对智能语音处理领域中的说话人识别、语音识别、关键词唤醒等一系列重要任务都具有非常重要的研究意义和应用价值.本文综述了鸡尾酒会问题相关听觉模型研究的现状与展望.在简要介绍了听觉机理的相关研究,并概括了解决鸡尾酒会问题的多说话人语音分离相关计算模型之后,本文还讨论了受听觉认知机理启发的听觉注意建模方法,认为融入声纹记忆和注意选择的听觉模型在复杂的听觉环境下具有更好的适应性.之后,本文简单回顾了近期的多说话人语音识别模型.最后,本文讨论了目前各类计算模型用于处理鸡尾酒会问题时遇到的困难和挑战,并对未来的研究方向进行了展望.  相似文献   

8.
人耳听觉系统能够从嘈杂的环境中筛选出自己感兴趣的语音,基于计算听觉场景分析的方法,论文采用倒谱法提取语音基音周期轨迹,以连续的基音周期轨迹为线索,按基音频率的整数倍提取各次谐波的频谱,再通过傅里叶逆变换重构分离后的语音。实验表明,在几种典型噪音环境下,该方法能有效将目标语音从背景噪声中分离,信噪比(SNR)和评价意见分(MOS)得到一定的提升,平均增益分别为5.67dB和0.36。  相似文献   

9.
基于自适应仿生小波变换的语音增强方法   总被引:1,自引:0,他引:1  
分析自适应滤波和小波滤波的原理与方法,提出一种基于自适应仿生小波变换的语音增强方法.该方法首先用仿生小波变换对含噪语音信号进行小波分解,这样可以保证对信号频率和幅值的听觉特性,然后将经仿生小波变换所分离出来的噪声成分作为自适应滤波器的输入.通过选用自适应滤波器的最小二乘算法(RLS)从而实现信噪分离的最佳滤波,以保证去除信号中的相关噪声.实验结果表明,该方法对语音信号有显著的增强效果,能实现语音信号在同频段对噪声成分和有用信号的最佳估计.  相似文献   

10.
针对许多基于训练模型的计算机听觉场景分析系统,在解决双说话人混合语音信号分离时需要依赖样本训练的有效性以及说话人的先验知识,提出一种基于聚类的单声道混合语音分离系统。系统先利用多基音跟踪算法对语音信号进行分析并产生同时流,然后通过最大化类内散布矩阵与类间散布矩阵的迹,搜索同时流的最佳分类,最终完成对双说话人的语音分离。该系统不需要训练语音模型,并且有效地改善了在双说话人混合语音信号的分离效果,为双说话人的语音分离提供了新的思路。  相似文献   

11.
听觉注意显著性计算模型是研究听觉注意模型的基本问题,显著性计算中选择合适的特征是关键,本文从特征选择的角度提出了一种基于稀疏字典学习的听觉显著性计算模型.该模型首先通过K-SVD字典学习算法学习各种声学信号的特征,然后对字典集进行归类整合,以选取的特征字典为基础,采用OMP算法对信号进行稀疏表示,并直接将稀疏系数按帧合并得到声学信号的听觉显著图.仿真结果表明该听觉显著性计算模型在特征选择上更符合声学信号的自然属性,基于基础特征字典的显著图可以突出噪声中具有结构特征的声信号,基于特定信号特征字典的显著图可以实现对特定声信号的选择性关注.  相似文献   

12.
Driver distraction is acknowledged as one of the key contributors to driver accidents (Treat, J.R., et al., 1977 Treat, J. R. 1977. Tri-level study of the causes of traffic accidents (No. DOT-HS-034-535-77-TAC(1)), Bloomington, IN: Institute for Research in Public Safety – Indiana University.  [Google Scholar]. Tri-level study of the causes of traffic accidents (No. DOT-HS-034‐535‐77-TAC(1)). Bloomington, IN: Institute for Research in Public Safety – Indiana University; Knipling, R.R., et al., 1993 Knipling, R. R. 1993. Assessment of IVHS countermeasures for collision avoidance: Rear-end crashes (No. DOT HS 807 995), Washington, DC: National Highway Traffic Safety Administration.  [Google Scholar]. Assessment of IVHS countermeasures for collision avoidance: Rear-end crashes (No. DOT HS 807 995). Washington, DC: National Highway Traffic Safety Administration). As driving is mainly considered a visual task (Wierwille, W.W., 1993 Wierwille, W. W. 1993. “Visual and manual demands of in-car controls and displays”. In Automotive ergonomics, Edited by: Peakock, B. and Karwowski, W. 229320. London: Taylor and Francis.  [Google Scholar]. Visual and manual demands of in-car controls and displays. In: B. Peakock and W. Karwowski, eds. Automotive ergonomics. London: Taylor and Francis, 229–320) the use of auditory channels for interacting with intelligent vehicle systems has been suggested as a solution to possible visual overload. This article presents two studies which assess the potential impact of distraction caused by verbal interaction on the driving task. The first study used a low-cost, game-based, simulation and the second study used the same experimental design with a generic driving simulation, the Lane Change Task (Mattes, S., 2003. The lane change task as a tool for driver distraction evaluation. In: H. Strasser, H. Rascher, and H. Bubb, eds. Quality of work and products in enterprises of the future. Stuttgart: Ergonomia Verlag, 57–60). Twenty-four young adults, 12 males and 12 females, participated in the first study and 12 young adults, 6 males and 6 females, in the second study. Road departures, time/speed and subjective workload were the measures in the first study, while the second study used mean course-departure and subjective workload as dependent variables. The results indicated that game-based simulation can be a solution when realism is needed but resources are limited, and suggested that concurrent verbal interaction may impair lateral vehicle control.  相似文献   

13.
介绍一种基于新型小波听觉滤波器组的语音识别特征提取方法。按照人耳听觉临界频带带宽设计一组新型小波带通滤波器组,并详细计算给出构建新型小波滤波器所需要的尺度参数。采用SDA9000串行信号分析仪进行频谱分析,使用型号为MIC3000 Compact PCI Industrial Computer的LSP设备进行FPGA硬件仿真,使用协同神经网络进行模式识别,建立基于Matlab GUI的仿真界面,与高斯小波滤波器组模型所得仿真结果进行对比,从功率谱图和识别结果上进行分析,证明新型小波滤波器组具有更优的识别率和抗噪性。  相似文献   

14.
虚拟声频技术的研究进展   总被引:1,自引:0,他引:1  
简要介绍了目前虚拟声频技术的研究进展状况及存在的问题。虚拟声频是通过耳机或音箱阵列为听者创造一种具有三维方位感的声频环境幻觉,这种幻觉可以通过声频信号与听觉定位信息曲线的卷积来实现。由于虚拟声频定位技术涉及人的听觉生理学和听觉心理学,所以它是人类比较复杂的感知过程。针对虚拟声频技术问题,文章总结了近些年来这方面的相关研究成果,主要包括:虚拟声频定位及定位曲线,虚拟声频信号处理和虚拟声频技术目前存在的问题。  相似文献   

15.
基于听觉模型的语音特征提取   总被引:2,自引:1,他引:1  
分析了耳蜗对声音频率分解机理,毛细胞和听神经的能量转换机理以及中枢神经系统的侧抑制机理,分别在以上三个层次上建立了数学模型,并提取出识别语音特征参数。通过对听觉谱和LPC倒谱对比分析,得到了听觉谱适宜用作语音识别并具有良好的噪声鲁棒性的结论。听觉谱和LPC倒谱对比实验分析也反映了听觉模型特征的优良性能。  相似文献   

16.
听觉脑干诱发电位检测(Auditory Brainstem Response,ABR)是一种客观检测听力损失的常用方 法。短声作为一种宽频信号,其诱发的 ABR 通常被认为是 ABR 检测的金标准。但由于人体耳蜗基底 膜行波具有延迟特性,短声不能同时刺激整个耳蜗基底膜产生兴奋,导致诱发的 ABR 波形因不同相而 产生衰减。为解决这一局限性,该研究设计了一种扫频音刺激,根据耳蜗基底膜的延迟特性重新调整 不同频率成分出现的时间,以诱发 ABR 信号。实验通过将所设计的扫频 ABR 方法和传统的短声 ABR 方法的波质量进行比较发现,在不同的刺激强度和刺激速率下,扫频 ABR 的波形形态均明显优于短声 ABR 的。此外,在不同的响应叠加次数下,所设计的扫频音比短声诱发 ABR 能更快地诱发出 ABR 波 形。该文所提出的扫频 ABR 方法有望提高 ABR 在听力损失诊断中的灵敏度。  相似文献   

17.
针对结构化耳标的不足,设计音乐化耳标,以音乐的情感表达增加耳标区分度,以音乐元素、音乐结构特性作为耳标的区分依据.借助心理学实验的方法对音乐化耳标进行反映时-刺激测试,验证音乐化耳标的可用性.测试结果表明,测试者经过训练后,可以熟练使用音乐化耳标.  相似文献   

18.
一种基于听觉模型的语音特征提取方法   总被引:2,自引:0,他引:2  
提出了一种基于听觉模型的语音特征提取方法,从信号的过零点获得频率信息,从振幅值和非线性压缩获得强度信息,并对这种方法进行了误差分析,证明其噪声的鲁棒性。  相似文献   

19.
基于语音参数模型的抗同步攻击音频水印算法   总被引:1,自引:0,他引:1       下载免费PDF全文
同步是音频水印需要解决的关键问题之一,目前的音频水印算法还缺乏简单有效的同步机制。该文提出一种基于语音参数模型的自同步水印算法,在保证不可感知性和稳健性的良好平衡下实现水印的盲检测。仿真实验表明,该同步机制算法复杂度低,稳健性强,实现简单,对实际应用有重要意义。  相似文献   

20.
针对多数语音识别系统在噪音环境下性能急剧下降的问题,提出了一种新的语音识别特征提取方法。该方法是建立在听觉模型的基础上,通过组合语音信号和其差分信号的上升过零率获得频率信息,通过峰值检测和非线性幅度加权来获取强度信息,二者组合在一起,得到输出语音特征,再分别用BP神经网络和HMM进行训练和识别。仿真实现了不同信噪比下不依赖人的50词的语音识别,给出了识别的结果,证明了组合差分信息的过零与峰值幅度特征具有较强的抗噪声性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号