首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
强噪声背景下汉语语音端点检测和音节分割   总被引:3,自引:0,他引:3  
根据汉语语音的特点,提出了强噪声背景下对汉语语音进行了端点检测和音节分割的新算法,在85dB的噪声环境中,实验考察了端点检测的正确性和音节分割的稳定性,结果表明,算法在这两方面达到了很高的性能,且与发音者无关。  相似文献   

2.
获取复杂声学背景下的语音流以得到有用信息是一些部门极其重要的工作.研究了在无线话带通信中实现语音流的机器自动检出.结合人的听觉外周和听觉心理的研究,提出了一种基于人耳听觉感知特性的噪声环境下语音流检测方法.该实验采用来自现场的大量的无线话带录音作为测试数据,结果表明,这种新的方法可很好地排除各种噪声的干扰,强噪声环境下表现良好.无论在抗噪方法还是在实际应用中,都有很好的应用前景.  相似文献   

3.
基于小波系数统计的非高斯噪声背景下语音流检测   总被引:5,自引:0,他引:5  
在实际生活中,非高斯噪声很普遍,对信号的影响也很大,是语音信号处理中的难题.大部分强噪声信号都是非高斯的,在强噪声背景下,由于语音信号受到较大的干扰,甚至被噪声淹没,传统的基于短时的能量、过零率、相关以及平均幅度差等检测算法效果都不理想.根据小波变换的特性和语音时域信号的分布特征,提出了一种非高斯噪声背景下语音流检测算法.对含噪语音进行小波分解,观察各层小波系数的统计特征,提取它们的不同特征,从而进行了语音流检测.大量实验表明该算法具有较高的检出率和较低的误检率,可以消除噪声的影响实时处理语音信号.该算法有一定的创新性,在处理非高斯噪音方面很有实用性.  相似文献   

4.
藏语语音增强方法能够用于提高噪声环境中语音处理设备的性能,并且能够在不同的噪声环境下使用而不影响其性能.根据藏语语音特点,提出藏语语音增强算法.实验显示,该算法具备良好的分段信噪比增益.  相似文献   

5.
基于SCHMM/ANN噪声背景下的语音识别系统设计   总被引:2,自引:0,他引:2  
语音识别系统一般是将安静环境下训练得到的参数用于实际环境中, 当实际环境是安静的,语音识别系统的工作是令人满意的,然而,当实际环境中有噪声存在时,识别系统的性能就会下降.文中提出将自组织特征映射神经网络与半连续隐马尔可夫模型相结合,训练出适应噪声的隐马尔可夫模型的新方法.把该模型应用于小词汇量的孤立词语音识别系统.实验表明,该模型适合于对噪声背景下的语音进行识别.同传统的HMM模型相比,该模型具有更好的抗噪鲁棒性,在信噪比较低的情况下(2~12dB),识别率比传统HMM模型有明显提高.  相似文献   

6.
提出了一种噪声环境下的语音活动度(Voice Activity Detection)的稳健检测算法,算法采用了先降噪后检测的策略.为了使检测算法能够适应嘈杂的噪声环境,本文采用了两个互补性的策略.首先,采用噪声特征空间投影的方法,以较小的语音畸变为代价,去掉语音信号中的有色分量,然后利用Teager Energy Operator(TEO)来增强语音信号与噪声之间的能量差别,最终,根据子带TEO的平均信噪比来区分语音与非语音信号.我们采用了TIM IT数据库与几种常见的噪声来评价该算法,实验表明,该算法优于最新的语音活动度检测算法.  相似文献   

7.
语音识别技术可以为要求双手同时作业的操作人员和残疾人提供一种便捷的控制方法。作者在文中提出了一种通过结合二阶频率滤波和RASTA技术来增强语音识别鲁棒性的方法,并将这种方法成功应用于机器人化护理床的控制系统中,增强了识别系统在医院、工厂等非稳定噪声环境下语音识别的鲁棒性。 通过将HMM/GMM混合模型的传统Mel频率倒谱系数为特征值的识别系统与HMM/GMM混合模型的RASTA—FF2为特征值的识别系统进行比较,并分别在纯语音和带噪语音条件下进行测试,发现经过二阶频率滤波后的FF2特征值再经过RASTA滤波器滤波,特别是在非稳定噪声环境下,以RASTA—FF2为特征值的识别系统比传统的识别系统的识别率更高,这表明FF2特征值与RASTA滤波器技术相结合,一个作用于频域,一个作用于时间域,可以有效地消除语音信号中的不同噪声成份。  相似文献   

8.
核磁共振成像系统强噪声的环境,使得语音通信系统无法正常工作,患者只有在系统停机的前提下才能与医生交流。针对强噪声环境,为了解决医生与患者交流的技术问题,采用最小均方误差自适应对消算法,设计基于TMS320VC5509的DSP语音信号处理硬件系统,针对实际环境和硬件进行编程,同时,分析了核磁共振噪声特性,对系统实时性进行优化,在保证系统信号流畅的前提下尽力提高消噪效果。实验环境信噪比接近0dB,通过实际场景测试,采集原始噪声与消噪后对比、分析,此设计能将信噪比提高到30dB以上。  相似文献   

9.
通过分析带噪语音、纯净语音和噪声的自相关关系,在均方误差最小准则下给出了一种基于最优平滑滤波和能量最小算法相结合的噪声自相关无偏估计算法,与传统的噪声自相关估计不同,该算法直接从带噪语音自相关中估计噪声自相关。实验表明,该算法优于传统的噪声自相关估计算法,在非平稳噪声环境下,估计器的性能得到改善。  相似文献   

10.
说话人识别系统不可避免地会受到噪声的影响,导致性能急剧降低,针对这一问题采用感知最小方差无畸变响应(PMVDR)技术,提出了一种新的语音特征提取方法.该特征基于平移差分倒谱算法,成功地融入了说话人语音的长时信息.所提取的特征不仅在干净环境下能取得良好性能,而且在混噪语音以及信道失配等声学条件下也优于目前主流的特征.在YOHO数据库和ROSSI数据库上的实验结果表明,新特征在噪声和信道畸变的情况下能有效提高识别系统的鲁棒性.  相似文献   

11.
针对助听器应用中背景噪声场景分类算法需同时具备低延时性和高分类准确率的问题,提出一种基于LightGBM集成学习模型的助听器场景分类算法以减少分类过程的计算时间,给出一种新的子带谱相关性特征并联合子带谱熵特征构成分类特征来提高助听器场景分类的准确率,使用双耳差分信号提取子带谱特征减少计算过程中的内存占用率以及模型离线训练工作量,提高计算效率。对双耳助听器声学环境识别数据集中的安静室内、交通环境、风噪声、音乐、鸡尾酒会、汽车噪声6种场景下的背景声音进行测试,实验结果表明,相对于基于随机森林模型和子带信号周期性特征、子带信号熵特征的场景分类算法,该算法在实时性和分类准确率方面的性能均有显著改善。  相似文献   

12.
语音识别技术可以为要求双手同时作业的操作人员和残疾人提供一种便捷的控制方法。作者在文中提出了一种通过结合二阶频率滤波和RASTA技术来增强语音识别鲁棒性的方法,并将这种方法成功应用于机器人化护理床的控制系统中,增强了识别系统在医院、工厂等非稳定噪声环境下语音识别的鲁棒性。通过将HMM/GMM混合模型的传统Mel频率倒谱系数为特征值的识别系统与HMM/GMM混合模型的RASTA-FF2为特征值的识别系统进行比较,并分别在纯语音和带噪语音条件下进行测试,发现经过二阶频率滤波后的FF2特征值再经过RASTA滤波器滤波,特别是在非稳定噪声环境下,以RASTA-FF2为特征值的识别系统比传统的识别系统的识别率更高,这表明FF2特征值与RASTA滤波器技术相结合,一个作用于频域,一个作用于时间域,可以有效地消除语音信号中的不同噪声成份。  相似文献   

13.
利用特征波形匹配来识别短波通信信号协议是简单有效的方法,但易受噪声干扰,影响其有效性.而低信噪比是短波信道特征之一,为此引入小波降噪来构造具有优良抗噪声干扰性能的协议识别特征,以减小噪声对特征波形匹配度的影响.文章提出了一种新的协议识别特征提取算法,该算法通过统计不同信噪比条件下小波系数的波动性,实现了特征波形与待识别信号波形小波系数的合理取舍,并采用取舍后小波系数的匹配度作为识别特征.仿真结果表明,该识别特征能有效减小噪声干扰影响,在低信噪比条件下优势突出.  相似文献   

14.
为了扩大掌纹识别的应用范围,使非接触式掌纹识别系统在复杂背景和光照变化的条件下都能使用,提出了一种适用于非接触采集下的鲁棒掌纹识别算法.该算法使用肤色阈值的方法把手掌从复杂的背景中分割出来,采用一种新颖的指根点检测算法找到指根点,用指根点来定位掌纹ROI,使用对光照具有良好鲁棒性的LBP算法提取掌纹特征,并用Chi平方统计法进行分类.实验使用的数据库是在不同光照和复杂背景下采集的,当等错率为3.098 6%时,正确识别率达到97.833 7%.实验结果表明,该方法能够扩大掌纹识别的应用范围,使非接触掌纹识别系统在复杂背景和可变光照的条件下达到较理想的识别效果.  相似文献   

15.
针对语音和噪音的特点,提出在高噪声条件下,用LPC全极点模型的增强算法,进行系统实现及比较和测试。系统在较高噪声背景下,该方法具有很好的去噪效果。  相似文献   

16.
针对现有动态手势识别方法环境适应性低、计算复杂的问题,提出了一种基于视频数据特性的动态手势识别方法.使用基于密度的聚类算法DBSCAN直接从视频编码数据中的运动矢量提取出运动趋势特征,再通过随机森林分类运动趋势,结合卷积神经网络(CNN)提取的手型特征识别动态手势.实验结果表明,该方法对剑桥大学和美国西北大学数据集中动态手势的平均识别率分别达到94.22%和94.48%,并且与CNN结合长短期记忆网络的识别方法相比,手势识别时间减少了85%.在背景图像复杂且光照条件不足时,该方法仍然能够维持较高的识别率,表现出较好的鲁棒性.  相似文献   

17.
树状放电的CPN识别方法   总被引:2,自引:0,他引:2  
电力压器发生击穿之前会在固体绝缘材料上产生树状放电通道。若能检测到树状放电信号,则可以断定变压器绝缘状况已经恶化,因此在线监测中对树状放电的检测具有十分积极的意义。在实验条件下对在线监测中树状放电的识别进行了研究。建立了变压器绕组模型和树状放电产生电路,模型了在绕组不同部位发生树状放电的情况。通过CPN型神经网络的引入,成功地实现了在一定噪声水平下树状放电的识别。同时,对这种方法在线监测应用前景提出了一些设想。  相似文献   

18.
针对包含环境噪声和信道失真等噪声的语音处理问题,提出了一种基于自适应心理声学模型的智能语音识别系统,并建立了听觉模型.该模型将心理声学和耳声发射(OAE)合并到了自动语音识别(ASR)系统中,利用AURORA2数据库分别在清洁训练条件和多训练条件下进行试验.结果表明,所提出的特征提取方法可以显著提高词识别率,优于梅尔频率倒谱系数(MFCC)、前向掩蔽(FM)、侧向抑制(LI)和倒谱平均值及方差归一化(CMVN)算法,能够有效地提高智能语音识别系统的性能.  相似文献   

19.
基于视频图像的多特征车位检测算法   总被引:2,自引:0,他引:2  
车位检测是停车场监控和管理系统的重要内容,针对停车场的复杂背景和不同环境光照条件,提出了多特征的车位检测方法.通过充分利用车位信息的几何特点和纹理特征来提取车位的特征参数,从数学建模的角度设计了3种不同判决函数的方案并采用实际现场的视频监测图像数据对设计方案进行了测试和比较.实验结果表明,3种方案在运算的实时性、识别的准确性及鲁棒性方面均能满足实际停车场车位的监控和管理系统的需求,其中以主成分分析降维的贝叶斯判别方案效果最佳,识别率高达99.17%.  相似文献   

20.
针对人工设计特征表征能力不足,提取难度大的问题,提出基于卷积神经网络(CNN)的跳频信号调制方式识别系统. 该系统通过训练学习跳频信号时频图特征,将调制方式识别问题转化为图像识别问题. 采用组合时频变换方法对跳频信号进行时频变换得到二维时频图;经过自适应维纳滤波算法滤除背景噪声,提高系统抗噪性;采用连通域检测和双线性插值算法提取跳频信号每跳时频图,对时频图大小进行重置调整;将已处理的时频图输入到设计的11层卷积神经网络中进行训练学习,通过在输出层增加Softmax分类器,实现跳频调制方式分类识别. 仿真结果表明,该系统在信噪比为–4 dB条件下,对跳频信号BPSK、QPSK、8PSK、SDPSK、QASK、16QAM、32QAM和GMSK共8种调制方式的平均识别率达到92.54%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号