首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
提出了一种基于模型融合的声效检测方法.首先提取对所有声效模式都具有良好辨识能力的谱信息熵特征,并进行声效辨识度分析;然后引入互补模型进行声效识别,从模型层面实现了整体谱特征、梅尔频率倒谱系数和谱信息熵的融合.对孤立词测试集进行了声效检测实验,识别精度为81.6%,实验结果表明,谱信息熵在3类特征中具有最好的分类能力,而互补模型能够有效集成3种特征蕴含的显著性信息.  相似文献   

2.
针对声效检测过程中基于帧的谱特征不能描述语音现象中固有的时间相关性和动态变化信息的问题,提出一种结合回声状态网络和径向基函数网络的声效检测方法。首先将声学观测特征序列输入到回声状态网络,根据回声状态网络中储备池的节点状态对输入的观测矢量序列进行编码,从而将基于语音帧的声学观测矢量序列映射到高维编码空间;然后径向基函数网络被用于拟合每种声效模式编码后的概率密度函数;最后使用最小错误率贝叶斯决策方法来确定声效模式。对拥有5 000个孤立词的测试集进行声效检测试验,获得79.5%的识别精度。结果表明,所提方法可以有效获取语音帧之间的相关性信息,克服帧间独立假设的缺陷。  相似文献   

3.
一般语音信号的合成分析是采用LPC参数或共振峰等参数,根据选定的误差准则,调整参数,使得原始语音与合成语音二者误差最小,从中分析语音的有关性质.利用稀疏谱线进行傅立叶反变换来合成元音,提取元音信号频谱中的几根或者几十根谱线进行反变换来合成元音,由试听者进行听辨实验,考察合成语音的清晰度,从频域对语音信号中的信息分布进行探讨.给出了实验结果与结论.  相似文献   

4.
为解决语音识别过程中的抗噪声及抗干扰问题,提高系统的识别精度,利用隐马尔可夫模型HMM优异的时序建模能力及小波变换可以对信号进行多尺度分析并有效提取信号的局部信息的特点,建立了混合语音识别模型.考虑到在语音信号识别过程中信号的非平稳性,采用并行的识别方法分别获取分类信息,根据混合模型的识别算法做出识别决策,减小了系统对环境的依赖性,提高了其自适应能力.仿真实验结果表明,混合模型识别结果比单一HMM模型或小波模型识别结果更佳,提高了整体的识别速度和识别率.  相似文献   

5.
为解决语音识别过程中的抗噪声及抗干扰问题,提高系统的识别精度,利用隐马尔可夫模型HMM优异的时序建模能力及小波变换可以对信号进行多尺度分析并有效提取信号的局部信息的特点,建立了混合语音识别模型.考虑到在语音信号识别过程中信号的非平稳性,采用并行的识别方法分别获取分类信息,根据混合模型的识别算法做出识别决策,减小了系统对环境的依赖性,提高了其自适应能力.仿真实验结果表明,混合模型识别结果比单一HMM模型或小波模型识别结果更佳,提高了整体的识别速度和识别率.  相似文献   

6.
针对特定人汉语元音的语音识别,提出一种基于非齐次隐马尔可夫模型的识别方法.该方法首先提取声道频率响应作为特征参数,然后建立非齐次隐马尔可夫模型来更为精确地刻画真实的语音现象,接着进行语音识别实验,并与齐次隐马尔可夫模型进行比较.实验结果表明该方法可以使特定人的元音的识别率达到98.73%,明显改变了识别系统的性能.该方法具有很好的理论研究前景和实际应用价值.  相似文献   

7.
提出了一种噪声环境下的语音活动度(Voice Activity Detection)的稳健检测算法,算法采用了先降噪后检测的策略.为了使检测算法能够适应嘈杂的噪声环境,本文采用了两个互补性的策略.首先,采用噪声特征空间投影的方法,以较小的语音畸变为代价,去掉语音信号中的有色分量,然后利用Teager Energy Operator(TEO)来增强语音信号与噪声之间的能量差别,最终,根据子带TEO的平均信噪比来区分语音与非语音信号.我们采用了TIM IT数据库与几种常见的噪声来评价该算法,实验表明,该算法优于最新的语音活动度检测算法.  相似文献   

8.
为了减少语音识别中的检测误判,提高语音识别的正确率,提出了一种基于连续隐马尔可夫模型(CDHMM)语音识别程序行为检测改进方法,通过一种简化的、处理多维离散语音符号的程序行为检测方法,使得连续隐马尔可夫模型可以同时接收多种不同的特征序列,解决了语音认证系统识别率随时间推移而下降的问题。实验表明,减少了语音拒绝率,提高了语音识别系统的自适应性。  相似文献   

9.
语音识别中,倒频谱是识别效果最好的一种参数.而语速的变化对于识别效果有着很大的影响,因此研究不同语速对于倒频谱的影响是很有意义的一项工作.计算并对比了两种语速(快速与慢速)下部分元音和辅音的倒频谱中C0值、C1值、峰值位置与峰值幅度值特征,给出了实验结果,以期探讨语音倒频谱在不同语速下的一些特点.  相似文献   

10.
为构造有效的情感识别系统,通过声音刺激分别诱发出高兴、悲伤、生气以及中性4种情感,并采集相应的语音信号和脑电信号。首先,利用相空间重构技术提取脑电信号和语音信号的非线性几何特征和非线性属性特征,并结合两者的基本特征分别实现情感识别;然后,通过构建基于限制玻尔兹曼机的特征融合算法,从特征层融合的角度实现多模态情感识别;最后,利用二次决策算法从决策融合的角度构建多模态情感识别系统。实验结果显示,从特征融合的角度构建的多模态情感识别系统相比语音信号和脑电信号情感整体识别率,分别提高1.08%和2.75%;从决策融合的角度构建的多模态情感识别系统相比语音信号和脑电信号情感整体识别率,分别提高6.52%和8.19%;决策融合相比特征融合构建的多模态情感识别系统整体识别效果更优。因此,融合语音信号和脑电信号等不同来源的情感数据可以构造出更有效的情感识别系统。  相似文献   

11.
为了获得更加精确的汉语语音基音周期轨迹,研究了对汉语语音的基音周期轨迹进行层叠滤波和平滑的方法.基音是指发浊音时声带振动所引起的周期性,而声带振动频率的倒数就是基音周期.语音信号处理中精确提取特定语音的基音周期有重要的意义,基音周期的检测无论在语音信号的合成、编码还是识别方面,都起着非常重要的作用.本文依据数字语音信号的特点,设计了一种用于语音处理的层叠滤波算法,合理选择结构元素构筑了一组用于汉语语音基音轨迹平滑的层叠滤波器,仿真实验结果表明这种方法对于随机误判点与传统的基于中值与线性平滑的组合平滑相比效果更佳,同时也证明了层叠滤波器用于语音信号研究的可行性.  相似文献   

12.
通过数字音频水印和模式恢复技术检测语音伪造,数字水印模式已经用于语音信号伪造检测的三种方法为替换、插入和删除,如果在语音信号上做一些改变,则水印模式也会变化,通过模式恢复可以检测语音信号是否被修改和伪造。提出利用嵌入的循环模式的方法来解决检测技术的同步问题,此外,模式恢复对语音信号压缩增强鲁棒性,该方法使用6个用于收集语音数据的录音设备进行测试和验证,语音信号的采样速率为8 kHz,将语音信号数字化的分辨率设为16 bit,对速率为16 kbps的MP3和速率为11.5 bps的CELP中语音信号随机选择区域进行替换、删除和压缩处理。结果表明,三种方法的语音伪造信号完全可以检测到,证明了该方法的有效性。  相似文献   

13.
针对希尔伯特-黄变换方法在振动信号处理中不能有效地进行模态解耦的缺点,提出一种将经验模式分解和小波变换相结合的结构模态参数辨识方法.首先利用经验模式分解方法对结构响应信号进行分解,获得多个本征模函数以完成结构模态的筛选过程,并根据模态筛选得到的本征模函数进行信号重构;然后对重构信号进行Morlet小波变换和模态解耦,获得信号小波变换系数的瞬时幅值和瞬时相位拟合曲线,并在此基础上计算出结构的各阶模态频率、阻尼和振型.结果表明,利用小波变换对本征模函数的叠加信号进行参数辨识代替对单个本征模函数进行希尔伯特变换,更能有效地进行模态解耦,从而获得更为准确的结构模态参数信息.  相似文献   

14.
针对语音识别过程中环境噪声干扰大的问题,提出一种基于经验模态分解(EMD)与动态时间规整 (DTW)相结合的孤立词识别算法。该方法利用EMD 算法,首先将提取的性能不好的语音信号分解成若干个基本模函数(IMF),去掉原始信号中的干扰和噪声。然后,基于DTW 算法,采用短时过零率和短时能量对语音信号进行端点检测,提取语音特征参数后与参考模板进行匹配。将参考模板与待测模板之间的最短路径作为识别结果。仿真结果表明,该算法能够提高语音的识别效率和识别的正确率。  相似文献   

15.
歌者识别是音乐检索中非常重要的一个方面,背景音乐会严重地影响歌者识别系统的性能。提出了一种新的语音检测算法。为了减少背景音乐的干扰,使用一个基于支持向量机的语音检测系统寻找最有可能的语音片段用于歌者识别,歌者识别算法使用了高斯混合模型。实验结果表明,提出的算法能够极大地提升歌者识别的性能。  相似文献   

16.
智能语音识别技术的研究已有较长的时间,但由于语音信号本身所具有的多变性、瞬时性、连续性和动态性的特征,使得机器在不同的环境尤其是噪声环境中进行语音信号的识别仍具有一定的困难.为了提高带噪语音信号识别的准确率,本文研究了一种常用的噪声估计算法,即基于后验信噪比的时间递归平均算法.并在此算法的基础上提出了一种对平滑因子的改进算法,将语音活性检测算法与这两种算法在不同输入信噪比下进行模拟验证.通过运算结果的对比分析可以看出,改进后的算法相比于语音活性检测算法最高可以使输出分段SNR提高2.1 dB,相比于原时间递归平均算法最高可以使输出分段SNR提高0.5 dB,表明低输入SNR下改进后的算法可以有效提高语音信号的质量和可懂度.  相似文献   

17.
针对低信噪比下语种识别正确率低的问题,提出了一种声道冲激响应频谱参数和Teager能量算子倒谱参数融合的识别方法.根据语音中不同特征信息量分布特性,首先在特征提取前端引入低通滤波器滤除信号高频部分,并采用重采样方法降低采样率,再基于信号频谱提取声道冲激响应频谱参数,然后融合Teager能量算子倒谱参数,最后通过高斯混合通用背景模型进行语种识别验证.不同信噪比条件下性能测试表明,所提方法相对于基于单一的梅尔频率倒谱系数特征、单一的伽玛通频率倒谱系数特征和基于对数梅尔尺度滤波器组能量特征,在低信噪比下提升约15 dB,显著提高了识别正确率.  相似文献   

18.
采用不同天线极化方式进行探地雷达探测时得到的雷达图像是不同的,研究不同属性的目标体在不同极化方式下的雷达信号响应特征,可以指导工作人员在实际应用中对异常的解释。根据天线与测线的分布方向可分为xx,xy,yx,yy四种天线极化方式。本文基于电磁波的极化理论和天线的极化方式,利用时域有限差分法进行正演模拟,分析不同属性不同延伸方向目标体不同极化方式的探测效果。通过模拟分析,无论何种类型的目标体,采用xx和yy天线极化方式比用xy和yx方式得到的雷达信号强度大;对于不同延伸方向的目标体,xx极化方式的信号呈现一定的规律性。已知地下目标体走向和属性时,可采用适当的极化方式和测线来测量;当地下目标体未知时,可根据不同极化测量得到的信号特征来分析地下异常体的属性和走向。  相似文献   

19.
针对磁瓦内部缺陷声振检测存在的信号处理和特征识别问题,提出结合变分模态分解(VMD)、粒子群优化(PSO)和随机森林(RF)的信号分析方法. 该方法以模态能量和相邻模态中心频率差值构建代表VMD处理性能的适应度函数,其中以VMD的分解层数和惩罚因子2个参数作为该适应度函数的变量;通过PSO在VMD参数选择空间中搜索该函数的最小值以执行VMD的参数优化,最小值所对应的参数设置即为VMD的最优参数;利用得到的参数实现信号的最优VMD分解并通过计算模态分量的能量来筛选特征模态,从中提取过零率、谱质心和最大峰值频点以联合反映磁瓦内部缺陷的特征信息;经RF分类器对这些特征进行识别进而对内部缺陷的存在情况做出判断. 实验证明所提出的方法能够准确、高效地实现不同类型磁瓦的内部缺陷检测.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号