共查询到19条相似文献,搜索用时 62 毫秒
1.
本文介绍了连续语音识别中噪音鲁棒性方法的现状,分析传统动态范围调整方法在连续语音识别中导致的特征曲线中的峰值不匹配问题,提出了新的特征曲线调整算法,并为算法的参数设定增加了限制条件。本文详细地论述了算法的步骤以及算法中参数的确定。通过理论分析和实验验证,证明了提出的算法在连续语音特征调整中具有很好的性能,提高了识别精度。 相似文献
2.
连续语音识别中,由于各声学单元之间没有明显的间隔或声学标志,匹配和搜索算法成为影响系统实时性能的核心问题。基于汉族语音的特点,提出了一种改进的N-Best搜索算法。该算法大大降低了传统N-Best程序搜索空间而不至于失去最优解,有利于算法的实时实现。 相似文献
3.
连续语音识别中,由于各声学单元之间没有明显的间隔或声学标志,匹配和搜索算法成为影响系统实时性能的核心问题.基于汉语语音的特点,提出了一种改进的N-Best搜索算法.该算法大大降低了传统N-Best程序搜索空间而不至于失去最优解,有利于算法的实时实现. 相似文献
4.
5.
蚁群算法是一种新型的随机优化算法,应用蚁群算法优化机制,提出了一种基于蚁群算法的语音信号动态时间规划方法———蚁群动态时间规划算法,搜索语音信号之间匹配的一条全局最优路径,进而以此衡量语音信号之间的相似度.算法给出了蚁群状态转移概率及信息素更新方程,既利用了语音信号的全局特征又考虑了其局部信息.理论分析与仿真实验结果均证明了此方法的可行性,与传统的DTW算法相比较,其匹配结果更能体现匹配语音信号之间的相似度. 相似文献
6.
小波收缩用于语音增强时,周值算法和阈值函数是最重要的参量.为了在小波语音增强中得到可靠的选择方案,通过对这两种小波收缩参教进行分析,得到了相关数据结果,并给出SURE阈值算法和universal阈值算法的对比结论.用常见的几种阈值函数分析软类阈值函数和硬类阈值函数,并给出了这两种参数对应选择的方法. 相似文献
7.
提出了一种新的基于蚁群算法的语音识别中的动态时间规划方法——蚁群动态时间规划算法,并详细介绍了其基本原理、信息素更新规则,给出了系统流程图。经过理论分析与实验测试,证明了蚁群算法在这个系统中比传统的DTW算法更能提高识别率且更有效率。 相似文献
8.
9.
为了解决连续的语音识别对端点的依赖性问题,提出了一种基于高维空间点覆盖动态搜索理论的非特定人问候语连续语音识别的新算法,该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类训练网络的距离随时间变化的曲线,通过动态搜索距离曲线上谷值的大小来判断识别结果.通过对小词汇量、不同语速条件下的连续语音的测试,得到了良好的识别结果,验证了此方法的有效性. 相似文献
10.
应用连续隐马尔可夫模型(CHMM)为识别算法,采用MFCC(MEL频率倒谱系数)为主要语音特征参数,建立了一个汉语连续数码串语音识别系统,其中包括语音信号的预处理、特征参数的提取、识别模板的训练以及识别匹配算法,文中就系统的各个部分的具体实现进行了阐述.同时,利用MATLAB的语音工具箱voice box对系统进行了仿真,并给出了系统识别结果,指出了系统进一步改进的方法. 相似文献
11.
经过数十年的发展语音识别取得了长足进步,但各种语音识别系统的性能仍然难以满足现实应用的需求.造成这种情况的一个重要原因在于目前的系统仍然难以适应各种噪声环境.因此,增强语音识别系统的噪声鲁棒性是推动其走向现实应用的关键.系统地阐述了特征增强类方法的国内外研究现状,介绍了信号增强、从听觉层面或可区分层面的提取特征、特征归正和特征补偿等方法,分析了他们存在的局限性.在此基础上,分析了稀疏编码与语音特征增强的基本问题和研究现状,提出了稀疏编码在语音特征增强方面的需要解决的问题,为从事鲁棒语音识别的研究者提供参考. 相似文献
12.
说话人识别系统不可避免地会受到噪声的影响,导致性能急剧降低,针对这一问题采用感知最小方差无畸变响应(PMVDR)技术,提出了一种新的语音特征提取方法.该特征基于平移差分倒谱算法,成功地融入了说话人语音的长时信息.所提取的特征不仅在干净环境下能取得良好性能,而且在混噪语音以及信道失配等声学条件下也优于目前主流的特征.在YOHO数据库和ROSSI数据库上的实验结果表明,新特征在噪声和信道畸变的情况下能有效提高识别系统的鲁棒性. 相似文献
13.
为了克服因数据不足,而造成较难提取稳定的长时特征的问题,提出了一种基于群稀疏约束的混合判别分析方法。该方法首先采用高斯混合模型描述数据的分布,在此基础上利用二次变分的形式进行群稀疏的表示,得到基于群稀疏约束的混合判别分析目标函数。接着,通过定义模糊响应矩阵(blurred response matrix),有效地结合最优化得分方法求解判别分析变换矩阵。最后,拼接相邻帧梅尔滤波器组输出组成超矢量,采用变换矩阵进行变换降维,提取时频特征。实验结果表明,本文方法能够得到稀疏的变换矩阵,相比于PLDA(Penalized LDA)和SLDA(Sparse LDA)判别分析方法,识别准确率分别提高了0.71%和1.53%,且在数据不足的条件下,本文方法能获得更高的识别性能。 相似文献
14.
为了在可视语音合成中获得更具有真实感的口型动画,提出了一种基于双重学习模型的合成方法.通过隐马尔可夫模型和遗传算法相结合的方法,可以更好地学习出语音特征与可视特征间的映射关系.该模型能去除传统语音识别领域在对大样本语音空间提取语音特征时的冗余信息,达到更好的可视语音预测效果.另外,在口型特征的表示上提出了一种基于面部动画参数特征点的几何特征表示,不仅对在不一致的光照条件下获得的训练样本有较好的鲁棒性,能更好地表征口型本身变化,而且与传统的主成分分析特征相比,具有较小的向量维数,提高了训练和合成速度. 相似文献
15.
为提高语音识别系统的实用性与实时性,该文采用缺失特征分量的方法研究了美尔频率倒谱系数静态特征及其一阶差分各分量对识别率的影响.在不同信噪比情况下,分别对含白噪声、粉红噪声、车载噪声和工厂噪声这四种典型噪声的语音进行了实验研究,结果表明:在保证系统有较高识别率的情况下,在低信噪比时,含白噪声的语音信号缺失美尔频率倒谱系数... 相似文献
16.
针对机器人的应用场合通常存在各种噪声干扰的问题,提出了一种基于稀疏编码的语音特征提取方法.利用稀疏编码能稀疏表示语音的特性,在梅尔频域对语音增强后提取特征,将稀疏去噪与语音特征提取相融合,实现了混噪语音的有效补偿.在预设场景中的实验结果表明,与现有特征提取方法相比,所提出的语音特征提取方法能有效降低噪声对语音特征的影响,提高机器人语音控制的性能. 相似文献
17.
本文提出一种新的矢量量化方法压缩语音特征用于孤立字语音识别.新方法借鉴了隐马尔柯夫模型(HMM)中状态的概念来规划模板;用动态规划(Dyna-mic Progamming)的技术优化矢量量化产生的初始码字.新方法使得识别所需的模板库的尺寸明显减小,识别响应时问缩短,而且由于模板的优化,使得系统的正确识别率显著提高. 相似文献
18.
一种新的基于分形特征融合的图像目标识别算法 总被引:2,自引:0,他引:2
提出了一种基于多分形特征融合的目标识别算法.在此算法中,将分形理论与D-S证据融合理论相结合,提取或构造了分形特征,设计了合理的概率分配函数,并对所提出的算法进行了仿真研究,并将此算法的识别结果与基于单分形特征的识别算法、基于神经网络的目标识别算法进行比较,结果表明本算法是可行的和有效的. 相似文献
19.