共查询到20条相似文献,搜索用时 156 毫秒
1.
语音识别的一个最重要的领域就是鲁棒性问题,这个问题的核心是如何处理训练和识别不匹配的问题。提出一个在线自适应匹配算法,此算法能够根据当前语音信号,自适应的估计出语音畸变参数,从而调正模型来匹配当前的测试环境,在Aurora2测试集上,正确率显著提升。 相似文献
2.
为了降低卷积噪声对语音特征所产生的影响,提高语音识别正确率,文章提出了一种基于频域ICA(Independent Component Analysis,独立分量分析)的语音特征增强算法。该算法首先使用频域ICA方法作对噪声进行估计,然后在倒谱域内将带噪语音信号的短时谱减去所估计噪声的短时谱,最后根据去噪后语音信号的短时谱计算美尔倒谱系数(MFCC)作为特征参数。在仿真和真实环境下的语音识别实验中,本文所提出的语音特征参数相比较传统的MFCC其识别正确率分别提升了38.2%和35.8%。实验结果表明本文所提算法能够较好地解决卷积噪声环境下训练与识别特征不匹配的问题,有效提高了语音识别系统的识别正确率。 相似文献
3.
肖媛媛 《中国新技术新产品》2009,(7):1-2
本文首先对声音的预处理及其信号特征的提取过程进行了简要介绍,然后提出了在孤立字词语音识别的一个新的算法,即新型的识别算法。通过此算法,系统可以在不降低系统识别精度的前提下,大大精简运算量,因此提高了识别系统整体的识别效率。实验证明,这种识别算法在基于模板的孤立字词语音识别中可以达到100%的识别精度,在基于非模板的孤立字词的语音识别中,其识别精度也可以达到90%以上,并且与传统的识别方法相比,缩短了训练时间,提高了识别速度。在孤立字词的语音识别中具有自己独到的优势。然后,构建一个使用方便的语音识别系统,将本算法应用到实践当中来解决人们现实生活中遇到的各种问题。 相似文献
4.
5.
6.
语音识别的一大难题就是参数提取和最佳结果的匹配搜索。本文利用离散小波变换(DWT)特有的奇异特征提取和时变滤波功能,结合动态时间规整算法(DTW)提出了分频匹配策略,实现了在频率域上“由粗及细”地匹配,使语音词汇的识别做到更准确、更快速。实验证明了该方法的正确性和可行性。 相似文献
7.
基于改进 SIFT的图像快速自适应匹配算法 总被引:7,自引:6,他引:1
目的分析SIFT算法特征点描述子生成比较缓慢和匹配过程距离比阈值无法自适应调节的问题,探索一种改进SIFT的图像快速自适应匹配算法。方法通过简化特征点描述子的生成过程,提高算法效率,并通过自适应地调节距离比阈值参数,提高算法的鲁棒性。结果与原算法相比,图像快速自适应匹配算法的匹配点数减少,匹配准确度高,计算时间缩短。结论该算法在匹配效率和准确度方面具有明显优势,能够将计算机视觉用于工业无损检测、印品图像检测、印刷网点图像检测和包装图像检测中,具有较好的推广价值。 相似文献
8.
在分析语音识别原理的基础上设计了一个基于ARM9和嵌入式Linux的嵌入式语音识别系统采用隐马尔可夫(HMM)算法对语音信号进行特征参数序列比较并识别出结果。语音识别子系统由ARM和DSP芯片为核心,配合其他功能电路,能够独立完成语音识别的工作. 相似文献
9.
10.
一种用于主动噪声抑制系统的次级通道特性识别算法的改进 总被引:1,自引:0,他引:1
本文着重研究窄带信号噪声自适应主动抑制技术中的次级通道特性在线识别问题。针对窄带噪声信号,提出了基于自适应陷波器的次级通道特性在线识别算法,该方法利用自适应陷波器技术解决在线识别时存在的激励信号干扰问题,从而提高次级通道特性在线识别的速度。同时研究了选定参数对算法性能的影响。仿真结果表明,基于自适应陷波器的次级通道特性在线识别算法能较大程度的提高对次级通道特性的识别速度。 相似文献
11.
12.
为了使语音识别真正从实验室走入日常生活,本文设计一个ARM语音识别控制器,以ARM芯片为核心,搭建硬件平台,并结合孤立词语音识别DTW算法,在搭建的硬件平台上进行实验。实验结果表明,本系统具有较高的识别率。根据智能家居的特点,结合Zig Bee网络协议,把系统设计成一个嵌入式子系统,从而语音信号对家居设备更加实时、方便的控制。 相似文献
13.
14.
鲁棒语音识别技术在人机交互、智能家居、语音翻译系统等方面有重要应用。为了提高在噪声和语音干扰等复杂声学环境下的语音识别性能,基于人耳听觉系统的掩蔽效应和鸡尾酒效应,利用不同声源的空间方位,提出了基于双耳声源分离和丢失数据技术的鲁棒语音识别算法。该算法首先根据目标语音的空间方位信息,在双耳声信号的等效矩形带宽(Equivalent Rectangular Bandwidth,ERB)子带内进行混合语音信号的分离,从而得到目标语音的数据流。针对分离后目标语音在频域存在频谱数据丢失的问题,利用丢失数据技术修正基于隐马尔科夫模型的概率计算,再进行语音识别。仿真实验表明,由于双耳声源分离方法得到的目标语音数据去除了噪声和干扰的影响,所提出的算法显著提高了复杂声学环境下的语音识别性能。 相似文献
15.
16.
为了克服噪声对语音识别系统的影响,提出了一种基于主曲线的说话人自适应方法,这种方法可以通过一组主曲线描述所有状态的特征统计信息和码本参数之间的关系,并利用特征统计量在主曲线上的投影更新码本.当有背景噪声存在时,这种方法可以有效修正状态的特征统计信息以减弱或去掉噪声的影响.在863大词汇量连续语音识别数据库上的实验结果证明:这种方法相对于基线以及本征音说话人自适应算法,系统识别性能都有明显的提高. 相似文献
17.
18.
19.
目的针对当前较多图像修复算法难以根据不同纹理结构来自适应调整修复块的尺寸,导致修复结果中存在不连续效应和模糊效应等不足,提出一种结合匹配调节法则和梯度约束模型的图像修复算法。方法首先,利用平滑因子对置信度项进行约束,构造优先级判定模型,对待修复块的优先级进行度量,确定优先修复块。随后,通过SSD模型度量样本块之间的匹配结果,并根据匹配结果制定匹配调节法则,使得样本块能根据匹配度自适应调节其大小,以提高修复质量。最后,将梯度模值块中像素点的均方距离度量结果与样本块中像素点相结合,构造梯度约束模型,用以获取最佳匹配块对待修复块进行填充修复。结果实验结果表明,与当前图像修复算法相比,该算法修复的图像具有更好的修复质量,在像素丢失率较高的情况下,仍然具有较高的相似度值。结论所提算法具备较好的修复视觉质量,可用于被大面积损坏图像的修复。 相似文献