共查询到15条相似文献,搜索用时 62 毫秒
1.
2.
3.
介绍了一个基于32位OpenRISC1200开放源码微处理器内核的小词汇量孤立词语音识别系统结构。根据软硬件协同设计方法,研究和比较了孤立词语音识别各个环节的计算量,合理分配软硬件资源,并提出一种适合FPGA(现场可编程门阵列)实现的动态时间规正硬件实现思路,大大缩短识别响应时间。该系统在成本和知识产权方面都较市场上流行的ARM、8051等内核有优势。实验结果表明,在特定场合下,该系统对于100个词组的平均识别响应时间少于2s,特定人识别率95%以上,非特定人识别率87%以上。 相似文献
4.
5.
语音识别技术已在通信及控制等领域得到广泛应用,针对孤立词语音识别矢量量化中LBG算法对初始码书选择敏感,容易陷入局部最优、泛化能力不强的缺点,将免疫粒子群优化算法(IPSO)和LBG算法结合进行聚类分析,从而得到基于IPSO-LBG的码书设计方法,并将其用于基于离散隐马尔可夫模型(DHMM)的孤立词语音识别系统中。通过实验,与传统LBG算法的DHMM孤立词语音识别系统的识别结果相比,证明了改进的系统有较好的识别率和适应性。 相似文献
6.
7.
8.
基于DTW改进算法的孤立词识别系统的仿真与分析 总被引:5,自引:0,他引:5
传统的DTW算法在进行孤立词语音识别时着重于时间规整和语音测度的计算,而没有对数据的可靠性和有效性进行分析。本文提出了一种改进的端点检测算法,并采用一种改进的DTW算法,在计算机上进行了仿真。实验结果表明采用改进后的DTW算法有效的降低了识别时间和存储数据量,提高了系统性能。 相似文献
9.
本文综述了语音识别研究中应用的主要算法和技术。首先详细地分析了以词为基元的孤立语音识别系统的实现方式,然后结合连续语音识别,介绍了利用语言知识的以子词为基元的识别思想。文中还介绍了语音识别器的典型应用和当前国际上的研究动态。 相似文献
10.
本文提出了两种在最大似然线性回归(MLLR)框架下实现快速说话人自适应的方法.这两种方法在本文中分别称为Log-谱域下基于三对角转换矩阵的说话人自适应(SATD)和倒谱域下基于共享分块对角转换矩孟加拉国 说话人自适应(SASBD).这两种方法在一定先验知识的基础上采用较少的参数来描述说话人间的差异,因而只需要少量的自适应数据就可以得到参数的鲁棒估计.在以整词建模的孤立词识别系统和以三音子建模的孤立词识别系统上分别进行的测试表明所提出的方法相对传统的MLLR自适应方法有较快的自适应性能. 相似文献
11.
隐马尔可夫模型(HMM)已成为语音识别中的主流技术,首先介绍了语音识别技术的原理和结构,然后介绍了HMM的三个基本问题及其解决方法,最后利用Matlab仿真工具设计了一个孤立词的语音识别系统,实现了数字0~9的识别. 相似文献
12.
We investigate the performance of an isolated word speech recognition (IWSR) system for degraded speech. We propose a recognition scheme which adapts itself to mild degradations in speech and improves the reliability of recognition significantly. The scheme does not use a priori information regarding the nature and extent of noise. We suggest techniques which adaptively discriminate between noisy and noise-free parameters by using a selective weighting procedure in the final distance calculation. A new measure of performance is adopted to compare several recognition schemes using small data sets. Our scheme lends itself to greater flexibility in handling degradations in speech input than do the existing recognition schemes. 相似文献
13.
采用动态时间归正算法(DTW)和支持向量机(SVM)相结合产生一个新的基于径向基函数的DTW核函数实现语音识别,该方法在小词汇量及孤立词识别方面相对传统的隐马尔可夫模型有较大优势。为了满足语音识别系统对实时性和便携性的要求,提出了基于DTW/SVM的混合方法在TMS320C6711DSP芯片中实现的应用研究;给出了语音识别系统的原理框图,其中采用Mel倒谱系数为语音特征参数,应用了可变窗长端点检测技术;阐述了DSP设计中系统的软硬件设计方案及具体的接口电路,该系统使得语音识别更为快速便捷,并且具有一定的通用性。 相似文献
14.
设计了一个嵌入式语音识别系统,该系统硬件平台以ADSP-BF531为核心,采用离散隐马尔可夫模型(DHMM)检测和识别算法完成了对非特定人的孤立词语音识别。试验结果表明,该系统对非特定人短词汇的综合识别率在90%以上。该系统具有小型、高速、可靠以及扩展性好等特点;可应用于许多特定场合,有很好的市场前景。文中讲述了该系统CODEC、片外RAM、ROM以及CPLD等与DSP的接口设计,语音识别运用的矢量量化、Mel倒谱参数、Viterbi等有关算法及其实际应用效果。 相似文献
15.
为了解决传统氦语音处理技术存在的处理速度慢、计算复杂、操作困难等问题,提出了一种采用机器学习的氦语音识别方法,通过深层网络学习高维信息、提取多种特征,不但解决了过拟合问题,同时也具备了字错率(Word Error Rate,WER)低、收敛速度快的优点。首先自建氦语音孤立词和连续氦语音数据库,对氦语音数据预处理,提取的语音特征主要包括共振峰特征、基音周期特征和FBank(Filter Bank)特征。之后将语音特征输入到由深度卷积神经网络(Deep Convolutional Neural Network,DCNN)和连接时序分类(Connectionist Temporal Classification,CTC)组成的声学模型进行语音到拼音的建模,最后应用Transformer语言模型得到汉字输出。提取共振峰特征、基音周期特征和FBank特征的氦语音孤立词识别模型相比于仅提取FBank特征的识别模型的WER降低了7.91%,连续氦语音识别模型的WER降低了14.95%。氦语音孤立词识别模型的最优WER为1.53%,连续氦语音识别模型的最优WER为36.89%。结果表明,所提方法可有效识别氦语音。 相似文献