期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

冷冰涛梁维谦董保帅原道德《电声技术》2011,35(11):42-45

基于线性网络的孤立词识别系统识别时间与词表规模成正比,识别性能严重受限于词表的规模.根据汉语孤立词特点,提出了一种基于连续识别的大词表孤立词识别系统.该系统围绕嵌入式识别所关注的速度和内存消耗性能,采用先实现应用多级搜索、定点化策略的连续识别,再对连续识别的识别结果进行音字转换处理的方法,将连续语音识别应用于大词表孤立... 相似文献

2.

基于单片机控制的孤立词语音自动识别系统设计

周红锴《现代电子技术》2020,(18):64-66+70

由于孤立词语音自动识别技术具有操作简便,方便日常生活的特点,因此该文设计基于单片机控制的孤立词语音自动识别系统。系统采用型号为SH86270主控单片机接收由SH69P848AM芯片控制的语音识别电路输出结果,通过A/D转换器得到离散数字语音信号,将孤立词语音信号转换为电信号,再经A/D转换器转换为数字信号后输入系统进行预处理。采用动态时间规整算法获取距离最短语音信息,得到孤立词语音识别结果。实验结果表明,该系统具有较好的声学相似性,可有效识别出测试的孤立词语音信号与标准信号的最小距离,识别率和滤除干扰率均很高,识别时间短,识别效果显著。相似文献

3.

基于DTW算法的语音识别系统实现 总被引：10，自引：0，他引：10

吴晓平崔光照路康《电子工程师》2004,30(7):17-19

动态时间归整(DTW)算法的实现简单有效,在孤立词语音识别系统中得到了广泛的应用.介绍了将DTW算法移植到TMS320VC5402上实现孤立词语音识别的原理、系统硬件组成和软件设计.研究结果表明,系统能满足实时性能要求,识别效果良好. 相似文献

4.

基于OpenRISC1200的孤立词识别系统设计与实现

李彬贺前华齐凡《电子工程师》2006,32(11):44-47

介绍了一个基于32位OpenRISC1200开放源码微处理器内核的小词汇量孤立词语音识别系统结构。根据软硬件协同设计方法，研究和比较了孤立词语音识别各个环节的计算量，合理分配软硬件资源，并提出一种适合FPGA（现场可编程门阵列）实现的动态时间规正硬件实现思路，大大缩短识别响应时间。该系统在成本和知识产权方面都较市场上流行的ARM、8051等内核有优势。实验结果表明，在特定场合下，该系统对于100个词组的平均识别响应时间少于2s，特定人识别率95％以上，非特定人识别率87％以上。相似文献

5.

基于DTW算法语音识别系统的仿真及DSP实现

陈锡锻王瑞肖雄洪涛《电声技术》2013,(12):66-69

DTW（DynamicTimeWarping）算法的实现简单有效,在孤立词语音识别系统中得到了广泛的应用。采用谱减法进行前端去噪处理,利用Matlab对语音识别系统进行了仿真,并设计了一种以16位数字信号处理器TMS320VC5509为核心的孤立词语音识别系统。实验结果表明,系统能满足实时性能要求,识别效果良好。相似文献

6.

免疫粒子群改进LBG的孤立词语音识别算法研究

王凯《数字技术与应用》2013,(1):111-113

语音识别技术已在通信及控制等领域得到广泛应用,针对孤立词语音识别矢量量化中LBG算法对初始码书选择敏感,容易陷入局部最优、泛化能力不强的缺点,将免疫粒子群优化算法(IPSO)和LBG算法结合进行聚类分析,从而得到基于IPSO-LBG的码书设计方法,并将其用于基于离散隐马尔可夫模型(DHMM)的孤立词语音识别系统中。通过实验,与传统LBG算法的DHMM孤立词语音识别系统的识别结果相比,证明了改进的系统有较好的识别率和适应性。相似文献

7.

噪声环境下顽健的语音识别系统

韩纪庆王承发吕成国张磊任为民马永林《电声技术》2002,(1):27-29

开发了一高噪声环境下特定人孤立词的语音识别系统，讨论了系统性能的考核情况，考核实验表明，系统在80dB以下噪声环境下工作，精度较高；在100dB的高噪声环境下，识别率高于96％，系统仍可使用。相似文献

8.

基于CHMM的语音识别仿真系统实现

李浩亮靳双燕贾伟伟《电声技术》2013,(12):75-78

介绍了一种基于连续M元高斯混合密度的隐马尔可夫模型（HMM）的非特定人孤立词语音识别仿真系统。通过研究模型状态数、训练时间以及特征参数选取对语音识别率的影响,得出HMM状态数取4,训练次数为20次,特征参数选取48维LPCC和MFCC的混合参数,可使语音识别系统对于汉语孤立词的识别率达到90％。相似文献

9.

基于DTW改进算法的孤立词识别系统的仿真与分析 总被引：5，自引：0，他引：5

林波吕明《信息技术》2006,30(4):56-59

传统的DTW算法在进行孤立词语音识别时着重于时间规整和语音测度的计算，而没有对数据的可靠性和有效性进行分析。本文提出了一种改进的端点检测算法，并采用一种改进的DTW算法，在计算机上进行了仿真。实验结果表明采用改进后的DTW算法有效的降低了识别时间和存储数据量，提高了系统性能。相似文献

10.

语音识别技术及其发展

许利群陈永彬《电信科学》1988,(12)

本文综述了语音识别研究中应用的主要算法和技术。首先详细地分析了以词为基元的孤立语音识别系统的实现方式,然后结合连续语音识别,介绍了利用语言知识的以子词为基元的识别思想。文中还介绍了语音识别器的典型应用和当前国际上的研究动态。相似文献

11.

基于HMM的语音识别系统的Matlab仿真

沈泉波《电声技术》2012,36(10):56-57,70

隐马尔可夫模型(HMM)已成为语音识别中的主流技术,首先介绍了语音识别技术的原理和结构,然后介绍了HMM的三个基本问题及其解决方法,最后利用Matlab仿真工具设计了一个孤立词的语音识别系统,实现了数字0～9的识别. 相似文献

12.

On improvement of performance of isolated word recognition for degraded speech

B. Yegnanarayana Sarat Chandran Anant Agarwal 《Signal processing》1984,7(2):175-183

We investigate the performance of an isolated word speech recognition (IWSR) system for degraded speech. We propose a recognition scheme which adapts itself to mild degradations in speech and improves the reliability of recognition significantly. The scheme does not use a priori information regarding the nature and extent of noise. We suggest techniques which adaptively discriminate between noisy and noise-free parameters by using a selective weighting procedure in the final distance calculation. A new measure of performance is adopted to compare several recognition schemes using small data sets. Our scheme lends itself to greater flexibility in handling degradations in speech input than do the existing recognition schemes. 相似文献

13.

基于DTW/SVM的语音识别系统在DSP中的实现

李攀杨玮龙厉剑《电声技术》2006,(9):40-44

采用动态时间归正算法(DTW)和支持向量机(SVM)相结合产生一个新的基于径向基函数的DTW核函数实现语音识别,该方法在小词汇量及孤立词识别方面相对传统的隐马尔可夫模型有较大优势。为了满足语音识别系统对实时性和便携性的要求,提出了基于DTW/SVM的混合方法在TMS320C6711DSP芯片中实现的应用研究;给出了语音识别系统的原理框图,其中采用Mel倒谱系数为语音特征参数,应用了可变窗长端点检测技术;阐述了DSP设计中系统的软硬件设计方案及具体的接口电路,该系统使得语音识别更为快速便捷,并且具有一定的通用性。相似文献

14.

ADSP-BF531在嵌入式语音识别系统中的应用

王维强《电子设计工程》2012,20(12):186-189

设计了一个嵌入式语音识别系统,该系统硬件平台以ADSP-BF531为核心,采用离散隐马尔可夫模型(DHMM)检测和识别算法完成了对非特定人的孤立词语音识别。试验结果表明,该系统对非特定人短词汇的综合识别率在90%以上。该系统具有小型、高速、可靠以及扩展性好等特点;可应用于许多特定场合,有很好的市场前景。文中讲述了该系统CODEC、片外RAM、ROM以及CPLD等与DSP的接口设计,语音识别运用的矢量量化、Mel倒谱参数、Viterbi等有关算法及其实际应用效果。相似文献

15.

一种采用机器学习的氦语音识别方法

李冬梅李明郭莉莉张士兵《电讯技术》2022,(9)

为了解决传统氦语音处理技术存在的处理速度慢、计算复杂、操作困难等问题,提出了一种采用机器学习的氦语音识别方法,通过深层网络学习高维信息、提取多种特征,不但解决了过拟合问题,同时也具备了字错率(Word Error Rate,WER)低、收敛速度快的优点。首先自建氦语音孤立词和连续氦语音数据库,对氦语音数据预处理,提取的语音特征主要包括共振峰特征、基音周期特征和FBank(Filter Bank)特征。之后将语音特征输入到由深度卷积神经网络(Deep Convolutional Neural Network,DCNN)和连接时序分类(Connectionist Temporal Classification,CTC)组成的声学模型进行语音到拼音的建模,最后应用Transformer语言模型得到汉字输出。提取共振峰特征、基音周期特征和FBank特征的氦语音孤立词识别模型相比于仅提取FBank特征的识别模型的WER降低了7.91%,连续氦语音识别模型的WER降低了14.95%。氦语音孤立词识别模型的最优WER为1.53%,连续氦语音识别模型的最优WER为36.89%。结果表明,所提方法可有效识别氦语音。相似文献