首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
基于DSP的语音识别系统的设计与实现   总被引:2,自引:0,他引:2  
一种基于定点数字信号处理器TMS320VC5402的实时语音识别系统。能够实现非特定人、小词汇表、孤立词的语音识别。系统以线性预测倒谱参数为特征参数,采用动态时间归整识别模型,在小词汇量特定人条件下,该系统的正识率可达到98%以上,在非特定人情况下正识率在93%以上。  相似文献   

2.
系统以16位数字信号处理器TMS320VC5502为核心,采用音频Codec芯片TLV320AIC23对语音信号进行采集和编码转换,通过端点检测、特征参数提取、DTW算法等关键技术实现特定人、小词汇量、孤立词的语音识别,最终根据LED闪灯次数检测数字0~9的识别结果。  相似文献   

3.
基于DSP的嵌入式语音识别系统的研究与实现   总被引:3,自引:0,他引:3  
设计并实现了一个特定人、孤立词和小词汇量的嵌入式语音识别系统.系统硬件的核心芯片采用普遍使用的16位定点DSP芯片TMS320VC5416,软件上主要采用动态时间规整算法来实现语音识别.给出了系统整体的软硬件框架,并比较和分析了分别将线性预测倒谱参数和美尔频标倒谱参数作为语音特征参数时系统的性能,为语音识别的嵌入式应用提供了参考依据.  相似文献   

4.
基于智能家居控制的嵌入式语音识别系统   总被引:1,自引:0,他引:1  
通过分析嵌入式语音识别技术和智能家居控制的原理,设计了基于智能家居控制的一种非特定人孤立词的语音识别系统.该系统由ARM 11处理器和WM9713语音处理等核心芯片组成,采用WinCE操作系统.测试表明,嵌入式语音识别系统具有较高的识别率、实时性和易于实现的特点.该识别系统为智能家居提供方便、准确的设计方案,有广泛的市场前景.  相似文献   

5.
将几种不同的分级结构神经网络用于非特定人的汉语孤立音识别,比较了它们的不同性能,实验结果表明,针对一定词汇表,确定适合的分极结构,可以使非特定人的语音识别达到较高的识别率。  相似文献   

6.
一种SVM多类分类算法用于抗噪语音识别   总被引:1,自引:0,他引:1  
为提高机器学习的推广能力,解决语音识别系统在噪声环境中识别率变差等问题,采用改进的MFCC语音特征参数,用支持向量机(SVM)作为语音识别系统的识别网络,对SVM多类分类问题采用"一对一"分类算法,实现了一个汉语孤立词非特定人中等词汇量的抗噪语音识别系统。实验结果表明,SVM线性核函数和多项式核函数具有较好分类结果;当工作在不同信噪比情况下,SVM语音识别系统有较高的识别率,训练时间也能大为缩减,具有较的好鲁棒性。  相似文献   

7.
为提高噪声环境下的语音识别准确率,提出一种改进的语音特征提取算法。该算法采用模拟人耳听觉特性的非线性幂函数提取一种新的耳蜗滤波倒谱系数,并在特征提取前端引入谱减法对信号进行增强,将提取到的新的特征及其一阶差分组成一种混合特征参数;再联合主成分分析对该混合特征进行降维,将最终得到的特征用于一个非特定人、孤立词、小词汇量的语音识别系统。实验结果表明:采用非线性幂函数提取的耳蜗滤波倒谱系数特征与传统的耳蜗滤波倒谱系数特征相比,明显提高了语音识别准确率;混合特征参数相比单一特征能达到更佳的语音识别性能;结合主成分分析后的特征集在信噪比为0dB时的识别正确率可达到88.10%。  相似文献   

8.
DSP语音识别电梯控制系统的设计和实现   总被引:1,自引:1,他引:0  
针对多人乘坐电梯时按键不是很方便的问题,设计了一种简单的DSP语音识别电梯控制系统。以TMS320C6713 DSP芯片作为系统运算控制中心,TLV320AIC23B芯片作为语音输入、输出的模拟前端,EP2C5Q208C8 FPGA芯片作为系统IO扩展,以这3个部分的有机结合实现了非特定人、孤立词、小词汇量的嵌入式语音识别电梯控制。测试结果显示:所设计的系统结构合理,语音识别电梯控制准确度达8 0%。  相似文献   

9.
提出了一种基于仿生模式识别理论的非特定人连续语音关键词识别的新算法.该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类关键词训练网络的距离随时间变化的曲线,通过动态搜索距离曲线上谷值的大小和数目来判断有多少关键词.通过对小词汇量、不同语速条件下的连续语音的测试,得到了良好的识别结果,验证了此方法的有效性.  相似文献   

10.
彝语的语音识别与处理是语音信号处理领域的一个新方向.本文在深入分析彝语特点的基础上,对用于汉语孤立词识别的经典端点检测算法进行了改进.探讨了动态时间规整算法(Dynamic Time Warping,DTW)和高效动态时间规整算法(Efficient DTW,EDTW)在彝语孤立词识别中的应用,并提出了两种新算法:基于音节个数的动态时间规整算法(Syllable Number Based Improved DTW,SDTW)和基于音节个数的高效动态时间规整算法(Syllable Number Based Improved EDTW,SEDTW),对特定的彝语语音信号进行识别.实验结果表明,所提出的两种新算法分别在信号识别率和识别时间上比经典算法优越.  相似文献   

11.
目的研究用自然语言向智能家居系统进行信息输入和对相关设备的控制及语音识别控制器设计.方法通过对语音信号特点和识别技术的分析,对语音识别系统的语音特征提取、声学模型与模式匹配、语言模型与语言的处理,阐述了HMM算法和DP匹配的语音识别算法,指出孤立词识别系统结构的特点.结果利用TSG110芯片,给出语音识别控制器的识别技术和系统硬件结构、软件设计及组成方法.结论语音识别技术运用于智能家居系统的语音识别控制器,使其具有语音分析、识别和系统控制等功能,实现信息输入与控制.  相似文献   

12.
为了提高混噪语音的识别率,对以往功率谱相减法进行了数理解析,指出了其不足之处。针对某些混有频率成份较少的噪音的语音,提出了一种新的功率谱相减法,给出了相应的处理算法,并运用这种新的功率谱相减法进行了仿真语音识别实验,实验结果证明了这种新的功率谱相减法的正确性和有效性。  相似文献   

13.
针对语音识别过程中环境噪声干扰大的问题,提出一种基于经验模态分解(EMD)与动态时间规整 (DTW)相结合的孤立词识别算法。该方法利用EMD 算法,首先将提取的性能不好的语音信号分解成若干个基本模函数(IMF),去掉原始信号中的干扰和噪声。然后,基于DTW 算法,采用短时过零率和短时能量对语音信号进行端点检测,提取语音特征参数后与参考模板进行匹配。将参考模板与待测模板之间的最短路径作为识别结果。仿真结果表明,该算法能够提高语音的识别效率和识别的正确率。  相似文献   

14.
在汉语大词汇量连续语音识别中,以往基于最大后验概率准则解码得到的识别结果具有最小的句子错误率,为了得到字错误率最小的识别结果,可以采用最小贝叶斯风险解码策略,通过将识别输出的word lattice转换成为混淆网络以得到最小字错误率的识别结果。在以往混淆网络算法的基础上,根据汉语语言的特点,提出一种改进的构造混淆网络的算法。基于863测试语音库进行的实验表明,与最大后验概率识别结果和以前的两种混淆网络算法的识别结果相比,改进的混淆网络算法有效地降低汉语大词汇量连续语音识别结果的字错误率。  相似文献   

15.
仿生模式识别基本原理应用到非特定人连续语音识别中,在构建语音模型时,将高维空间点覆盖的理论应用到非特定人的连续语音识别的学习过程中,在识别时,采用高维空间覆盖动态搜索的方法,对连续语音进行动态搜索,这样就可以避免因分割错误而带来的错误识别.通过实验得到了较为满意的识别结果。  相似文献   

16.
语音情感识别是情感计算领域的一个重要分支,研究者们尝试从多种角度对其展开不懈研究。本文从可视化的角度出发,提出了基于信息可视化的情感识别方法,原始语音情感特征经过图表示映射为包含内部数据结构信息的新型情感图特征,在一定程度上促进了语音情感识别系统的性能提高。另外,还将信息可视化技术应用到情感识别结果的表达上,实现情感信息的生动描述和高效表达。在信息可视化技术和语音情感识别研究充分融合的基础上,构建了一个完整的语音情感信息可视化模型,作为系统实现的基础。  相似文献   

17.
针对在说话人识别过程中经典的高斯混合模型(Gaussian Mixture Model,GMM)阶数的确定具有很大随意性的问题,提出采用吸引子传播聚类方法(AP聚类)自动获取GMM的阶数,进而实现说话人识别的方法.首先,采用Mel频率倒谱系数法(MFCC)与差分倒谱相结合的方法,提取语音特征参数;其次,采用吸引子传播聚类方法(AP聚类)对语音特征参数进行聚类处理,从而自动获得GMM的阶数;在此基础上进行GMM模型的训练;最后,采用训练好的GMM模型对Timit标准语音库以及自制网络志愿者语音库进行说话人识别测试实验.实验结果为:使用了AP聚类算法获取GMM阶数的情况下,对Timit标准语音库的测试结果为100%;在自制网络志愿者语音库中,训练样本为168个,其中潮汕话样本10个,湖南话样本10个,测试样本为42个,测试结果为97.6%.实验结果表明,引入AP聚类自动获取GMM的阶数,可以显著提高说话人识别的精度和效率.  相似文献   

18.
结构面广泛分布于岩体之中,难以逐一进行分析。现有研究方法存在对初始信息敏感,分组结果可靠性差,以及难以准确对产状相近的结构面进行分组等不足。针对上述问题,提出了一种基于鹈鹕优化算法(POA)的岩体结构面分组方法。首先,利用POA算法全局寻优初始聚类中心,结合模糊C均值算法(FCM)将结构面产状数据进行完全分组。其次,利用蒙特卡罗模拟技术,生成符合Fisher分布的产状数据。最后,基于正交设计,对比传统FCM算法,以识别错误率为指标,研究了新算法在不同结构面数量、结构面组数、聚类中心、离散度情况下分组精度的变化规律。结果表明:聚类中心对分组精度具有显著影响;所提方法能对产状极点边界不清晰的结构面数据进行有效分组,可有效提高分组精度和分组结果的可靠性。以大连某水库边坡结构面数据为基础,对其进行分组处理,验证了新方法的工程实用性。研究结果可以为结构面三维网络计算机模拟和岩体工程稳定性分析提供依据。  相似文献   

19.
湖南省内生矿产资源丰富,内生成矿事件主要有加里东期(以志留纪为主)、印支晚期(晚三叠世)、燕山中晚期(晚侏罗世—早白垩世)等3期。以区域矿产资料为基础,结合大地构造、成岩成矿年龄、矿床成因机制等研究成果,对上述3期内生成矿事件的构造格局控矿特征和动力机制进行探讨。①受加里东运动自东南向西北扩展以及深部岩石圈结构差异控制,加里东期湖南省自东南往西北分为成矿特征有别的3个构造带。湘中—湘东南构造岩浆带(Ⅰ)发生后碰撞花岗质岩浆活动,于局部产生与岩浆活动相关的W、萤石等成矿作用; 雪峰构造带(Ⅱ)东部的雪峰冲断带(Ⅱ1)形成了以构造活化成因为主的金矿和锑金矿; 雪峰构造带(Ⅱ)西部的武陵低缓褶皱带(Ⅱ2)及湘西北构造抬升带(Ⅲ)内形成了与寒武纪同沉积断裂活动、加里东运动后的伸展活动以及相应的热液活动有关的汞铅锌矿。②印支晚期受深部岩石圈结构差异控制,湖南省自东南至西北分为3个构造带:湘中—湘东南构造岩浆带(Ⅰ)因后碰撞减压熔融而发生大规模花岗质岩浆活动,从而于其东南部形成钨锡铅锌多金属矿床,西北部形成锑金钨多金属矿床; 雪峰构造带(Ⅱ)可能无内生热液成矿作用; 湘西北褶皱带(Ⅲ)发育小型脉型铅锌矿。③燕山中晚期,湖南省自东南往西北分为3个构造带:湘中—湘东构造岩浆带(Ⅰ)受岩石圈拆沉、软流圈上隆、陆内碰撞后期增温减压、俯冲板块崩塌等深部构造作用控制而发生大规模花岗质岩浆活动,形成了大量的有色金属矿床和金矿床; 雪峰西部构造带(Ⅱ)成矿作用弱,局部存在Au、Hg成矿作用; 湘西北褶皱带(Ⅲ)发育少量低温热液充填型萤石矿和砷矿。  相似文献   

20.
In order to overcome defects of the classical hidden Markov model (HMM), Markov family model (MFM), a new statistical model was proposed. Markov family model was applied to speech recognition and natural language processing. The speaker independently continuous speech recognition experiments and the part-of-speech tagging experiments show that Markov family model has higher performance than hidden Markov model. The precision is enhanced from 94.642% to 96.214% in the part-of-speech tagging experiments, and the work rate is reduced by 11.9% in the speech recognition experiments with respect to HMM baseline system.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号