首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
本文介绍了一种基于TMS320C6711 DSP的非特定人、孤立词语音识别系统。本文首先介绍了语音识别技术的基本原理,然后对不同的识别算法在多种嵌入式系统平台上进行性能分析和比较,可得到本语音识别系统具有较高的识别率、实时性和鲁棒性。  相似文献   

2.
特定人孤立词的语音识别系统研究   总被引:1,自引:0,他引:1  
彭辉  魏玮  陆建华 《控制工程》2011,18(3):397-400,404
语音识别是让机器自动识别和理解语音信号,并把语音信号转变为相应的文本或命令的技术.通过对特定人孤立词语音特点的研究,在对语音信号进行预处理的过程中,选择过零率与短时平均能量两项指标作为对语音信号端点检测的依据,提取语音线性预测系数,通过计算分析后获得线性预测倒谱系数,作为语音特征参数.选择动态时间规整法为模板匹配算法,...  相似文献   

3.
在SEED-DEC5502DSP嵌入式系统开发平台上实现了一个面向非特定人的孤立词语音识别系统,和传统的基于特定人的语音识别系统相比,该系统无需用户训练,易于使用。系统采用改进的基于语音对数域能量变化率的实时端点检测算法,只对检测的有声段语音进行特征提取,从而减少了要处理的语音帧数;提出了改进的共享声学单元状态发射概率共享的解码策略,进一步降低了计算负担。实验表明系统在100词条的情况下识别率达到98.1%,识别时间为1.03倍实时。  相似文献   

4.
介绍特定人大词汇量语音识别的单音训练,词汇识别邓在识别时进行词汇识别,样本训练时采用单音训练,实验证明,该方法样本训练工作量小,识别正确率高。  相似文献   

5.
在特定人语音识别系统中,噪声严重影响语音特征提取,并导致语音识别率明显下降。针对在噪声环境下语音识别率偏低的问题,通过谱减法去除语音信号噪声,并根据语音信号语谱图可视化的特点,运用脉冲耦合神经网络从语音信号的语谱图中提取熵序列作为特征参数进行语音识别。实验结果表明,该方法能较好地去除语音信号中的噪声,并能使在噪声环境下的特定人语音识别系统具有较好的识别效果。  相似文献   

6.
基于SCHMM非特定人关键词检出语音识别系统   总被引:1,自引:0,他引:1  
乔跃刚  赵铁军  李生  朱莉 《计算机应用》2005,25(Z1):295-296
设计了一个基于半连续隐马尔可夫模型(SCHMM)以音节为基元的非特定人汉语小词表关键词确认语音识别系统.系统采用类似于Baum_Welch算法对VQ码书和HMM参数一起优化得到可靠的声学模型,并通过利用基于前向-后向搜索策略,来充分利用上下文相关信息,使关键词检出率在每个词每小时虚警率为10时已达到93%以上.还分析了码书大小对系统识别率的影响,并提出了以音节模型归一化算术均值作为关键词置信度的语音验证策略.  相似文献   

7.
8.
现代维吾尔语语音识别研究尚处于超始阶段,在此介绍了基于中心距离连续概率模型(CDCPM)的维吾尔语非特定人语音识别。CDCPM用中心距离正态(CDN)分布描述模型特征空间,去掉了HMM的状态转移概率矩阵A,对HMM进行了简化和改进。在维吾尔语综合语音库上进行的实验表明:恰当地估计模型状态数和模型混合密度数,当模型数为525个,模型状态数为16,混合密度数为24,维吾尔语非特定人语音识别首选正识率达到97.90%(集内)和94.76%(集外),取得了较好的识别效果。同时,指出了进一步开展维吾尔语语音识别研究的几个问题。  相似文献   

9.
10.
基于快速神经网络算法的非特定人语音识别   总被引:4,自引:0,他引:4       下载免费PDF全文
提出一种用于语音识别的改进的快速神经网络算法 ,即动态不等步长的误差分段学习算法。将步长看作误差和网络节点输出的函数 ,对各权值按不同步长进行动态调整 ,并将其应用于一个基于前馈神经网络模型的非特定人语音识别系统。实验表明 ,该算法比传统 BP算法在训练速度上可提高十几倍 ,训练出的语音识别网络系统具有较高的识别率  相似文献   

11.
语音识别中基于i-vector的说话人归一化研究   总被引:1,自引:0,他引:1  
i-vector是反映说话人声学差异的一种重要特征,在目前的说话人识别和说话人验证中显示了有效性。将i-vector应用于语音识别中的说话人的声学特征归一化,对训练数据提取i-vector并利用LBG算法进行无监督聚类.然后对各类分别训练最大似然线性变换并使用说话人自适应训练来实现说话人的归一化。将变换后的特征用于训练和识别.实验表明该方法能够提高语音识别的性能。  相似文献   

12.
本文主要论述了一种小词表语音识别系统的硬、软件设计方法。系统以DSP5416为硬件平台,采用非线性美尔刻度倒谱参数(MFCC)特征参数提取算法,动态时间规整(DTW)作为识别算法,实现了语音识别系统的设计。实验结果表明平均语音识别率不低于90%,取得良好的识别效果。  相似文献   

13.
本文主要论述了一种小词表语音识别系统的硬、软件设计方法。系统以DSP5416为硬件平台,采用非线性美尔刻度倒谱参数(MFCC)为特征参数提取算法,动态时间规整(DTW)作为识别算法,实现了语音识别系统的设计。实验结果表明平均语音识别率不低于90%,取得良好的识别效果。  相似文献   

14.
针对当前大多数基于Web的应用程序主要是根据企业或组织的具体情况进行开发从而无形中造成巨大的资源浪费的现状,提出了一个能为不同Web应用程序提供诸如数据访问、异常处理、安全等通用服务的基础架构。并阐述了利用Microsoft .NET Framework开发环境和C#语言创建这些服务组件的过程。  相似文献   

15.
文章讨论了一个分布式电话语音识别系统的设计与实现。首先介绍了系统的框架结构和基于DCOM的进程间通信;然后给出了系统主要模块的功能和实现方法,并讨论了针对分布式系统和语音识别的特点而进行的性能优化。  相似文献   

16.
Recent technological advances have enabled both the consumption and provision of mobile services (m-services) by small, portable, handheld devices. However, mobile devices still have restricted capabilities with respect to processing, storage space, energy consumption, stable connectivity, bandwidth availability. In order to address these shortcomings, a potential solution is context-awareness (by context we refer to the implicit information related both to the requesting user and service provider that can affect the usefulness of the returned results). Context plays the role of a filtering mechanism, allowing only transmission of relevant data and services back to the device, thus saving bandwidth and reducing processing costs. In this paper, we present an architecture for context-aware service discovery. We describe in detail the system implementation and we present the system evaluation as a tradeoff between a) the increase of the quality of service discovery when context-awareness is taken into account and b) the extra cost/burden imposed by context management.  相似文献   

17.
语音合成与语音识别提供了全新的人机交互方式,在信息处理、教育与商务应用等方面已显示出了巨大的优势。本文分析了MS Agent的工作原理,论述了基于MS Agent的语音系统的开发步骤,给出了系统运行示意图。  相似文献   

18.
通过窄带信道将语音信号传输到远端的识别系统,从而实现远距离的人机对话,具有重要的现实意义。在2.4kbps的速率下,语音编码算法依然可以合成出可懂度非常高的语音,但是这样的语音信号与原始语音相比还是有巨大的损失。低速率语音编码算法对于语音识别产生的影响是巨大的,因此必须想办法减轻这种损失对于识别的损害。在此选择了三种不同的低速率语音编码器,分别使用LPC(Linear Pledictive Coding,线性预测)算法、MELP(Mixed Excitation Linear Prediction,混合激励线性预测)算法和IMBE(Improved Multiband Excitation,增强多带激励)算法,都在2.4kbps的速率下工作,将其对语音识别系统的影响进行了比较。对于特定人连续语音识别系统和非特定人连接词识别系统,在使用不同的特征矢量时,不同编码器产生的识别效果有比较大的差异。实验结果表明,语音编码器和语音识别系统的结构有很重要的联系,尽量采用相近的结构有助于获得良好的识别结果。另外,改变提取语音识别特征参数的方式也会有利于提高语音识别系统的性能。  相似文献   

19.
王让定  杜呈透 《计算机工程》2004,30(17):146-148
研究了基于VQ的有限非特定人汉语语音命令的识别方法,识别对象是有限的特定人群(如5到6人)、有限汉语短语。该文采用MFCC作为识别特征,利用改进的LBG算法训VQ码本,为了提高识别率和拒识率,提出了采用倒谱距离法的有效语音端点检测方法以及实用的拒识方法。实验结果证明,系统在具有背景噪声的一般办公环境下由有限人训练后,当训练的说话人与识别系统的距离在0.5m的范围内时,测试识别率达到99%以上,未训练说话人的拒识率达82%。  相似文献   

20.
在语音识别中,测度计算占用了整个系统的绝大部分时间。文章介绍了利用SSE技术优化测度计算的方法,实验结果说明SSE技术能大幅提高系统的计算效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号