首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
对微软公司的语音软件开发包Microsoft Speech SDK5.1进行了研究,并且总结了利用该开发包基于VC++6.0实现语音识别系统(Speech Recognition)的具体过程。通过对以上理论的研究和探索,设计开发了一个具有语音录入功能的语音识别软件。  相似文献   

2.
张琳琳 《电脑》1997,(6):24-25
自动化语音识别(Automatic Speech Recognition,简称ASR)技术,长期以来一直为各个领域所关注。语音是最符合人类自然习惯的一种通讯方式。语音这一媒体较之其它如  相似文献   

3.
一个语音信息门户的设计与实现   总被引:4,自引:2,他引:2  
语音门户是利用了CTI技术实现电话网与互联网集成的重要部件,支持了用户通过普通电话访问互联网获取信息,是由IVR(Interactive Voice Response)、TTS(Text To Speech)、ASR(Automatic Speech Recognifion)、Voice XML4个子系统组成,该文在一个实用的语音门户系统的基础上,讨论了系统结构以及4个模块的设计实现,系统设计采用面向对象技术、自动机技术将板书、通道以其语音合成、识别等资源有机集成在一个系统内,方便了系统设计与功能扩充。  相似文献   

4.
论文在基于Intel PXA270嵌入式微处理器开发平台上实现了WinCE操作系统的定制和移植;并结合WINCE5.0语音接口Speech Applicafion Programming Interface(SAPI 5.0),使用Embedded Visualc++4.0(EVC)成功开发嵌入式语音识别系统。  相似文献   

5.
基于Microsoft语音识别引擎的语音识别系统的设计   总被引:1,自引:0,他引:1  
为了改变人们按键操纵计算机的传统概念和习惯,实现真正意义上的人机对话,结合实例阐述了用Microsoft Speech SDK5.1实现中文语音交互的方法,可应用于各种中文语音交互公共信息服务系统。介绍了基于Microsoft语音识别引擎的语音识别系统的总体结构与设计思路,最后付诸实现。  相似文献   

6.
随着移动设备的快速发展,使得语音识别系统大量地从实验室的PC平台转移到嵌入式设备中。将嵌入式语音识别与现有的嵌入式平台的各种应用软件相结合,能够使现有的各种应用软件(包括操作系统)增添便利的人机交互的语音界面。论文在基于Intel PXA270嵌入式微处理器开发平台上实现了WinCE操作系统的定制和移植:并结合WINCE5.0语音接口Speech Application Programming Interface(SAPI5.0),使用Embedded Visual C++4.0(EVC)成功开发嵌入式语音识别系统。  相似文献   

7.
针对现有的助听器语音增强算法在非平稳噪声环境下,残留大量背景噪声的同时还引入了“音乐噪声”,致使增强语音可懂度和信噪比不理想等问题。提出了一种基于噪声估计的二值掩蔽语音增强算法,该算法利用人耳听觉感知理论,结合人耳的听觉特性和耳蜗的工作机理。采用最小值控制递归平均(Minima-Controlled Recursive Averaging,MCRA)算法获得估计噪声和初步增强语音;将估计噪声和初步增强语音分别通过可以模拟人工耳蜗模型的gammatone滤波器组进行滤波处理,得到各自的时频表示形式;利用人耳的听觉掩蔽特性,计算含噪语音在时频域的二值掩蔽;利用二值掩蔽得到增强语音。实验结果表明:该算法很大程度上去除了谱减法引入的“音乐噪声”,与基于MCRA谱减法相比,增强语音的语言可懂度指数(Speech Intelligibility Index,SII)、主观语音质量评估(Perceptual Evaluation of Speech Quality,PESQ)和信噪比(Signal to Noise Ratio,SNR)都得到了提高。  相似文献   

8.
为使智能机器人远程控制更加方便、快捷、人性化,设计并实现了一种智能机器人的语音远程控制系统方案。该方案利用微软语音开发包Microsoft Speech SDK,构建基于听写模式的大词汇量语音识别模块和语音合成模块,利用海量中文智能分词组件构建关键词检测模块,结合VFW(Video For Windows)技术与无线网络技术构建信息传输模块。实验表明,该系统语音识别准确率高,识别范围广,语音输入灵活。  相似文献   

9.
介绍了Microsoft Speech SDK的功能以及相关的一系列API函数,分别利用其语音识别(Speech Recognition)引擎和语音合成(Textto Speech)引擎实现英文语音识别和中文文本语音合成功能,采用Access 2003数据库的查询操作完成翻译功能,进而实现整个英文到中文的学习系统,该系统具有很高的商业价值。  相似文献   

10.
基于混合模型HMM/RBF的数字语音识别   总被引:5,自引:0,他引:5  
王朋  陈树中 《计算机工程》2002,28(12):136-138
提出一种离散隐马尔科夫模型(hidden Markov model,HMM)和径向基函数(radial basis function,RBF)神经网络相结合应用于汉语数码语音识别(Mmandarin Ddigit Speech Recognition,MDSR)的方法,同时采用了一系列改进方法,使汉语数码语音的识别率达到了99.7%。  相似文献   

11.
本文介绍了Java Speech API(JSAPI)规范的语音识别引擎的系统框架,描述了采用已有的C/C 识别引擎实现JSAPI语音识别引擎的思路和实现策略,提出并分析了以事件处理和状态处理为核心来实现JSAPI规范的具体方法,完成了基于JSAPI规范的语音识别软件系统的实现。  相似文献   

12.
孔祥勇  宋健 《计算机与现代化》2009,(10):175-178,181
针对处方系统手工输入处方效率低的问题,开发一款基于语音识别技术的中医处方信息系统.该系统使用微软语音开发平台Microsoft Speech SDK(SAPI 5.1)实现通过预先设定的语音特征库,检索医师报出的中药名及剂量,查询药品数据库,语音识别准确率极高,减轻了医生的工作量.  相似文献   

13.
基于Speech SDK的语音控制应用程序的设计与实现   总被引:19,自引:1,他引:19  
分析了微软Speech SDK5.1里语音应用程序接口(SAPI)的结构和工作原理,提出了语音控制应用程序的设计方法,并以“Z Z智能教学平台的语音识别接口”的设计为例,展示了这类系统的主框架和关键技术。  相似文献   

14.
使用VB中SPI提供的Direct Speech recognition控件,创建了语音识别的VB应用程序。本文的应用程序具有语音“命令与控制”功能,同时也作为一些复杂语音识别程序开发的核心部分。  相似文献   

15.
使用SAPI实现语音识别与合成   总被引:2,自引:0,他引:2  
本文对Speech SDK中的主要组件接口进行详细介绍,探讨了语音应用的编程实现技术,最后结合一个实例加以具体说明.  相似文献   

16.
介绍了Mircosoft Speech SDK中与语音识别有关的接口,讨论了在Visual Basic编程环境下,使用该开发包进行孤立词语音识别的方法,最终结合具体的项目给出了实践过程。  相似文献   

17.
Microsoft公司最近推出了一套全新的语音识别系统Microsoft Speech API5.0。该系统采用了COM体系结构,全面支持中文语音的输入和合成。本文将主要介绍SAPI5.0的主要体系结构,并通过一个简单的语音应用程序介绍SAPI5.0的实现方法。  相似文献   

18.
面向汉语的计算机辅助语音学习系统特征的研究   总被引:2,自引:0,他引:2  
本文在分析了语言及语音学习和教学的重要性及特点的基础上,讨论了将语音处理技术应用于语言、语音的计算机辅助学习或教学中所涉及的多方面问题;并针对汉语语音的特点,研究了面向汉语学习的CALL系统所应具有的特征,及其在设计和实现时应遵循的原则;最后借助通用语音分析器′Speech Analyzer′进行了汉语语音学习的尝试。  相似文献   

19.
随着三维仿真技术的不断发展,简单的人机交互方式已经不能满足人们对仿真环境真实感和沉浸感的要求.针对于此,提出了将基于Speech SDK5.1的语音识别技术应用到三维仿真平台的构想,分析了Speech SDK5.1的工作原理,着重研究了其语音识别接口,对将语音识别应用到三维仿真程序中的可能性和关键技术进行了研究.提出了一种实现动态词汇识别的方法,并通过一个简单的实例展示了实现这类技术的框架和方法,对设计有语音识别功能的三维仿真程序有一定的参考价值.  相似文献   

20.
引言 随着社会经济建设的飞速发展,教育、交通、金融、旅游等领域对语音播报的需求不断增长.TTS (Text To Speech)文本转换语音技术是人机智能对话发展的趋势,利用此技术,通过MCU或者PC机控制语音芯片发音,能够实现多种场合下的文字即时阅读功能,如公交车报站、电子文本教材诵读、旅游导览语音服务、排队读序号等,这无疑在提高人机通信效率、提升系统服务质量、减轻人们工作强度等方面都有极大的好处.基于TTS技术的语音系统无需事先录音就能够随时根据查询条件查出并合成语音进行播报,从而大大减少了系统维护的工作量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号