首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 54 毫秒
1.
2.
VoiceXML语音浏览器的研究   总被引:3,自引:0,他引:3  
讨论了如何将VoiceXML浏览器中的一个核心部分-VoiceXML解析器以COM组件的形式实现,为语音应用程序提供服务,并且进一步考虑了用组件技术实现以VoiceXML浏览器为核心的整个语音应答系统的可能。  相似文献   

3.
语音识别浏览器VoiceIE设计与实现   总被引:4,自引:0,他引:4  
语音识别浏览器VoiceIE提供一种全新的语音方式进行Internet WWW浏览适合各类办公自动化系统,特别是其于嵌入式系统的信息家电、PDA等应用领域。本文首先介绍VioceIE的系统结构及功能,然后阐述语音识别模块和浏览器模块的设计与实现方法,对浏览操作与窗口管理中基于COM编程和Internet API 运用,语音信号实时检测与识别中MIC API与互信息匹配模型MIC的运用,以及语音识别模块与浏览器模埠的数据通信等进行了描述。  相似文献   

4.
带噪汉语语音识别的端点检测方法   总被引:4,自引:0,他引:4  
王朋  塔维娜  陈树中 《计算机工程》2003,29(17):120-121,135
在语音识别系统中产生错误识别的原因之一是端点检测有误差,在高信噪比情况下,正确地确定语音的端点并不困难,然而,大多数实际的语音识别系统需工作在低信噪比情况下,一些常规的端点检测方法,例如基于能量的端点检测方法在噪声环境下不能有效地工作。该文利用改进的隐马尔柯夫模型(HMM)进行语音检测以适应噪声的变化,实验结果表明本方法可得到高正确率的带噪语音端点检测。  相似文献   

5.
给出一种适用于在线垃圾模型的基于动态排位信息的关键词确认方法,利用识别过程中声学得分的排位信息进行关键词确认,能在不降低检出率的同时有效降低系统的误警率,效果优于同类方法。该方法不依赖于具体的关键词表,计算简单,能够应用于实际工程中。  相似文献   

6.
设计并实现了一个特定人、孤立词、小词汇量的嵌入式语音识别模块,该模块能够方便地与多种控制芯片接口从而实现不同的功能.在硬件上,使用高速的TMS320VC5402芯片作为模块的运算单元;在软件上,采用谱减法进行前端去噪处理,接着根据谱熵进行语音端点检测,然后提取12维MFCC及其一阶差分作为特征参数,最后用加入模板阈值方法的改进型DTW算法完成整个识别过程.实验结果证明,该语音识别模块在满足实时性的前提下具有良好的识别率和抗干扰性能.  相似文献   

7.
提出了一种基于指数门限(ET)的端点检测方法.ET法为短时能量的概密函数(PDF)建立起统一的语音和噪声模型,根据当前语音数据的信噪比估计出最优的检测门限,并给出了最优检测门限的指数型公式.在“八六三”大词汇量连续语音数据库上的实验结果表明,ET法具有较好的检测性能,在噪声环境中表现出较好的稳健性,信噪比为0 dB时,检测正确率可达89.5%.在信噪比为0~15dB时,检测正确率要明显高于基本能量法、对数能量聚类法(LEC)以及χ2法等语音检测(VAD)方法.  相似文献   

8.
语音浏览器系统能够提供更易为人们所接受的网络浏览模式,拓展了Internet的发展空间。VoiceXML语言是XML语言在语音浏览器方面的应用,文章设计并实现了一个基于VoiceXML技术的语音浏览器系统。  相似文献   

9.
介绍实现语音识别系统的一些基本概念,对双门限端点检测过程用流程图的形式做详细介绍.该系统采用连续隐马尔科夫模型(HMM)进行建模,对实现过程遇到的三个基本问题进行分析并给出了解决方案.利用该系统对不同人的语音命令进行识别,准确率可达95%.  相似文献   

10.
一种改进的检测语音端点的方法   总被引:8,自引:9,他引:8  
在语音识别系统中产生错误识别的原因之一是端点检测有误差。针对短时过零率对噪声的存在非常敏感,本文引入一种判决门限,修正了传统过零率的计算。同时引入窗长动态改变的端点检测方法,并将两者有机的融合到传统的双门限端点检测算法中。试验表明这种算法可以比较精确的检测出语音端点,适合于对端点检测比较敏感的语音识别算法。使用改进后的语音端点检测方法,可以有效地提高语音识别率。  相似文献   

11.
在嵌入式平台下的语音识别系统中,端点检测是非常重要的,语音起始点的位置直接影响识别率。然而在复杂环境下,语音的输入波形千差万别,端点检测的精确性很难保证。本文研究了一种基于零能积的区域概率统计法,通过训练得到语音零能积的概念分布,并结合一阶线性差分及谱减法进行端点检测。进一步提高了信噪比,解决了复杂环境下端点检测精确度低的问题。  相似文献   

12.
一个基于浏览器与组件技术的Web信息发布模型   总被引:2,自引:1,他引:2  
Web信息发布是Internet信息服务发展新的热点,它改变了传统Web信息服务单向的传输方式,实现了“全方位”的信息服务。文章分析了两种传统的Web信息发布模型,提出了一个基于浏览器与组件技术的Web信息发布系统的设计模型。  相似文献   

13.
基于SPEECH SDK的中文学习系统   总被引:1,自引:0,他引:1  
介绍了Microsoft Speech SDK的功能以及相关的一系列API函数,分别利用其语音识别(Speech Recognition)引擎和语音合成(Textto Speech)引擎实现英文语音识别和中文文本语音合成功能,采用Access 2003数据库的查询操作完成翻译功能,进而实现整个英文到中文的学习系统,该系统具有很高的商业价值。  相似文献   

14.
深度学习在语音识别中的研究进展综述   总被引:1,自引:0,他引:1  
在如今的大数据时代里,对于处理大量未经标注的原始语音数据的传统机器学习算法,很多都已不再适用。与此同时,深度学习模型凭借着其对海量数据的强大建模能力,能够直接对未标注数据进行处理,成为当前语音识别领域的一个研究热点。首先主要分析和总结了当前几种具有代表性的深度学习模型;其次是其在语音识别中对于语音特征提取及声学建模中的应用;最后总结了当前所面临的问题和发展方向。  相似文献   

15.
针对互联网中文文档图像非法信息过滤提出了一种多模板匹配结合可信度分析的方法。该方法克服了传统OCR速度慢的缺点,同时改善了基于图像特征匹配方法对字体和噪音敏感的特性。通过改变关键词搜索方式有效地减小了计算量,提高了识别速度。实验结果表明了该方法的有效性。  相似文献   

16.
介绍在VB下利用WebBrowser控件实现Web浏览器的基本过程和方法,并以具体实例予以说明。  相似文献   

17.
Authorware是目前使用最广泛的多媒体制作软件之一,它采用面向对象的设计思想,是一种基于图标和流线的多媒体开发工具。本文就通过Authorware多媒体制作软件DIY一个Web游览器。  相似文献   

18.
Authorwarc是目前使用最广泛的多媒体制作软件之一,它采用面向对象的设计思想,是一种基于图标和流线的多媒体开发工具。本文就通过Authorware多媒体制作软件DIY一个Web游览器。  相似文献   

19.
由于Web技术的发展,Web测览器也能够运行从网络上下载的应用程序了。但是,从Internet上下载程序并运行带来了许多网络安全性的问题。文章主要研究了当前流行的Web测览器执行Java和JavaScript程序时存在的安全方面的问题和相关技术。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号