首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
声纳智能物品查询系统(以下简称:该系统)从物品管理功能需求出发,基于语音识别技术,重点研究该领域发展现状、受众需求模型及实用功能设计,研究智能语音识别技术及应用,拟实现通过使用智能语音助手,以语音答辩的形式快速查找、获得物品存放位置及信息。项目创新点在于突破传统查询及管理模式,语音对话实现录入及查找操作,解放双手。  相似文献   

2.
随着语音识别研究的深入,提高通用识别引擎的精度变得越来越困难。但对具体的语音识别任务,结合相应的背景,采取相应的措施,有可能达到很理想的识别精度。在已知语音输入为某有限集元素之一的情形,利用文本在发音上的相似度可以大大提高识别的精度。本文首先介绍了文音相似度的概念,然后给出了利用文音相似度设计开发语音查询系统的过程和例子。  相似文献   

3.
本文介绍了电话语音计算机查询系统的开发环境及系统的功能、特点、主要研究的内容和应用领域。  相似文献   

4.
语音问询在许多实际的领域有着广泛的应用。在这些实际的应用系统中,很多都离不开对人民币的自动语音播放。文中,根据实际制作项目的经验,结合国内较出名的语音集成卡:东进和鼎铭语音卡,在VB环境中介绍语音播放人民币的巧妙实现。  相似文献   

5.
本文通过基于数据库的电话查询系统的研究和实践,描述当今比较流行的查询学生成绩的电话语音查询系统的开发过程;介绍了电话语音查询的特点、发展趋势及开发环境、工具;把编写的程序用工作的流程概括出来,并且列举出编程中所用到的主要函数、方法、事件和属性。语音查询系统处理过程灵活多变,随着各咱问题的不断解决,在实际应用中将得到广泛的应用。  相似文献   

6.
监控系统的语音识别与语音提示   总被引:1,自引:0,他引:1  
介绍了一种采用语音识别和语音提示的监控系统。给出了系统硬件框图,并对各部门分功能进行了阐述;重点论述了各部分电路设计、工作原理及语音提示部分电路和通讯接口电路的软件设计思想,并给出主程序流程图。  相似文献   

7.
电话语音查询系统的原理、编程及系统的硬件、软件设计,给出了事件驱动实现多任务的具体方法。  相似文献   

8.
给出一种量化交易程序中智能语音播报及识别部分设计与实现,其功能主要包括智能语音提示和语音输入方式下单,其中智能语音部分使用Java作为后台语言,选择Eclipse Jee 2019为开发工具,应用讯飞SDK为语音功能接口,实现了语言合成和语音识别.通过编写预设的功能函数,达到了预期的效果,其中播报语音清晰准确,同时普通...  相似文献   

9.
语音识别技术在新一代呼叫中心的IVR系统中得到了广泛应用。本文讨论了一个基于语音识别的IVR系统的设计与实现,首先介绍了系统的结构和主要模块,之后介绍了本系统的难点和解决办法。最后从识别率、鲁棒性方面对该系统进行了测试和分析,实验结果表明,该语音识别系统是稳定的实用的。  相似文献   

10.
近年来,随着互联网技术的不断革新,人们在生活、学习和工作中也都发生了不少改变。各种各样的智能化设备、软件层出不穷。而作为广受人们关注的语音识别技术也在不同领域有着广泛的应用。本文选择科大讯飞的SDK接口与当前互联网环境的主流AI技术,基本实现了语音识别技术在Linux平台下的简单应用,而此举对于语音识别技术在Linux平台下的应用有着重要的意义。  相似文献   

11.
林鸣霄 《微机发展》2011,(11):160-162,166
随着三维仿真技术的不断发展,简单的人机交互方式已经不能满足人们对仿真环境真实感和沉浸感的要求。针对于此,提出了将基于SpeechSDK5.1的语音识别技术应用到三维仿真平台的构想,分析了SpeechSDK5.1的工作原理,着重研究了其语音识别接口,对将语音识别应用到三维仿真程序中的可能性和关键技术进行了研究。提出了一种实现动态词汇识别的方法,并通过一个简单的实例展示了实现这类技术的框架和方法,对设计有语音识别功能的三维仿真程序有一定的参考价值。  相似文献   

12.
使用TTS编写即时语音提示校对软件   总被引:1,自引:0,他引:1  
利用Windows提供的TTS(text-to-speech)功能,在键盘输入的同时把所输入的字符或汉字朗读出来。本文在VC环境中通过系统钩子捕获系统的键盘输入内容,再使用Windows提供的TTS功能,将输入内容朗读出来,实用强。  相似文献   

13.
利用TTS技术实现文本文件的语音合成   总被引:8,自引:0,他引:8  
本文基于语音合成的代表性技术TIS,利用Microsoft Speech SDK语音开发包、TIS引擎和MFC微软基础类库,开发了一个在VC集成环境下的文语转换应用程序,实现了从文本文件到语音的自动转换功能。  相似文献   

14.
基于SPEECH SDK的中文学习系统   总被引:1,自引:0,他引:1  
介绍了Microsoft Speech SDK的功能以及相关的一系列API函数,分别利用其语音识别(Speech Recognition)引擎和语音合成(Textto Speech)引擎实现英文语音识别和中文文本语音合成功能,采用Access 2003数据库的查询操作完成翻译功能,进而实现整个英文到中文的学习系统,该系统具有很高的商业价值。  相似文献   

15.
情感是语音识别研究中一个不可避免的问题,不同的情感对于语音有着不同的影响,这种影响使得中性语音识别系统在实际应用中的识别效果大打折扣。对于类似的影响通常的解决方法有寻找鲁棒特征,特征归一化以度模型调整训练等。本文通过自适应方法,使用少量情感数据,在中性语音模型的基础上自适应得到新的情感语音模型。实验证明,新模型对于情感语音有着更好的整体识别率。  相似文献   

16.
介绍Speech SDK及XML的技术原理及特点,分析描述虚拟场景实体的XML文件格式,结合JavaScript与SAPI实现XML文件文本到语音的转换,并以虚拟多媒体教室系统为例,阐述系统实现中的关键技术。  相似文献   

17.
    
This paper presents a new approach to speech enhancement from single-channel measurements involving both noise and channel distortion (i.e., convolutional noise), and demonstrates its applications for robust speech recognition and for improving noisy speech quality. The approach is based on finding longest matching segments (LMS) from a corpus of clean, wideband speech. The approach adds three novel developments to our previous LMS research. First, we address the problem of channel distortion as well as additive noise. Second, we present an improved method for modeling noise for speech estimation. Third, we present an iterative algorithm which updates the noise and channel estimates of the corpus data model. In experiments using speech recognition as a test with the Aurora 4 database, the use of our enhancement approach as a preprocessor for feature extraction significantly improved the performance of a baseline recognition system. In another comparison against conventional enhancement algorithms, both the PESQ and the segmental SNR ratings of the LMS algorithm were superior to the other methods for noisy speech enhancement.  相似文献   

18.
Speech SDK是Microsoft提供的计算机语音开发工具包,它使我们在程序或网页中实现文字声音的播放或将声音转换成电子文本。本文通过实例介绍了在Ⅶ程序中和动态网页设计中,利用Speech SDK来实现中英文全文朗读的方法。  相似文献   

19.
This paper concentrates on the problem of designing and developing a spoken query retrieval (SQR) system to access large document databases via voice. The main challenge is to identify and address issues related to the adaptation and scalability of integrating automatic speech recognition (ASR) and information retrieval (IR). In this paper, a Context Aware Language Model (CALM) framework allowing information retrieval to large document databases via voice is presented and findings from a research study using the framework will be discussed as well.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号