首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
电力系统中的语音应用技术研究   总被引:2,自引:0,他引:2  
随着电力市场的发展,电力系统对信息的处理能力进一步提高。从传统的语音报警到实时语音信息访问和语音控制,语音应用技术在电力系统中都得到应用。一种基于现有Internet基础构架的语音服务标准VoiceXML是网络与电话技术完美的结合,制定了通过语音对话访问Web服务和交互语音问答的传递标准。VoiceXML使得开发人员从底层开发脱离出来,而直接面向应用提供解决方案;用户可以通过计算机或者电话,用语音访问Internet服务。该文描述了电力系统中语音技术的应用,并着重于VoiceXML标准给出了语音在电力系统中的应用解决方案。  相似文献   

2.
中文语音智能平台将语音浏览互联网变成了现实,该技术融自动语音识别、智能语音机器人和语音转换等技术于一体,人们可以用自然语言和计算机进行交流,方便、快捷地从浩瀚无际的互联网中获取信息。  相似文献   

3.
VoiceXML是一个新的XML语法规范,用于制定通过语音对话访问Web内容及其交互语音应答的传递标准,从面向应用的角度来说,就是开发语音用户界面。本文介绍如何利用VoiceXML进行语音应用开发,并给出VoiceXML的应用实例。  相似文献   

4.
一、引言 计算机技术和半导体技术的发展,推动了语音处理技术的迅速发展和应用。同时为计算机增加语音处理的功能也开拓了计算机应用的许多新领域。 语音接口板是计算机语音处理系统的重要组成部分之一。本文提出的语音接口板设计的一个基本出发点是采用软硬件相结合的方式,尽量简化语音接口板的结构,以此达到以低廉的价格实现语音输入/输出的目的。  相似文献   

5.
本文提出了一种基于正弦模型的语音编码技术,通过对语音频率,幅值和相位参数的分析处理,合成高质量的语音。在编码处理过程中,我们应用了语音叠加技术和频迹跟踪技术,以提高合成语音清晰度,实验结果表明,谝编码方式具有很好的顽健性,适合于不同来语的信号,使如带背景音乐的语音。  相似文献   

6.
多通道用户界面是当前用户界面中研究的热点,人们提出了各种各样的方法。在多通道界面系统中,一个重要的问题是通道整合,本文介绍了人们提出的各种通道整合的方法,对这些方法进行了分类归纳和比较,并介绍了我们在这方面的一些认识和工作。1 概率统计的方法 Wu,Oviatt和Cohen给出了一种基于概率统计方法的整合算法,该方法对于语音和手势进行了整合,并在多通道系统Quickset中给予了实验研究。假设S_i,i=1,2,…,M是语音模式的输出,G_j(j=1,2,…,N)是手势模式的输出,该系统  相似文献   

7.
为了满足某设备诊断维修的需要,提出了利用专家系统技术、语音识别技术以及数据库技术等方法设计基于语音界面的维修专家系统的设计目标、方法以及系统软硬件要求。  相似文献   

8.
语音识别技术近些年来发展非常迅速,并且在许多方面已经有了很好的应用。以语音识别技术在对话娃娃中的应用为例,阐述如何利用语音识别技术来设计智能控制系统,并详细介绍了系统的结构和原理。该系统具有很好的扩展性,稍微做些改动,就可以设计出各种各样的语音控制系统。  相似文献   

9.
本文主要针对我们设计制作的智能服务机器人从硬件设计、软件设计、语音识别与机械控制一体化解决方案等进行详细的介绍,同时提出了面向大众,低成本、高效率、多功能的智能服务机器人的发展方向。服务机器人所存在的无法直接通过语言与人进行交流的缺陷使语音技术的介入成为必然。语音技术包括语音合成和语音识别,而后者又比前者更难于实现。  相似文献   

10.
在未来的发展中,语音识别与自动化控制的结合也将是未来发展的一种必然趋势。语音交互方式是更为人性化的人机交互界面,针对语音识别与智能控制的运用,提出了一种基于非特定人语音识别技术的智能控制设计方法,设计出一款便携式的语音交互设备,并使用LD3320芯片将语音信息采集和识别,采用STC10L08XE芯片作为语音控制系统的主控制器,并结合外部存储器和控制电路实现人机语音交互和语音控制;通过设计一款上位机软件,可以很好的解决外部存储器数据修改困难的问题,并同时进行实时的语音数据写入和参数配置,结合自定义的协议帧,使数据的传输过程更加快速、稳定和可靠,经过实验验证,该语音控制系统工作稳定、识别率高,具有很好的易用性和市场应用价值。  相似文献   

11.
Groupware and collaborative tools have been proposed to support cooperative work. However, they suffer from some rather severe limitations. Alternatively, multi-agent systems can be proposed to improve the situation. In the latter case, the user normally interacts with the system through a special agent called a personal assistant. In this paper, we describe the design of an ontology-based speech interface for personal assistants applied in the context of cooperative projects. We believe that this type of interface will improve the quality of assistance and increase collaboration between project members. We present the interface and its insertion into a multi-agent system designed for research and development projects. We describe the design of the interface, highlighting the role of ontologies for semantic interpretation. As a result of this conversational speech interface, we expect an increase in the quality of assistance and a reduction in the time needed to answer user’s requests.  相似文献   

12.
Speech output technology is finding widespread application, including in scenarios where intelligibility might be compromised – at least for some listeners – by adverse conditions. Unlike most current algorithms, talkers continually adapt their speech patterns as a response to the immediate context of spoken communication, where the type of interlocutor and the environment are the dominant situational factors influencing speech production. Observations of talker behaviour can motivate the design of more robust speech output algorithms. Starting with a listener-oriented categorisation of possible goals for speech modification, this review article summarises the extensive set of behavioural findings related to human speech modification, identifies which factors appear to be beneficial, and goes on to examine previous computational attempts to improve intelligibility in noise. The review concludes by tabulating 46 speech modifications, many of which have yet to be perceptually or algorithmically evaluated. Consequently, the review provides a roadmap for future work in improving the robustness of speech output.  相似文献   

13.
Two research projects are described that explore the use of spoken natural language interfaces to virtual reality (VR) systems. Both projects combine off-the-shelf speech recognition and synthesis technology with in-house command interpreters that interface to the VR applications. Details about the interpreters and other technical aspects of the projects are provided, together with a discussion of some of the design decisions involved in the creation of speech interfaces. Questions and issues raised by the projects are presented as inspiration for future work. These issues include: requirements for object and information representation in VR models to support natural language interfaces; use of the visual context to establish the interaction context; difficulties with referencing events in the virtual world; and problems related to the usability of speech and natural language interfaces in general.  相似文献   

14.
研究了Agent技术、语音技术和动画技术的应用。开发了具有C/S结构的智能语音人机界面的网络新闻邮件管理系统。用户可以通过语音控制程序的运行,程序则通过语音合成通知运行的状况。用户可以用普通话进行新闻、通讯、电子邮件等日常工作。  相似文献   

15.
一种带USB接口的便携式语音采集卡的设计   总被引:3,自引:1,他引:2  
以一种带USB接口的语音采集卡为实例,重点介绍了如何结合USB协议规范利用USB控制器USBN9603进行USB设备软、固件的设计。  相似文献   

16.
聊天室是人们在网上交流的一种重要手段,由于硬件设备、网络带宽的限制,目前广泛使用的聊天室只能基于文本和语音,不能基于人脸形象。以已经实现的“一个基于SAPI5.0的中文语音动画系统”为基础,设计并实现了一个结合文本、语音和人脸动画的三维语音动画聊天室。聊天室由客户端和服务器两部分组成,多个用户利用客户端连接到服务器上,用户可以输入文本并且选择各种表情,由客户端混合成带有表情标签的文本传送给服务器。服务器将该用户的三维人脸模型以及带有表情标签的文本传送给接收方,由接收方的客户端合成为带有表情的语音动画。聊天室只有发送方第一次给接收方传送信息时才需要下载人脸模型,以后只传送带有表情标签的文本,具有计算方法简单、系统通信开销小的特点,在普通微机上就能够产生带有表情的高质量的语音动画。  相似文献   

17.
本文采用手机模块TC35i和语音合成模块XF-S3011构成短信和语音报警的智能接口,它在短信收发同时可合成语音输出;另外提供基于C++Builder组件形式的PC机接口软件,便于根据实际报警需要构成应用软件系统。  相似文献   

18.
戴礼荣  王子祥  王仁华 《计算机工程》2004,30(17):45-46,142
提出了汉语文语转换和语音编解码的基于DSP的实时综合处理的思想。介绍了实时综合处理的基于DSP的硬件与软件实现。文章介绍的基于DSP的实时综合处理具有以下几个方面的特点:(1)在单片DSF和不超过IMB的DSP最小系统上实现了一个任意文本的汉语文语转换系统;(2)为提高语音合成的自然度,提供了灵活的语音定制功能;(3)根据通信信道容最大小,实现可灵活选择的采甩语音合成方式的语音通信和语音编码方式的语音通信;(4)基于DSP的实时综合处理的在线重构;(5)基于RS232的通用异步串口的包括命令解释引擎、合成引擎、编码引擎等的模块化DSP软件结构。  相似文献   

19.
随着手持设备的日益小型化以及一些特殊场合的限制,使用语音识别这种自然的人机接口技术愈发显得迫切。基于HMM架构的语音识别技术经过几十年的发展,在实验室环境下已经取得了很高的识别率。当前已经取得的技术要想走向实用化,所面临的最大障碍来自于语音识别前端的鲁棒性问题。本文对语音识别的前端鲁棒性问题做了比较深入细致的分析,并在此基础上比较全面地介绍了解决这些棘手问题所采取的一些措施。文章最后对语音识别前端鲁棒性问题给出了一定的讨论和展望。  相似文献   

20.
Robust low bit rate speech coders are essential in commercial and military communication systems. They operate at fixed bit rates and those bit rates cannot be altered without major modifications in the vocoder design. In this paper we introduce a scaled speech coder, which operates on time-scale modified input speech. The proposed method offers any bit rate from 2400 b/s to downwards without modifying the principle vocoder structure, which is the mixed excitation linear prediction (MELP) vocoder. We consider the application of transmitting MELP-encoded speech over noisy communication channels after time scale compression is applied. Computer simulation results, both source and channel, are presented in terms of objective speech quality metrics and informal subjective listening tests. A statistical tool called bootstrap is also used to determine the accuracy of these test results. Design parameters such as codec complexity and delay are also investigated.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号