首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
目前语音合成技术已经展现出其日渐成熟的一面。然而如何使合成的语音更加自然,这一问题仍是语音研究的热点和突破点。本文主要围绕计算机语音合成系统的发展现状、研究应用等方面探讨语音合成未来的发展方向。  相似文献   

2.
唐明道 《电子技术》1997,24(2):16-19
长时间语音录放电路深圳求新电子器材厂(518052)唐明道一、概述随着计算机和大规模集成电路技术的发展,特别是通信技术的进步,大大推动了语音合成产品的开发,出现了各种优良的大容量语音合成系统。为生产过程中的语音提示、公共场合的讲解器和语音信息等通信设...  相似文献   

3.
科大讯飞开发成功广东话语音合成系统科大讯飞宣布推出广东话语音合成系统—InterPhonic Cantonese2.2。这标志着其产品线进一步丰富,将为包括粤港在内的更广泛地区和人群提供更加完善的产品和更加周到的服务,同时,这也是国内首家推出的广东话语音合成系统。据了解,新近推出的InterPhonic Cantonese 2.2语音合成系统,可以将任意的文本转换成清晰、流畅、自然的广东话语音,现在,粤、港两地的人们很轻松就能体验到普通话、英语和广东话3个语种的自动语音服务了。  相似文献   

4.
本文提出了一种新的居住小区信息发布模式.系统硬件利用楼宇访客系统的布线网络,通信干线采用CAN总线,以提高通信的实时性和可靠性.CAN总线接口模块用于两种不同通信标准之间的转换.将语音合成技术应用于居住小区信息发布系统,采用数字信号传输语音.单元门口机的硬件结构与楼宇访客系统中的单元门口机相同.住户室内分机在楼宇可视对讲分机的基础上加装了TTS(Test to Speech)语音合成芯片,采用单片微型计算机进行控制,利用语音合成芯片对小区物业管理人员发送给住户的信息文本进行转换,直接用语音方式向住户发布各种信息.  相似文献   

5.
通过了解当前机动车数量与车载终端的特点,提出一种具有语音服务功能的车载终端,使终端具有人性化与智能化的特点.设计了一个基于XF-S4240语音模块和Smart ARM2200嵌入式平台的GSM Modem SMS语音合成系统,经实测语音合成效果良好,说明语音合成技术是一种具有良好应用价值和广阔市场前景的技术.  相似文献   

6.
林勇  周晓雁 《山东电子》2004,(3):U036-U037
本文提出了一种新的居住小区信息发布模式。系统硬件利用楼宇访客系统的布线网络,通信干线采用CAN总线,以提高通信的实时性和可靠性。CAN总线接口模块用于两种不同通信标准之间的转换。将语音合成技术应用于居住小区信息发布系统,采用数字信号传输语音。单元门口机的硬件结构与楼宇访客系统中的单元门口机相同。住户室内分机在楼宇可视对讲分机的基础上加装了TTS(Text to Speech)语音合成芯片,采用单片微型计算机进行控制,利用语音合成芯片对小区物业管理人员发送给住户的信息文本进行转换,直接用语音方式向住户发布各种信息。  相似文献   

7.
基于ADSP-21 85m的嵌入式汉语语音合成系统   总被引:1,自引:0,他引:1  
本文将介绍一个基于ADSP-2185m的嵌入式汉语语音合成系统。作为一个脱机独立系统,它可以实时实现汉语文语转换,输出较高自然度的合成语音,同时在硬件设计上具有体积小,性价比高,接口简单等特点。作为技术原型,该系统可以广泛应用于各种小型智能终端,为用户提供方便实用的语音信息服务,目前已经在车载定位信息播报系统和手机短信息播报系统中推广应用。  相似文献   

8.
李征 《电声技术》2023,(11):38-40
文章深入探讨了智能语音新闻在语音识别、语义理解以及语音合成方面面临的挑战,并提出切实可行的解决路径。对于语音识别准确率不一致的问题,建议引入预训练语言模型来提升整体性能。针对语义理解能力有限的问题,强调发展多模态理解技术,综合不同感官输入提供更丰富的上下文信息。针对语音合成质量问题,提出训练个性化语音和应用生成对抗网络的策略。通过这些创新性的方法,智能语音新闻应用有望实现更高水平的语音交互和信息传递。  相似文献   

9.
计算机电话集成(CTI)技术把以语音为核心的电话网络和以数据处理为核心的计算机网络融合在一起,实现了语音和数据的通信。智能语音服务系统以CTI技术为基础,结合语音识别、语音理解和语音合成技术实现了智能人机交互界面。  相似文献   

10.
语音提示及应用系统的研制   总被引:4,自引:0,他引:4  
文章介绍了语音合成芯片MSM 6585的功能、特点 ,提出由它组成的语音合成及语音提示系统的研究、软件设计方案及工作原理 ,并给出了应用实例  相似文献   

11.
有关语音识别技术的研究   总被引:2,自引:0,他引:2  
李宏梅  伍小芹 《现代电子技术》2010,33(8):138-140,144
语音识别是将音频数据转换成文本或者其他形式的计算机可以处理的信息。这里简单介绍语音识别技术的发展历史和现状,阐述了典型语音识别系统的基本原理,对语音识别的基本方法和识别过程进行深入分析,探讨语音识别技术发展过程中的难点问题,给出了相应对策。  相似文献   

12.
周洁 《电子工程师》2011,37(1):4-8,23
随着情感信息处理的研究不断深入,语音信号中的情感转换越来越受到人们的重视。与传统的信息处理技术不同,语音的情感转换是用机器来实现理解和认识。本文首先探讨了情感的分类;接着,将语音情感转换系统分为:特征提取、参数转换和语音合成,并从特征提取和参数转换两方面进行了阐述,分析了相关的理论及算法,对各方法的优缺点进行了比较。最后,对语音情感转换研究方向进行了讨论。  相似文献   

13.
Text analysis for speech synthesis is described in relation to the information needed in speech production. This includes a pronouncing dictionary and letter-to-sound rules, morphological analysis and accent assignment, and syntactic analysis. Prosody control rules (fundamental frequency control and segmental duration control) are examined. Speech units for synthesis and parametric representation of speech signals are discussed. Applications and development tools are considered  相似文献   

14.
A novel system which employs the filter bank analysis and synthesis method for the packetisation of speech is proposed. Preliminary computer simulation studies of the system and informal subjective listening tests indicate that significant improvement in the recovered speech can be obtained, compared with the conventional technique of straight packetisation of PCM speech.<>  相似文献   

15.
中文HMM参数化语音合成系统构建   总被引:1,自引:0,他引:1  
胡克  康世胤  郝军 《通信技术》2012,45(8):101-103,108
在语音合成领域,大语料库拼接合成方式有一些固有弱点,例如语料库建设成本过高,合成稳定性差等。而基于隐马尔可夫模型(HMM)的语音合成技术在多样化语音合成、多语言支持、系统资源占用方面优势明显。分析了基于HMM的参数化语音合成技术的基本结构和核心算法,研究语料库建设,声学参数提取,建模单元和HMM拓扑结构选择等问题,给出适合于中文语音的参数设置,实现基于HMM的参数化中文语音合成。  相似文献   

16.
Research in human/computer interaction has mainly focused on natural language, text, speech and vision primarily in isolation. Recently there have been a number of research projects that have concentrated on the integration of such modalities using intelligent reasoners. The rationale is that many inherent ambiguities in single modes of communication can be resolved if extra information is available.This paper describes an intelligent multi-modal system called the Smart Work Manager. The main characteristics of the Smart Work Manager are that it can process speech, text, face images, gaze information and simulated gestures using the mouse as input modalities, and its output is in the form of speech, text or graphics. The main components of the system are the reasoner, a speech system, a vision system, an integration platform and the application interface. The overall architecture of the system will be described together with the integration platform and the components of the system which include a non-intrusive neural network based gaze-tracking system. The paper concludes with a discussion on the applicability of such systems to intelligent human/computer interaction and lessons learnt in terms of reliability and efficiency.  相似文献   

17.
18.
MELP低比特率数字语音编码技术研究   总被引:6,自引:0,他引:6  
主要介绍了一种新的低比特率MELP (MixedExcitationLinearPrediction)混合激励线性预测语音编码技术 ,其中着重分析了该编码算法所采用的几项关键技术。给出了采用MELP压缩编码算法后的输出比特流在各个参数上的比特分配表 ,并通过计算机仿真 ,对MELP合成语音与原始语音的质量做了比较 ,最后就MELP语音编码技术与现今其它几种不同的低速率语音编码技术的合成语音质量在DRT、DAM及MOS得分三个方面做了比较。  相似文献   

19.
A text to speech synthesis system receives as its input textual information and produces a speech signal as an output message. In the area of multimodal interfaces, problems concerning assistive communication for handicapped people requires implementation of various technologies using the “text to speech synthesis” block. This use of vocal synthesis is aimed at users with visual deficiencies or with cerebral palsy. In this article we describe the major technical advancse producing speech from text.  相似文献   

20.
Humans find speech a convenient and efficient means for communicating infonnation. Machines, in contrast, prefer the symbols of assemblers and compilers-exchanged, typically, in printed form through a computer terminal. If computers could be given human-like abilities for voice communication, their value and ease of use for humans would increase. The ubiquitous telephone would take on more of the capabilities of a computer terminal. Making machines talk and listen to humans depends upon economical implementation of speech synthesis and speech recognition. Heretofore the complexities and costs of these functions have deterred wide application. But now, fueled by the advances in integrated electronics, opportunities for expanded and enhanced telephone services are emerging. This paper assesses the progress in synthesis and recognition of speech by computer techniques, and it outlines potential applications in voice-communication services.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号