首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
介绍了语音识别的发展历史和国内外语音识别研究的现状,讨论了语音识别的几个基本问题和影响语音识别的因素,并分析了目前常用的语音识别的各种方法,指出了其优缺点,最后讨论了评价语音识别系统时应考虑的几个技术指标和将来语音处理的发展方向等。  相似文献   

2.
局域网并行处理在语音识别中的应用   总被引:1,自引:0,他引:1  
在语音识别中,不论是训练语音识别系统,还是使用系统识别语音,都需要进行大量的数据处理,这使得语音识别的研究和实现都变的非常困难。本文提出一种基于局域网的分布式计算机系统的快速并行数据处理方法来实现语音识别的模型训练和语音的识别,不仅加 了训练和识别的速度,节约了大量的时间,而且降低了语音识别任务对硬件的要求,取得了满意的效果。  相似文献   

3.
本文提出了一种基于正弦模型的语音编码技术,通过对语音频率,幅值和相位参数的分析处理,合成高质量的语音。在编码处理过程中,我们应用了语音叠加技术和频迹跟踪技术,以提高合成语音清晰度,实验结果表明,谝编码方式具有很好的顽健性,适合于不同来语的信号,使如带背景音乐的语音。  相似文献   

4.
电力系统中的语音应用技术研究   总被引:2,自引:0,他引:2  
随着电力市场的发展,电力系统对信息的处理能力进一步提高。从传统的语音报警到实时语音信息访问和语音控制,语音应用技术在电力系统中都得到应用。一种基于现有Internet基础构架的语音服务标准VoiceXML是网络与电话技术完美的结合,制定了通过语音对话访问Web服务和交互语音问答的传递标准。VoiceXML使得开发人员从底层开发脱离出来,而直接面向应用提供解决方案;用户可以通过计算机或者电话,用语音访问Internet服务。该文描述了电力系统中语音技术的应用,并着重于VoiceXML标准给出了语音在电力系统中的应用解决方案。  相似文献   

5.
语音是人们日常生活中高效、自然的交流方式之一。但是直到目前为止,语音交互方式在计算机技术上的应用还是比较少的。近年来,随着Ubiquitous Computing和便携式计算机的出现,再次对语音用户界面的应用提出了迫切的需求。而且语音识别、合成技术的发展也为语音交互界面的实现提供了技术基础。本文综合参考了国内外语音界面的一些应用系统实例以及语音这种独特的交流媒体的优点和局限性,总结了语音用户界面的适用环境和设计指导原则,并提出了对语音界面的发展展望。  相似文献   

6.
针对传统英语对话系统受环境噪声影响,出现多人混合语音分离现象,造成多人英语语音识别和对话效果降低的问题,提出一种基于深度学习的语音增强和传统阵列信号处理的多人英语语音分离系统。首先,采用基于长短时记忆网络LSTM的多目标语音增强算法捕捉英语语音序列的长时特性;然后建立一个两阶段的单通道多人语音分离框架提取目标说话人语音;最后将提取语音与阵列算法进行融合,并通过空间信息实现目标说话人英语语音精确估计。结果表明,相较于DNN-DM模型和LSTM-IRM模型,提出的LSTM-DM模型的信噪比指标明显更高,此模型的平均PESQ由2.66提升至2.95,增益为0.074%。由此说明,LSTM-DM模型的英语语音去噪和语音增强效果更好。提出的特定说话人前端系统的英语语音对话词错误率为65.3%,对比于Officoal Beamformlt系统和CGMM3Mask Fusion模型下降了14.6%和5.1%。说明此系统可实现多人混合英语语音分离,具备一定的有效性。  相似文献   

7.
中文语音智能平台将语音浏览互联网变成了现实,该技术融自动语音识别、智能语音机器人和语音转换等技术于一体,人们可以用自然语言和计算机进行交流,方便、快捷地从浩瀚无际的互联网中获取信息。  相似文献   

8.
一种新型工业语音报警器   总被引:3,自引:0,他引:3  
针对目前工业语音报警器使用中存在的问题,以单片机8031为例,采用ISD1420语音芯片进行工业语音报警器的开发和设计,并给出了语音部分的电路及子程序。该语音报警器采用了直接模拟量存储技术DAST,完成语音的录入、存储及分段调出。  相似文献   

9.
传统的ISD语音芯片的开发方法不能满足各种复杂操作和实时系统的要求,基于USB接口的ISD语音开发平台,提供友好交互的开发调试环境,能够进行功能模拟和仿真,实现语音资源的复用和语音效果的特别处理,可以精确定位和快速检索语音段,提供应用技术帮助等,具有很好的应用前景和很高的实用价值。  相似文献   

10.
语音识别综述   总被引:1,自引:0,他引:1  
语音作为一个交叉学科,具有深远的研究价值,近50年的研究发展,语音识别技术已经有了极大的发展.但大多数产品能存在与实验室,没有达到使用化的效果。所以语音识别的研究还要更加深入。本文介绍了语音识别的发展现过程。以及一个语音系统框架和识别过程,HMM模型的概念和建立,还有语音发展的问题和解决方案。  相似文献   

11.
本文介绍了在连续语音识别和语音机器翻译方面所进行的工作。我们已在中等词汇量范围、限定说话主题的条件下,实现了特定人的连续话句的识别。并实现了一个英汉语音翻译实验演示系统。  相似文献   

12.
译文质量的自动评价对机器翻译研究具有十分重要的意义。但现有方法主要是针对书面语翻译,没有考虑到口语翻译的特征。因此,本文提出了一种面向口语的新型的自动评价方法,通过定义信息段、标注权重和设计多种匹配策略等方法,使自动评价结果与人工打分更为接近,同时也提高了评价过程对不同输出译文的适应能力。各项实验表明,该算法对译文质量变化具有较高的敏感度,而且可以对输出译文质量作出与手工评判较为接近的评价结果。  相似文献   

13.
语音翻译是将源语言语音翻译为目标语言文本的过程.传统序列到序列模型应用到语音翻译领域时,模型对于序列长度较为敏感,编码端特征提取和局部依赖建模压力较大.针对这一问题,本文基于Transformer网络构建语音翻译模型,使用深度卷积网络对音频频谱特征进行前编码处理,通过对音频序列进行下采样,对音频频谱中的时频信息进行局部依赖建模和深层特征提取,缓解编码器的建模压力,实现了汉越双语的语音到文本互译.实验结果表明,提出方法取得很好效果,相比基准系统获得了约19%的性能提升.  相似文献   

14.
刘宇宸  宗成庆 《软件学报》2023,34(4):1837-1849
语音翻译旨在将一种语言的语音翻译成另一种语言的语音或文本. 相比于级联式翻译系统, 端到端的语音翻译方法具有时间延迟低、错误累积少和存储空间小等优势, 因此越来越多地受到研究者们的关注. 但是, 端到端的语音翻译方法不仅需要处理较长的语音序列, 提取其中的声学信息, 而且需要学习源语言语音和目标语言文本之间的对齐关系, 从而导致建模困难, 且性能欠佳. 提出一种跨模态信息融合的端到端的语音翻译方法, 该方法将文本机器翻译与语音翻译模型深度结合, 针对语音序列长度与文本序列长度不一致的问题, 通过过滤声学表示中的冗余信息, 使过滤后的声学状态序列长度与对应的文本序列尽可能一致; 针对对齐关系难学习的问题, 采用基于参数共享的方法将文本机器翻译模型嵌入到语音翻译模型中, 并通过多任务训练方法学习源语言语音与目标语言文本之间的对齐关系. 在公开的语音翻译数据集上进行的实验表明, 所提方法可以显著提升语音翻译的性能.  相似文献   

15.
The EuTransAll project aims at using example-based approaches for the automatic development of Machine Translation systems accepting text and speech input for limited-domain applications. During the first phase of the project, a speech-translation system that is based on the use of automatically learned subsequential transducers has been built. This paper contains a detailed and mostly self-contained overview of the transducer-learning algorithms and system architecture, along with a new approach for using categories representing words or short phrases in both input and output languages. Experimental results using this approach are reported for a task involving the recognition and translation of sentences in the hotel-receptioncommunication domain, with a vocabulary of 683 words in Spanish. Atranslation word-error rate of 1.97% is achieved in real-timefactor 2.7 on a Personal Computer.  相似文献   

16.
Due to the increase in globalization, communication between different countries has become more and more frequent. Language barriers are the most important issues in communication. Machine translation is limited to texts, and cannot be an adequate substitute for oral communication. In this study, a speech recognition and translation system based on embedded technology was developed for the purpose of English speech recognition and translation. The system adopted the Hidden Markov Model (HMM) and Windows CE operating system. Experiments involving English speech recognition and EnglishChinese translation found that the accuracy of the system in identifying English speech was about 88%, and the accuracy rate of the system in translating English to Chinese was over 85%. The embedded technology-based English speech recognition and translation system demonstrated a level of high accuracy in speech identification and translation, demonstrating its value as a practical application. Therefore, it merits further research and development.  相似文献   

17.
电话语音报警技术在安防系统中的应用   总被引:1,自引:0,他引:1  
本文介绍的安防自动报警系统具有可以自动拨通电话,将警报通过合成语音播送出去的功能。文章简要介绍了电话语音报警技术的实现方法。  相似文献   

18.
The Diplomat rapid-deployment speech-translation systemis intended to allow naï ve users to communicate across a languagebarrier, without strong domain restrictions, despite the error-pronenature of current speech and translation technologies. In addition,it should be deployable for new languages an order of magnitude morequickly than traditional technologies. Achieving this ambitious setof goals depends in large part on allowing the users to correct recognition and translation errors interactively. We present the Multi-Engine Machine Translation (MEMT) architecture, describing how it is well suited for such an application. We then discuss ourapproaches to rapid-deployment speech recognition and synthesis.Finally we describe our incorporation of interactive error correctionthroughout the system design. We have already developed workingbidirectional Croatian English and Spanish English systems, and have Haitian Creole English and Korean English versions under development.  相似文献   

19.
This paper sketches research in nine areas related to spoken language translation: interactive disambiguation (two demonstrations of highly interactive, broad-coverage speech translation are reported); system architecture; data structures; the interface between speech recognition and analysis; the use of natural pauses for segmenting utterances; example-based machine translation; dialogue acts; the tracking of lexical co-occurrences; and the resolution of translation mismatches.  相似文献   

20.
This article presents statistical language translation models,called dependency transduction models, based on collectionsof head transducers. Head transducers are middle-out finite-state transducers which translate a head word in a source stringinto its corresponding head in the target language, and furthertranslate sequences of dependents of the source head into sequencesof dependents of the target head. The models are intended to capturethe lexical sensitivity of direct statistical translation models,while at the same time taking account of the hierarchical phrasalstructure of language. Head transducers are suitable for directrecursive lexical translation, and are simple enough to be trainedfully automatically. We present a method for fully automatictraining of dependency transduction models for which the only inputis transcribed and translated speech utterances. The method has beenapplied to create English–Spanish and English–Japanese translationmodels for speech translation applications. The dependencytransduction model gives around 75% accuracy for an English–Spanishtranslation task (using a simple string edit-distance measure) and70% for an English–Japanese translation task. Enhanced with targetn-grams and a case-based component, English–Spanish accuracy is over76%; for English–Japanese it is 73% for transcribed speech, and60% for translation from recognition word lattices.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号