首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
语音识别是人机语音通信的关键技术之一,也是难题之一.介绍了一种语音识别系统,主要介绍了该系统的语音处理流程,阐述了系统使用Mel频标倒谱参数作为特征提取的方法,采用隐马尔科夫模型算法的测度估计技术.通过严格测试,该系统达到实用化要求.该语音识别系统较好的实现了在移动电子设备上资源有限条件下方便快捷的汉字语音输入,具有重大现实意义.  相似文献   

2.
常见的语音控制系统多采用单片机和专用的语音处理芯片来完成,其缺点是语音处理芯片的性价比普遍不高,导致开发成本高,且开发周期较长.在深入研究凌阳SPCE061A单片机在语音处理方面的优越性能后,设计了一套智能交通灯语音播报控制系统.给出了控制系统方案设计,并重点讲述系统语音设计方案,包括语音输入电路、语音输出电路以及语音输入和语音输出的流程图等.  相似文献   

3.
本文设计并实现了一个基于单片机的语音录放系统.文中介绍了G.726语音编解码算法的原理,采用单片机实现对语音信号的压缩存储和编解码功能.详细论述了系统的硬件结构,并给出了适用于单片机的程序优化算法.运行结果表明,解码后语音还原质量较好,符合预期.  相似文献   

4.
小波神经网络在语音识别系统中的应用   总被引:2,自引:0,他引:2  
文中设计了以"MCU+DSP"的双CPU结构为核心的语音识别系统,利用MCU实现语音识别系统的控制,DSP实现语音识别系统的预处理、特征提取和模式识别.针对语音识别系统各个阶段,分别引入小波变换和神经网络对传统的实现方法进行改进,有效地降低了系统中的噪声,减少了系统中不必要的数据量,提高了系统的语音识别性能.实验数据验证了该方法的可行性和有效性.  相似文献   

5.
因与原始语音具有高度相似性,经高保真设备回放的翻录语音常被不法分子用于对说话人认证(ASV)系统进行攻击,以达到非法认证的目的.为提高系统抵抗翻录语音攻击的顽健性,通过研究原始语音与翻录语音产生的实际过程,发现两者在频率域相位上有明显差异,并在此基础上提出了一种基于相位谱的翻录语音检测方法.分析讨论了FFT和不同偷录、回放设备对翻录语音检测率的影响.实验结果表明,该方法能够准确地判断待测语音是否为翻录语音,其检测率达到了99.04%.并且,将该算法加载到说话人识别系统中,使系统的等错误概率(EER)降低了约22%,有效提高了系统抵抗翻录语音攻击的性能.  相似文献   

6.
基于CMX618的数字语音通信系统   总被引:1,自引:0,他引:1  
简述了CML公司CMX618语音声码器芯片的特点、功能,以及它的工作原理,同时介绍了RALCWI语音压缩算法和利用C-BUS串行总线进行传输的优点.在此基础上,采用在C-BUS串行总线上,控制信号与数字语音共线传输的方法,设计了一种基于CMX618的数字语音通信系统.该语音通信系统以ARM微控制器LPC2138为核心,依靠ARM微控制器强大的控制和运算能力,实现了系统的智能化,使语音处理的速度更快,性能更稳定.该系统可广泛用于无线通信设备、卫星通信、语音存储、VoIP系统等诸多领域,具有很高的应用价值和商业价值.  相似文献   

7.
近些年来,语音识别技术取得了突飞猛进的发展.智能家居同样发展迅速,且有着广阔的市场前景.如何将非语音识别技术完美地融合到智能家居中,完善智能家居系统,是摆在我们面前的一个课题.该文详细介绍了基于SPCE061A单片机的非语音识别技术在智能家居中的应用,详细阐述了系统的软硬件设计及结构原理.实验结果表明,语音识别技术在智能家居系统中有着广阔的应用前景.  相似文献   

8.
叶利剑 《电声技术》2011,35(10):68-74
系统研究了现有语音通信系统中使用的几种语音编解码算法以及主流的单通道语音增强算法,并将二者相结合,对实际通信系统中的结构进行仿真.研究发现,现有的基于线性预测分析技术的语音编解码算法,在高编码率的情况下对于语音增强算法的性能不仅不会有损失,反而会在一定程度上改善增强算法带来的语音失真的情况,提高语音增强算法的效果.  相似文献   

9.
新的语音信号统一VBR编码方法   总被引:5,自引:0,他引:5       下载免费PDF全文
杨震  郑宝玉 《电子学报》2002,30(1):49-53
本文提出一种两级语音信号编译码新方法-EMSVBR系统,输入信号经语音活动性检测后,经两级编码器进行压缩.其核心编码器基于混合编码技术,增强编码器基于小波分带的SBC技术,系统的码流是分层嵌入式的,系统码率变化既利用了语音的突发性,又可根据网络容量或信道特性变化而变化,涵盖了目前几乎所有语音编码标准的码率,并且新系统的解码语音质量,高于同样码率下的单一编码标准的质量.这种语音VBR编译码方法,尤其适合于未来IP和ATM网络中的语音通信.  相似文献   

10.
本文提出了基于口可堆叠式的VoIP通信应用系统的系统架构,重点介绍了面向IP可堆叠式的VoIP语音板卡的固件程序设计.每块VoIP语音板卡支持8路语音,通过自定义的通信协议可使不同的VoIP语音板卡独立地通过IP互联,实现基于IP可堆叠.自定义通信协议实现了VoIP语音板卡中芯片内部通道之间、VoIP语音板卡上芯片之间、不同VoIP语音板卡之间,以及VoIP语音板卡与管理PC间的通信.VoIP语音板卡控制软件以内核模块方式运行,并在内核模块方式下由VINETIC-2CPE语音芯片中断服务程序激活回调函数,提高了实时性.  相似文献   

11.
基于AMBE-2000的数字语音传输系统   总被引:1,自引:0,他引:1  
介绍了AMBE-2000的工作原理及其应用,并结合实例给出了数字语音传输系统中AMBE-2000与TLV320AIC10的A/D、D/A接口电路。AMBE-2000是DVSI(Digital Voice System·Inc)公司的语音压缩解压缩芯片,它采用AMBE语音压缩技术,具有语音音质好和编码波特率低、功耗低等优点;TLV320AIC10是TI公司的低功耗∑-Δ型16位A/D、D/A音频接口芯片。应用AMBE-2000的数字语音传输系统可以在低速率下提供优良的语音质量,并能实现全双工、实时语音压缩解压缩功能,因此在卫星通信、移动通信等领域有着广泛的应用。  相似文献   

12.
CS8 8 31CN是用于语音录放的单片CMOSLSI,采用ADM (自适应增量调制 )。它与动态RAM以及包括话筒、扬声器、放大器等的音频电路共同构成一个完整的语音录放系统。  相似文献   

13.
设计和实现了基于语音邮件的家校通服务系统。通过语音邮件网关可以实现只用普通电话就可以收发语音邮件,根据具体应用的要求对UDP协议进行了必要的改进,弥补了UDP协议在可靠性和流量控制等方面存在的不足;并使用组件化编程技术对IMAP4、SMTP邮件协议和语音格式转换模块进行封装,减轻了编程的工作量、提高了代码的可重用性。系统投入运行之后的效果表明:语音处理流畅、系统性能较好。  相似文献   

14.
施智雄 《电声技术》2009,33(5):58-61
提出了一个以声音识别来取代画面识别为核心的气味发生控制系统,仿真体验现场气味:给出了声音的识别与控制电路;介绍了从特定构造的声音媒体中获得决定气味发生动作的气味数据的原理;给出了原理图、主程序框图。  相似文献   

15.
The capacity of a carrier sense multiple-access wireless LAN with voice and data services using the TCP/IP protocol is analyzed to obtain a lower bound for the capacity of the wireless networks with voice and data services. The voice traffic is given a higher priority over the data traffic to accommodate the delay requirement for an acceptable quality of service. This is implemented by assigning the TCP protocol for data and the UDP protocol for voice. The relationship between the data throughput and the number of the voice users supported in this environment is analyzed by using a nonpreemptive queuing model. While the analysis in this paper can be applied to any voice encoding system, the improved multiband excitation voice encoding technique is adopted to provide a low transmission rate with an acceptable quality  相似文献   

16.
Slot allocation for voice and data in an integrated TDMA mobile radio system is investigated. In the proposed system, voice traffic is circuit-switched and data traffic is packet-switched using slotted ALOHA for channel access; the data traffic model is practically assumed to have a finite number of users with finite buffer capacity. The authors apply an equilibrium point analysis (EPA) technique to analyze the data performance and present a heuristic performance criterion to obtain an optimal slot allocation for voice and data in the integrated TDMA mobile radio system  相似文献   

17.
OFDM技术在GSM语音信道中的应用   总被引:1,自引:0,他引:1  
远距离数据传输以及数据传输的保密性向来是人们比较关注的问题,使用语音信道传输数据信息是一种可选的方案。利用GSM信道,结合OFDM技术,将电脑、手机、A/D、D/A组成一个系统,可以实现一种远距离数据传输平台。针对OFDM技术特点,实现了GSM语音信道OFDM调制解调系统,经过多次实验测试,平均误码率曲线表明设计达到了最初的设计要求,在话音保密数据通信及其他数据传输上有较好的应用前景。  相似文献   

18.
苏振宇 《电子测试》2009,(12):44-48
本文介绍了一种应用于数字通信领域的语音基带处理系统。设计的目的是把待传输的模拟语音信号转换为数字基带信号,使用固定的频率在信道上传输。根据系统的功能,设计中主要采用了DSP和FPGA芯片,重点考虑了语音信号的数字化和编/解码、数据传输等功能。本系统的语音数字化和编/解码采用了连续可变斜率增量编码调制CVSD,通过DSP芯片实现了语音基带处理的功能,并且利用对FPGA的编程技术完成了数字信号的QPSK调制/解调。最终系统的功能在电路板上得到验证,实现了语音信号的编码与解码。  相似文献   

19.
话音业务是卫星通信中的重要业务,设计了一种采用多处理器结构的多路话音编解码器,利用多个处理器协作处理,可以实现卫通网中多路话音通信的信令交互以及数据的压缩处理,并通过主机接口(HOST PORT ITERFACE,HPI)和地址/数据(A/D)总线接口解决了多处理器间的数据交互问题。测试结果表明,该方案设计合理,满足系统使用需求。  相似文献   

20.
For any given mixed-language text, a multilingual synthesizer synthesizes speech that is intelligible to human listener. However, as speech data are usually collected from native speakers to avoid foreign accent, synthesized speech shows speaker switching at language switching points. To overcome this, the multilingual speech corpus can be converted to a polyglot speech corpus using cross-lingual voice conversion, and a polyglot synthesizer can be developed. Cross-lingual voice conversion is a technique to produce utterances in target speaker’s voice from source speaker’s utterance irrespective of the language and text spoken by the source and the target speakers. Conventional voice conversion technique based on GMM tokenization suffer from degradation in speech quality as the spectrum is oversmoothed due to statistical averaging. The current work focuses on alleviating the oversmoothing effect in GMM-based voice conversion technique, using (source) language-specific mixture weights in a multi-level GMM followed by selective pole focusing in the unvoiced speech segments. The continuity between the frames of the converted speech is ensured by performing fifth-order mean filtering in the cepstral domain. For the current work, cross-lingual voice conversion is performed for four regional Indian languages and a foreign language namely, Tamil, Telugu, Malayalam, Hindi, and Indian English. The performance of the system is evaluated subjectively using ABX listening test for speaker identity and using mean opinion score for quality. Experimental results demonstrate that the proposed method effectively improves the quality and intelligibility mitigating the oversmoothing effect in the voice-converted speech. A hidden Markov model-based polyglot text-to-speech system is also developed, using this converted speech corpus, to further make the system suitable for unrestricted vocabulary.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号