首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
德州仪器(TI)宣布推出一套用于创建语音转码与VoIP媒体网关解决方案的高稳健型语音与传真处理模块,进一步丰富了其广泛的语音处理软件。Voice Library Version 1.0(VoLIB)与Fax Library Version 1.0(FAXLIB)建立在TI业经验证的Telogy  相似文献   

2.
《现代电子技术》2017,(17):60-63
为了提高面罩语音的清晰度和可懂度,提出一种基于广义回归神经网络(GRNN)对线谱对(LSP)参数进行非线性建模的面罩语音矫正方法。分别提取正常语音和面罩语音的LSP参数,其次利用LSP参数对GRNN进行训练,得到矫正模型,将面罩语音的LSP参数通过矫正模型进行修正,并将结果作为参数用来合成新的语音。实验结果表明,利用GRNN训练出的矫正模型能够有效地调整面罩语音的LSP参数,在一定程度上能够恢复其频谱分布。  相似文献   

3.
吕乾坤  高勇 《电声技术》2014,38(12):50-54
针对传统语音增强方法在非平稳噪声环境下增强效果不理想的问题,提出了一种基于稀疏约束的概率潜分量分析(PLCA)和谱掩蔽的语音增强算法。该算法分为训练和增强两个阶段。训练阶段用稀疏约束的PLCA(SPLCA)和无约束的PLCA分别对语音谱和噪声谱建模成意义清晰的边缘分布,并用期望最大(EM)算法求其最优边缘分布,得到语音字典和噪声字典。增强阶段固定训练的字典,利用SPLCA推导出对应的语音编码矩阵和噪声编码矩阵,初步重构出语音和噪声,最后利用谱掩蔽得到增强语音。实验结果表明,该算法在抑制噪声、提高信噪比和减少语音失真方面要优于传统方法。  相似文献   

4.
台商新品     
《电子设计技术》2006,13(5):140-140
新一代语音OTP义隆电子推出新一代的语音OTP(One Time Programming)芯片eSPA系列;除秒数扩增到80s、语音信道数增加到四轨之外,MCU运算速度也比既有语音OTP芯片(EM57P300)快20倍。新一代语音OTP芯片(eSPA系列)将其功能加以提升,具有主频为4MHz,MIPS高达4(program cycle time为250ns),语音(Speech)/乐音(Midi)为四通道规划。目  相似文献   

5.
郭昕 《电子世界》2013,(19):92-93
本文提出了一种基于HMM和匹配追踪的多参数语音识别新算法。首先构建局部余弦基表示语音信号,对其进行匹配追踪(MP)分解。然后,应用改进后的算法对语音信号进行特征提取,得到余弦基原子参数和魏格纳-维利(WVD)分布,并结合语音信号的美尔频率倒谱系数(MFCC)一起作为该信号的特征向量,通过隐马尔科夫模型(HMM)进行识别。最后通过实验验证了方法的有效性,仿真实验表明,改进后的多参数语音识别算法比仅使用MFCC作为特征向量的HMM算法,提高了语音识别的速度和准确度。  相似文献   

6.
《通讯世界》2012,(7):61-61
近日,世界知名音频和多媒体技术研究机构Fraunhofer集成电路研究所(IIS)在京演示安卓系统(Android)手机通过LTE网络实现全高清语音通话,话音清晰得就像对同一个房间的另一个人说话,而且其语音品质与消费者在其它音频/视频设备上体验到的语音品质相当,这在移动通话中尚属首次。这归功于  相似文献   

7.
PC终端支持语音聊天,即PC终端有语音聊天能力。如果登录的用户有语音聊天能力,在其登录的首页上,会有“语音聊天”菜单,如下图中的菜单所示。(图一)进入“语音聊天”菜单,进入如下所示的页面:(图二)选中输入联系人,按“确定”按钮后,进入到如下图所示的页面:(图三)  相似文献   

8.
应用于语音识别片上系统的语音检测算法   总被引:2,自引:0,他引:2  
语音识别技术的研究已经进入实用化阶段,而实用化语音识别系统中的一个关键技术就是可靠的语音检测。本文提出了一种基于有限状态机模型的实时语音检测算法(FSM-SD)。采用对数最大似然判决帧能量检测器和过零率检测器控制各状态之间的跳转关系。针对语音识别中的MFCC(Mel频标倒谱系数)和LPCC(线性预测倒谱参数)特征提取过程,分别得到两种不同的帧能量计算方法。将FSM-SD应用到在OAK DSP上实现的小词表汉语语音识别系统,通过实验验证了其对系统识别性能和噪声稳健性的有效保证。  相似文献   

9.
递归趋势分析在汉语语音声韵母切分中的应用研究   总被引:1,自引:0,他引:1  
基于隐马尔可夫模型(HMM)的连续语音自动切分方法由于较高的切分精度得到了广泛的应用,然而其切分结果还不能够直接应用于基于脚本的语音拼接合成系统,需要音素边界的再调整。本文分析了不同的汉语语音音素的非线性动力学物理模型在其递归图(RP)上的表现,通过递归趋势(RT)这一衡量系统稳定性程度的量化参数,揭示了语音产生过程中的不稳定性。结合基于HMM的连续语音初始切分结果,从定位语音动力学特性突变点的角度,调整声韵母切分边界,在10、20、30毫秒基准范围内,切分精度分别提高了13.88%、4.19%、3.19%。  相似文献   

10.
热门技术     
参考设计推动语音和数据通信的发展在印度,开发高档半导体或系统设计的应用逐成势头。设在班加罗尔的硅自动化系统公司(SAS)推出了Vani系列语音编译码器,其范围从低位速率Vani LBR(1~4kbps)到中位速率语音编译码器Vani MRC(5.5~7kbps),以及Vani WBC宽带语音编译码器(16~32kbps)。SAS公司正与东芝公司合作,在东芝的TC8006DSP平台上实施它的2,7kbps LBR技术。虽然,该公司的  相似文献   

11.
MICOM通信公司宣布向亚太市场推出其最新IP语音产品和技术——V/IP(IP语音)电话/传真IP网关,从而满足最新出现的激动人心的In-tranet电话市场的需要,并为Internet服务供应商提供了公共交换电话网网关(PSTN)。 MICOM公司的V/IP可在任何IP(Internet协议)网络上形成一个重叠的语音/传真网络,从而能大幅  相似文献   

12.
激光麦克风是一种利用光学多普勒效应获取远场语音信息的技术,其语音质量受到探测系统自身特性、光探测路径以及目标物等多个方面的影响。为了从远距离声场下的目标物获取更高质量的语音信息,文中通过单频声激励实验获得了4种典型目标物(A4纸片、A4纸盒、瓦楞盒、塑料瓶)的声致振动频率响应,发现了其在频率上的非均匀性。在此基础上,提出了一种基于ResUnet和TFGAN网络的激光语音增强方法,其通过ResUnet网络预测去噪梅尔谱图,并利用TFGAN网络由预测的梅尔谱图恢复出激光语音的时域波形。然后,利用实验室自制的激光麦克风在4种目标物上进行了远距离语音采集实验,采用文中提出的方法对采集到的激光麦克风语音进行了处理,并与非线性函数谐波重构法、DNN+谐波重构法进行了比较。最后利用客观语音质量评估(PESQ)和时域分段信噪比(SNRseg)对处理后的激光语音进行了量化评估。实验结果表明,在4种目标物上采集到的激光语音,经过非线性函数谐波重构方法和DNN+谐波重构方法处理后,语音质量均无明显提升,其相应的PESQ和SNRseg分值无明显提高。而经过文中所提的ResUnet+TFGAN网络方法处理后,激光语音取得了更高的PESQ和SNRseg分值,语音质量明显提升。因此,文中提出的方法在激光麦克风应用中具有更好的激光语音增强效果。此外,由实验结果可知,此方法在频率响应一致性较差的目标物上,仍然可以较好地重建频谱,恢复出高质量的语音信息。  相似文献   

13.
提出了一种结合MBE(多带激励)模型和LPC(线性预测编码)模型的1.8kbps声码器.在这种声码器中,采用LPC特征参数来代表语音帧的频谱,利用LPC残差进行基音提取和多带清浊音判决,采用MBE模型合成语音,并在高频浊音带的语音合成中混以清音.在定点Mo-torola DSP56002 EVM上,可以在1.8kbps的码率下对语音进行实时的编解码处理,具有存储量和计算量较小的特点.其合成语音质量超过了LPC-10e.  相似文献   

14.
语音业务中鲁棒性VAD算法分析   总被引:4,自引:0,他引:4  
采用话音激活检测(Voiced Activity Detection,VAD)技术的目的是检测语音通信时是否有话音存在,检测到静音时加以抑制,使其不占用或极少占用信道带宽,检测到话音时才对其进行压缩编码与传输.鲁棒性语音识别系统、数字移动通信和因特网实时语音传输等领域要求在恶劣声学环境条件下进行VAD检测,以节省带宽并抑制噪声,因此VAD技术是目前语音处理领域的重要问题.文中给出的几种最新VAD算法(EZCR-VAD,STAT-VAD和E-VAD)是在低信噪比环境下的话音检测具有很好的鲁棒性的算法.  相似文献   

15.
石红晓  刘佳  钱华 《电信快报》2021,(11):27-30
语音业务作为最基础的通信服务,拥有最高的网络承载优先级,在5G时代仍然是运营商重要的基础业务之一。简要介绍语音方案演进历程,分析VoNR(5G语音承载)、EPS Fallback(5G语音回落4G)、RAT Fallback(5G语音回落eLTE[增强型4G网络])以及5G SRVCC(5G语音回落2G/3G)等语音方案的特点。提出分为两个阶段三种方式的5G语音解决方案分阶段部署建议,为5G语音技术的发展和完善、运营和部署提供一定参考。  相似文献   

16.
11月4日,语音和数据网络的模拟/混合信号IC的主要供应商力捷(Legerity)半导体在京举办新闻发布会,副总裁埃里克·布鲁克曼(Eric Broockman)宣布了在华战略,及介绍了推出的新产品。11月1日,公司已宣布其新的亚洲总部在上海正式成立。该办事处将作为力捷半导体公司在亚洲的主要业务基地,重点放在大中华区市场。力捷将利用其VoiceChipTM系列宽带语音(VoB)IC和芯片组,寻求在亚洲的宽带语音设备设计机会,同时继续向中国的局用交换机(CO)和数字回路载波系统(DLC)设备制造商提供业内领先的模拟线路板解决方案。力捷也为亚洲的宽带、…  相似文献   

17.
提出了一种结合 MBE(多带激励 )模型和 LPC(线性预测编码 )模型的 1 .8kbps声码器 .在这种声码器中 ,采用 LPC特征参数来代表语音帧的频谱 ,利用 LPC残差进行基音提取和多带清浊音判决 ,采用 MBE模型合成语音 ,并在高频浊音带的语音合成中混以清音 .在定点 Mo-torola DSP560 0 2 EVM上 ,可以在 1 .8kbps的码率下对语音进行实时的编解码处理 ,具有存储量和计算量较小的特点 .其合成语音质量超过了 LPC- 1 0 e.  相似文献   

18.
语音增强     
多带激励声码器(MBE)由MIT的Griffin在1987年提出,其改进算法(IMBE)已被INMARSAT采纳作为卫星话音通信的标准。MBE声码器在中低速率上可获得较好的合成语音质量,但在噪声环境中使用时,随着输入信噪比的降低,其性能将显著恶化。本文试图将语音增强技术与MBE模型相结合以提高声码器抗噪声的性能。我们研究了两种方案:一是采用语音增强预处理器和IMBE声码器级联,二是将语音增强技术和IMBE声码器有机结合构成语音增强IMBE声码器。客观测试和主观试听表明,这两种系统在噪声环境中工作时,性能都有很大的提高。  相似文献   

19.
引言 语音信号处理应包括:语音通信(人讲话、人听话)、语音识别(人讲话、机器听话)和语音合成(机器讲话、人听话)三类。 语音通信是指人讲了话形成语音信号之后,如何通过机器进行变换(压缩)和传输,最后到达人耳之前的处理过程。关键是解决语音质量与  相似文献   

20.
提出了一种谱扩展算法,先对窄带语音进行线性预测编码(LPC)分析和多带激励(MBE)分析,得到窄带语音的线性谱频率(LSF)参数和清/浊音(U/V)判决信息;利用高斯混合模型(GMM)由窄带语音的LSF参数扩展得到高带语音的包络谱信息;对于激励信号,由窄带语音的U/V判决信息通过码本匹配得到高带的U/V判决,然后根据U/V判决信患由正弦模型合成出高带激励信号,并进而由LPC方法生成高带语音。最终的宽带语音由原始窄带语音和扩展得到的高带语音经子带合成得到.实验结果表明该算法扩展得到的宽带语音能有效提高语音信号的清晰度和可懂度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号