首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
在研究了4.567kb/s ACELP的语音压缩编码算法基础上,通过分析其原理及其基本特征,在实际应用中提出了优化算法,原算法和优化后的算法分别用C语言仿真实现,发现优化后的算法提高了语音质量,并大大降低了算法复杂度。优化后的语音压缩编译码算法通过在AD-SP21535芯片上编程实现,人耳主观试听,发现其语音质量有较好的自然度,MOS值为3.7左右。  相似文献   

2.
无线传感器网络的语音应用研究   总被引:1,自引:0,他引:1  
研究如何在无线传感器网络中进行语音通信。研究了语音包的延迟,尤其是使用的MAC层和路由层协议对语音包的延迟造成的影响,同时分析了几种常用的语音编码算法的性能,从中选取了ADPCM算法作为无线传感器网络进行语音通信的语音编码算法。采用NS网络仿真器,对所采用的MAC层和路由层协议的延迟进行仿真,并使用MATLAB对ADPCM语音编码算法的效果进行了仿真。  相似文献   

3.
针对目前监控系统只有视频监控而缺少语音通信的现状,提出了一种基于ARM的无线语音通信及视频监控系统的设计方案。该系统采用自适应差分脉冲编码调制算法进行语音编码压缩,采用离散余弦变换算法对视频数据进行编码压缩,采用TCP/IP协议,通过无线局域网进行数据传输。测试结果表明,该系统不仅实现了视频监控及语音实时通信,且性能可靠,成本低。  相似文献   

4.
针对目前监控系统只有视频监控而缺少语音通信的现状,提出了一种基于ARM的无线语音通信及视频监控系统的设计方案。该系统采用自适应差分脉冲编码调制算法进行语音编码压缩,采用离散余弦变换算法对视频数据进行编码压缩,采用TCP/IP协议,通过无线局域网进行数据传输。测试结果表明,该系统不仅实现了视频监控及语音实时通信,且性能可靠,成本低。  相似文献   

5.
基于语音增强技术的AMBE编码算法研究   总被引:1,自引:0,他引:1  
参数编码算法在语音通信中噪声不能避免且无法完全滤除掉,造成提取参数不准确。针对提取参数精确度低的问题,提出了一种基于语音增强技术的先进多带激励语音编码算法。对语音增强算法的原理进行了简要的描述,提出采用AMBE语音编码算法中参数的提取方法。进行仿真的结果表明,经语音增强技术处理后的合成语音质量明显好于未经语音增强技术处理的合成语音,表明改进的编码算法能有效抑制噪声、提取出更加精确的语音参数,合成语音效果更好。  相似文献   

6.
基于SELP算法模型原理,设计了一款高质量多速率语音专用处理器芯片。芯片使用可重构体系结构和超长指令字系统设计方法,将复杂度高的子程序进行优化,能够显著提高指令并行度。仿真结果表明,在该芯片上实现语音压缩编码算法,执行效率高于相同工艺水平的通用DSP,并保持原有编码质量。该处理器能够实现多种类型的语音压缩算法,可以达到对语音算法的高保密性、低复杂度和易开发性。  相似文献   

7.
在VOIP类语音编解码器的实际应用中,语音质量和编解码时间是关键的性能指标.针对最近由GIPS提出的一种新的编码算法--iLBC语音编码算法,分析了它的原理以及其语音质量提高的原因.在PC上实现高性能的语音编码器的基础上提出了算法优化策略,进一步提高实时性.优化的重点是计算复杂度较大的自适应码本搜索和编码等模块.最后对优化前后的代码进行了测试比较,结果显示优化代码比未优化代码的运行时间减少了15%左右.  相似文献   

8.
周晏  王璐 《计算机测量与控制》2014,22(7):2164-2166,2181
为了克服经典正交匹配算法获取原子集时遍历冗余字典具有较大时间开销的缺点,提出了一种基于压缩感知理论和禁忌优化算法的的稀疏故障信号特征提取方法;首先引入了压缩感知模型并描述了基于信号稀疏表示的故障诊断原理,设计了满足RIP准则以最小化l1范数为目标的稀疏信号解的求解方法,然后定义了一种基于正交匹配算法的稀疏信号重构算法,并以最小化余量为目标函数,采用改进的禁忌搜索算法在原子空间中搜索满足目标函数的最优原子集,最后,给出了基于稀疏编码和禁忌优化混合模型的故障信号提取算法;在Matlab仿真环境下对滚动轴承故障信号进行试验,仿真结果表明:文章方法能有效地对具有强噪声的故障信号进行稀疏重构,不仅具有较高的信噪比,而且具有较小的余量误差和仿真时间,与其它方法相比,具有较大的优越性。  相似文献   

9.
1.6Kb/s类MELP语音压缩编码器的FPGA实现   总被引:2,自引:0,他引:2  
基于"CPU软核 模块算法IP"的方法对一个1.6Kb/s类MELP语音压缩编码算法进行了实现,并将整个语音压缩编码器在FPGA上进行了整体验证,实验结果说明本文给出的语音压缩编码器的实现结构是可行的,能够满足语音压缩编码算法对实时性的要求,从而为下一阶段语音压缩编码器的芯片设计提供有力的可行性论据.同时,由于本文给出的语音压缩编码器的实现结构中的各模块算法IP对于许多语音压缩编码算法中都适用,因此该语音压缩编码器的实现结构对不同的语音压缩编码算法具有一定的通用性.  相似文献   

10.
文中旨在提出一种基于神经网络的图像压缩算法对彩色图像信息进行处理,从而减少大规模彩色图像的冗余度,方便其传输、存储及加密等。该算法通过将BP(Back Propagation)神经网络用于彩色图像压缩,利用其多层前馈网络的模式变化能力,实现了对由RGB编码得到的彩色图像数字矩阵进行的压缩编码。经Matlab仿真实验表明,该算法具有良好的压缩效果,且与灰度编码下的图像压缩结果对比,具有更好的压缩效率及保真效果,并能有效地保留原彩色图像的色彩信息,能够满足彩色图像压缩处理的要求。  相似文献   

11.
洪晓芬 《计算机工程与设计》2007,28(22):5453-5454,5477
语音增强技术是解决噪声污染的一项强有力的预处理技术.谱减法通过处理后的语音中会留下所谓的"音乐噪声",针对这个问题,提出了一种多带谱相减与感觉加权相结合的语音增强方法.对带噪语音进行多带谱相减,并根据人的听觉掩蔽特性,对多带谱相减后的信号进行感觉加权,从而进一步降低背景噪声.在语音失真和噪声抑制之间取得良好的折中,减少语音的听觉失真,有效地抑制"音乐噪声",提高语音的清晰度.  相似文献   

12.
文语转换是中文信息处理中研究的热点,是实现人机语音通信的一项关键技术。文章对实现中文文语转换的整个过程进行了初步分析和研究,给出了基于语音数据库的文语转换方法和实现过程。具体介绍了语音库的建立,分析了文本录入、文本分词、文本正则化、语音标注、韵律处理和语音合成等各个环节处理的内容及技术难点。  相似文献   

13.
数字助听器中的多通道响度补偿算法,通常是在划分出的多个频段内分别进行补偿,这在一定程度上会导致共振峰结构的破坏,造成语义信息的曲解或丢失。一种新的非线性的响度补偿方法的提出,无需进行频段的划分,并且根据听损患者在不同频率上对声音强弱的实时感知特性对语音信号进行补偿。该方法不仅使补偿后语音的响度完全映射到听者的听觉范围内,还使得补偿后的响度曲线在轮廓上与原始语音基本保持一致。实验中,小波去噪和移频技术的运用保证了处理效果更加优良。结果表明,该方法能有效提高语音响度和改善听损患者的言语识别率,具有一定的应用价值。  相似文献   

14.
The development of society promotes the continuous progress of science and technology, and speech processing technology gradually occupies an increasingly important position in people’s life and work, which puts forward higher requirements on the speech processing technology, especially in noisy environment. Due to the complexity of the real environment, denoising processing has great practical significance. In order to improve the level of speech denoising and increase the accuracy of the speech recognition system, wavelet denoising technology was used to analyze the de-noising requirements and hard and soft threshold functions in the speech recognition system, and an improved wavelet threshold denoising algorithm was put forward. Firstly, the signals were processed by wavelet decomposition according to primary function; then denoising was performed using the improved function; finally the denoised signals were reconstructed using inverse operation. The denoising effect of the algorithm was verified. The results showed that it was effective in denoising conventional speech signals. Besides, it was applied to the speech recognition system to denoise the noisy speech collected in the real environment, and finally high system self-assessment parameters were obtained. Thus it is concluded that wavelet denoising is effective in the speech denoising of the speech recognition system and can be put into practice.  相似文献   

15.
基于语音识别的汉语发音自动评分系统的设计与实现   总被引:6,自引:0,他引:6  
语音识别技术的发展使得人与计算机的交互成为可能,针对目前对外汉语中发音教学的不足,在结合了语音识别的相关原理,提出了在对外汉语教学领域中汉语自动发音水平评价系统的设计,详细地描述了系统的结构、功能及流程.介绍了系统实现中的关键技术和步骤:动态时间弯折算法、语料库的建立、声韵分割技术以及评价分级标准.通过小范围的试验,表明该系统对留学生汉语发音水平的测试有一定的参考价值.  相似文献   

16.
现代科学技术的发展,计算机运用的普及,其各项智能技术渗透到了各个领域。计算机技术也在实践中得到了较大的提升,其中语音合成技术是现属于语音领域中相关技术人员正在研究的重要课题。人们生活质量的提升,对于计算机的功能要求也在不断提升,人机交流则是其中呼声较高的方面。语音合成的主要目标是使得计算机能够实现语言交流,语音合成系统即为文语转换系统(Text-To-Speech,简称TTS),其是将文字转变为语音的复杂系统,并要求经过合成的语音较为清晰自然,易懂,且具备一定的表现力,但是现代的技术与人们的期待还存在一定的差距,需要继续深入研究。本文简单的分析了几项计算机的语音合成技术,如参数合成法、录音编辑法、波形合成法、基音同步叠加法等,并分析了其的主要发展方向,包括各种文本的语音阅读功能、语音风格、发音形象构建及可视语音、情感语音等,为相关的技术人员提供一定的参考与借鉴。  相似文献   

17.
汉语语音视觉合成研究数据库CVSS1.0   总被引:1,自引:0,他引:1  
目前现有的双模态语音数据库多为外文,且绝大部分都是为语音识别或身份认证服务的。鉴于此,我们根据汉语语音的特点,建立了国内第一个较为完备的汉语语音视觉合成数据库CVSS1.0。它具有如下特点:包含136个单音节和265个连续发音语句的视频和音频数据,其语料规模超出目前同类数据库;语料是在汉语发音方式归类的基础上,依据汉字出现频度的高低选取,其中的独白语句涵盖了大部分的韵律结构,因此其反映的规律具有代表性;记录了脸部发音动作的三维运动信息;用绿点标出了部分MPEG4定义的脸部特征点,方便跟踪;可服务于多种视觉语音合成研究,有很高的通用性。  相似文献   

18.
电话录音和查询系统是现代电信技术与计算机技术高度结合的产物。电话录音和查询系统的设计与开发,关键技术就是把语音信号转换成数字信号然后进行压缩存储,或把压缩的数字信号解压还原成语音信号。语音处理技术越来越广泛受到人们的重视。电话举报系统是集电话录音和查询为一体的语音处理系统。  相似文献   

19.
本文通过对语音存储、语音重组、语音处理等方面的研究,探讨了如何以较小的存储空间实现较优异话音质量的IVR语音系统,这种IVR技术对当今存储空间很小的嵌入式系统具有较大的意义。  相似文献   

20.
The problem of designing a system for speaker verification under the condition that the pronunciation of a phrase is nonuniform in time is considered. The DTW algorithm is studied as a method for smoothing a sequence of speech characteristics in time for improvement of the quality of further processing and making decision about verification. Geppener Vladimir Vladimirovich. Born 1940. Graduated from the Leningrad Electrotechnical Institute in 1964. Received candidate’s degree (in Engineering) in 1969 and Doctoral degree (in Engineering) in 2000. Professor at the Chair of Mathematical Software and Computer Applications of the St. Petersburg Electrotechnical University. Scientific interests are connected with the use of methods of artificial intelligence in systems of signal processing. Author and coauthor of more than 150 scientific publications. Haidar Adel S. Born 1964. Graduated from the Khar’kov Polytechnical Institute in 1988. Since 1989 worked as a programmer at the Center of Statistical Investigations in Aden (Yemen) and as an assistant professor at the Aden University. In 2001–2004, post-graduate student at the St. Petersburg Electrotechnical University. Scientific interests: pattern recognition, speech technologies, and digital signal processing. Author of 10 papers on computer methods for speech recognition. Simonchik Konstantin K. Born 1983. Since 2000, a student of the Chair of Mathematical Software and Computer Applications of the St. Petersburg Electrotechnical University. Scientific interests: pattern recognition, speech technologies, and adaptive and recurrent filtering. Author of 3 papers on applications of digital signal processing.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号