首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
G.726语音压缩算法在低码率下的改进与实现   总被引:1,自引:0,他引:1  
G.726协议制定的ADPCM音频压缩算法在语音数字通信领域应用广泛.通过对G.726算法流程的分析,提出了一种改进算法编码器的方案,并通过编程与测试,证明了此改进方法的可行性,该方案可提高G.726算法在低码率下的语音还原质量.  相似文献   

2.
本文提出了一种方案,可以在一个模块上实现32路DTMF/MFC信号的接收、发送,ADPCM语音压缩解压缩、IVR、录音,电话会议。  相似文献   

3.
一种基于波形变换域的分段ADPCM语音编码算法   总被引:2,自引:0,他引:2  
本文在Mozer语音编码算法基础上,提出一种利用波形变换与分段ADPCM相结合的语音编码算法。文中在介绍Mozer方法的要点及其局限性基础上,着重讨论浊音的波形变换与分段ADPCM的编译码过程,文末给出了汉语普通话常见五个单元音量化信噪比的测试结果。实验表明,波形变换后,利用分段四位ADPCM编码,其短时信噪比的平均值超过20dB,且在很宽的输入范围内与语音信号功率动态范围无关。当信号采样频率为8kHz时,利用波形的对称性和半对周期取零技术以及基音周期的重复,其输出数码率可达2~4千比特/秒。  相似文献   

4.
无线传感器网络的语音应用研究   总被引:1,自引:0,他引:1  
研究如何在无线传感器网络中进行语音通信。研究了语音包的延迟,尤其是使用的MAC层和路由层协议对语音包的延迟造成的影响,同时分析了几种常用的语音编码算法的性能,从中选取了ADPCM算法作为无线传感器网络进行语音通信的语音编码算法。采用NS网络仿真器,对所采用的MAC层和路由层协议的延迟进行仿真,并使用MATLAB对ADPCM语音编码算法的效果进行了仿真。  相似文献   

5.
一种新的语音数据压缩算法   总被引:2,自引:0,他引:2  
提出了一种基于B样条曲线拟合的语音压缩算法,为语音数据的压缩提供了新的思路。在PCM语音文件中,采用分段直线的方法对语音样本数据进行拟合,其处理结果与ADPCM的处理结果相近,如果采用高次的B样条曲线来拟合语音数据,在压缩率略有下降的情况下,话音质量将明显提高。算法具有实现简单、效率高的特点。  相似文献   

6.
主要介绍基于SPCE061A的嵌入式语音通信平台的主要原理、框架结构以及其中主要问题的实现策略。对于语音通信的应用和研究具有很好的借鉴意义。  相似文献   

7.
针对目前监控系统只有视频监控而缺少语音通信的现状,提出了一种基于ARM的无线语音通信及视频监控系统的设计方案。该系统采用自适应差分脉冲编码调制算法进行语音编码压缩,采用离散余弦变换算法对视频数据进行编码压缩,采用TCP/IP协议,通过无线局域网进行数据传输。测试结果表明,该系统不仅实现了视频监控及语音实时通信,且性能可靠,成本低。  相似文献   

8.
针对目前监控系统只有视频监控而缺少语音通信的现状,提出了一种基于ARM的无线语音通信及视频监控系统的设计方案。该系统采用自适应差分脉冲编码调制算法进行语音编码压缩,采用离散余弦变换算法对视频数据进行编码压缩,采用TCP/IP协议,通过无线局域网进行数据传输。测试结果表明,该系统不仅实现了视频监控及语音实时通信,且性能可靠,成本低。  相似文献   

9.
针对目前在近场语音环境中语音增强系统噪声干扰大、难以清晰还原信号等局限性,设计并实现一种基于麦克风阵列的新型语音增强系统。系统硬件设计新颖,采用低功耗设计,最大支持12路语音信号同时采集,同时对噪声的处理采用自适应差分脉冲编码调制和卡尔曼滤波算法相结合分开处理的新型方式。通过Matlab仿真和封闭近场环境下的实际测试,结果表明该系统性能稳定可靠,可以提高语音清晰度,实现短距离的多路语音增强。  相似文献   

10.
为了减少图像传感器视频数据的输出,提出了一种通过编码相邻两帧之间差值的无损视频压缩算法.算法首先将基于差分脉冲编码调制原理的差分操作在模拟域实现,减小了电路的复杂度.然后两帧之间的差值被基于块的无损压缩方案编码.实验结果证明,压缩后的图像数据可以被无损失的还原.通过对7个具有代表性的8位深度1280×720@60 fps的样本视频进行测试,在块大小为4×4和模式切换阈值为63时实现了最佳的压缩效果.在几乎没有光的条件下压缩率高达78.5%.在复杂运动场景下该算法压缩率为43.5%.提出的压缩算法更适用于长时间处于静止场景的视频录制.  相似文献   

11.
A solution to the problem of speech recognition with signals distorted by low-bit rate coders is presented in this paper. A model for the coding-decoding distortion, a HMM compensation method to include this model, and an EM-based adaptation algorithm to estimate this distortion are proposed here. Medium vocabulary continuous-speech speaker-independent recognition experiments with 8 kbps G.729(CS-CELP), 13 kbps RPE-LTP (GSM), 5.3 kbps G723.1, 4.8 kbps FS-1016 and 32 kbps G.726(ADPCM) coders show that the approach described in this paper is able to dramatically reduce the effect of the coding distortion and, in some cases, gives a word accuracy higher than the baseline system with uncoded speech. Finally, the EM estimation algorithm requires only one adapting utterance and the approach described is certainly suitable for dialogue systems where just a few adapting utterances are available.  相似文献   

12.
利用ADPCM进行网络环境下实时多点语音通信   总被引:1,自引:0,他引:1  
目前网络语音通信应用逐步增多,但效果还不甚理想。该文阐述了应用音频处理API函数、ADPCM编码调制技术和UDP协议进行网络环境下实时多点语音通信的方法,并给出其实现过程。实现机制为发送端利用低层音频服务的回调机制对音频数据块进行动态循环处理,防止了由于系统在写满语音输入缓冲区后,新、旧缓冲区交换时有一定的间隙而产生的输入数据泄漏。在传输之前采用ADPCM编码,有效地利用了现有带宽,传输后经缓冲解码再进行播放,尽可能地恢复原始语音信号。由于采用ADPCM编解码技术,实现了在各种网络环境下进行实时多点语音通信,效果较为理想。  相似文献   

13.
为满足某控制系统实时记录语音和播放录音的实际需求,基于语音压缩编码技术,以现场可编程门阵列(FPGA)为控制核心,设计实现了16个通道采集语音信号,进行ADPCM编码,将语音文件以WAVE格式存储,集监听、播放指定语音通道及任意时间段录音于一体的紧凑型PCI(CPCI)板卡。该板卡区别于传统语音卡的创新点在于运用语音叠加技术使板卡具有混音功能,能够将不同通道语音混音、记录存储,同时具有压缩比可自由选择的功能。详细介绍了板卡的组成机构、工作原理、硬件设计和软件设计。最后进行实验测试,板卡语音存储、语音回放等各项功能正常,音质良好,验证了设计方案的可行性与实用性。  相似文献   

14.
提出了一种基于最佳小波包变换和SPIHT编码的语音信号压缩编码方法。该方法首先对语音信号进行小波包变换,求解最佳小波树,进行动态位分配,再用改进的SPIHT算法对变换后的小波系数进行压缩编码。并且采用了熵编码的方法进一步提高了压缩比。实验表明,该方法在较高的压缩比下能获得较好的信号重构质量,计算复杂度低,延迟小。  相似文献   

15.
基于MP算法的语音信号稀疏分解   总被引:4,自引:1,他引:3       下载免费PDF全文
语音信号稀疏分解是一种新的语音信号分解方法,可以将语音信号分解为很简洁的近似表达形式。在语音信号稀疏分解的基础上,可应用于语音处理的多个方面,如语音压缩、语音去噪和语音识别等。研究利用Matching Pursui(tMP)算法实现语音信号的稀疏分解,实验结果表明基于MP算法的语音信号稀疏分解具有较好的重建精度和较高的稀疏度。  相似文献   

16.
压缩感知分组分离语音增强   总被引:1,自引:0,他引:1  
压缩感知(Compressive Sensing,CS)是一种基于信号稀疏性的采样方法,可以有效提取信号中所包含的信息。提出了一种分组分离压缩感知语音增强新算法。算法利用语音在离散快速傅里叶变换(Fast Fourier Transform,FFT)域下的稀疏性,设计复域观测矩阵与软阈值对带噪语音进行压缩测量与去噪,通过可分组分离逼近稀疏重建(Sparse Reconstruction by Separable Approximation,Spa RSA)算法恢复语音信号,实现语音增强。实验表明:该算法对含噪信号压缩重构,信噪比幅度较大提高,能更有效地抑制背景噪声。  相似文献   

17.
本文论述利用语音的波形编码技术中自适应差分脉码调制.将8位码的语音数据区缩成四位数据的方法和程序.该程序也适用于其它非语音数据的压缩,并可在任何配有高级语言的微机上使用.  相似文献   

18.
An enhanced ADPCM coder for voice over packet networks   总被引:1,自引:0,他引:1  
ITU-T G.726 ADPCM has traditionally been considered a toll-quality coder and has been deployed ubiquitously in the public switched telephony network (PSTN). Currently, it is also being considered as the baseline means for carrying voice over connection-oriented packet networks, such as ATM and frame relay. At a high coding rate of 32 kbit/s, however, ITU-T G.726 ADPCM may still produce coded signals with annoying quantization noises. This paper proposes using two perceptually motivated approaches to enhance the performance of ITU-T G.726 ADPCM: (1)noise spectral shaping at the encoder; and (2)adaptive postfiltering at the decoder output. Based on listening experiments, we found that the combined system at various bit rates (16, 24, 32 kbit/s) consistently outperform G.726 ADPCM of the same bit rate. In particular, the combined system operating at 32 kbit/s consistently outperforms ITU-T 16 kbit/s G.728 LD-CELP. At 24 kbit/s, the performance is very close to G.728 LD-CELP and/or G.726 ADPCM at 32 kbit/s.  相似文献   

19.
Wavelet decomposition reconstructs a signal by a series of scaled and translated wavelets. Incorporating discrete wavelet decomposition theory with neural network techniques, wavelet networks have recently emerged as a powerful tool for many applications in the field of signal processing, such as data compression and function approximation. In this paper, four contributions are claimed: (1) From the point of view of machine learning, we analyse and construct wavelet network to achieve the compact representation of a signal. (2) A new algorithm of constructing wavelet network is proposed. The orthogonal least square (OLS) is employed to prune the wavelet network. (3) Our experiments on speech signal processing results show that the wavelet network pruned by OLS achieves the best approximation and prediction capabilities among the representative speech processing techniques. (4) Our proposed methodology has been successfully applied to speech synthesis for a talking head to read web texts.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号