首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
本文研究了在音频信息上实现水印技术的难点与价值,分析和对比了利用音频信号进行信息隐藏的算法,探讨了隐蔽通信的编码策略,提出了一种基于混合模式的语音信号的信息隐藏编码算法。文中首先给出了编码过程中覆盖半径、覆盖编码等相关定义和信息隐藏编码的相关定理,从理论上分析了隐蔽通信编码策略的可行性和步骤;接着详细论证了该编码算法的基本原理、构造方法和算法的实现过程;然后以一段音频信息为例,阐述了隐蔽通信算法的实现方法和编码步骤;最后从算法的频谱分析、隐蔽信息嵌入量和听觉效果三个方面对算法性能进行测试。测试结果表明,算法隐蔽信息嵌入量可达2.1×103bps。  相似文献   

2.
罗元  陈君  张毅  童开国 《计算机应用研究》2012,29(10):3765-3768
从人耳听觉特性出发,对能模拟耳蜗基底膜滤波特性的伽马通滤波器组进行了研究、修正,并以修正的滤波器组为基础,提出了一种基于耳蜗基底膜特性的GT-ERBCC(equivalent rectangular bandwidth cepstrum coeffi-cient based on GammaTone filters)语音特征提取方法。该方法能准确地表征出语音信号的特征,降低语音识别系统的难度,并将该方法应用于智能轮椅人机交互实验中。结果表明,基于耳蜗基底膜特性的特征提取方法能有效提高语音识别系统的识别率。  相似文献   

3.
语音MFCC特征计算的改进算法   总被引:1,自引:0,他引:1  
提出了一种计算Mel频倒谱参数(Mel frequency cepstral coefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(Wrapped discrete Fourier transform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同时还运用了加权滤波器分析(Weighted filter bank analysis,WFBA)技术,以提高MFCC的鲁棒性。对TIMIT连续语音数据库中DR1集的音素识别结果表明,本文提出的改进算法比传统MFCC算法具有更好的识别率。  相似文献   

4.
基于语音增强技术的AMBE编码算法研究   总被引:1,自引:0,他引:1  
参数编码算法在语音通信中噪声不能避免且无法完全滤除掉,造成提取参数不准确。针对提取参数精确度低的问题,提出了一种基于语音增强技术的先进多带激励语音编码算法。对语音增强算法的原理进行了简要的描述,提出采用AMBE语音编码算法中参数的提取方法。进行仿真的结果表明,经语音增强技术处理后的合成语音质量明显好于未经语音增强技术处理的合成语音,表明改进的编码算法能有效抑制噪声、提取出更加精确的语音参数,合成语音效果更好。  相似文献   

5.
针对现有的语音可懂度评价方法不能真实贴近人耳对语音的感知过程,提出一种基于人耳听觉特性的双谱特征预测语音可懂度评价(Gammatone-bspectral speech intelligibility metric, GBSIM)算法。充分利用双谱可以检测语音信号中的非线性相位耦合,抑制非高斯信号中的高斯噪声的特性,采用可以模拟人工耳蜗模型的Gammatone滤波器组,通过滤波处理将输入的语音信号分为32个听觉子频带,用三阶统计量对每个子频带的语音信号进行双谱估计并提取单一特征值来计算语音的可懂度。实例验证结果表明,该方法对信号失真变化敏感,其评价结果与主观评价具有很高的相关度,相对于传统的语音可懂度评价算法具有更好的评价效果。  相似文献   

6.
为有效解决现有语音信号压缩算法基本没有考虑人耳听觉特性,所划分出的子带与人耳听觉特性相去甚远,语音质量不高的问题,提出了一种基于不完全小波包分解的语音数据压缩算法.该算法充分考虑语音信号的特点以及人耳听觉特性,利用小波包合理分割子带,在每个子带内进行编码,并采用优化目标函数,作为选择最优小波基的评价函数,使划分出的子带更符合人耳听觉特性.实例仿真计算表明,该方法能取得较高的压缩率,压缩后恢复的语音信号具有良好的清晰度和自然度.  相似文献   

7.
提出一种基于人类听觉特性的自适应小波滤波算法。该方法用听觉感知小波变换对含噪语音信号进行小波分解,这样可以保证对信号频率和幅值的听觉特性,将经听觉感知小波变换所分离出来的噪声成分作为自适应滤波器的输入。通过采用递推最小二乘算法从而实现信噪分离的最佳滤波,以保证去除信号中的相关噪声。结果表明,该方法能实现非平稳信号在同频段对噪声成分和有用信号的最佳估计,提高了语音的清晰度和可懂度。  相似文献   

8.
无线传感器网络的语音应用研究   总被引:1,自引:0,他引:1  
研究如何在无线传感器网络中进行语音通信。研究了语音包的延迟,尤其是使用的MAC层和路由层协议对语音包的延迟造成的影响,同时分析了几种常用的语音编码算法的性能,从中选取了ADPCM算法作为无线传感器网络进行语音通信的语音编码算法。采用NS网络仿真器,对所采用的MAC层和路由层协议的延迟进行仿真,并使用MATLAB对ADPCM语音编码算法的效果进行了仿真。  相似文献   

9.
语音质量是评价通信系统的一项重要指标。现有的语音质量感知评估算法采用基于Bark谱的感知模型,其算法复杂度较大,并且对于人耳的频率选择性的模拟存在不足。针对这一问题,本文提出一种新的客观语音质量评估方法,采用更加符合人耳听觉特性的Gammatone滤波器组提取特征参数,计算原始语音与失真语音的平均失真距离,并由主观平均意见分值和归一化平均失真距离之间的映射关系求出客观平均意见分值。实验表明,与感知评估方法相比,本文所提出算法的计算复杂度大大降低,同时保持了客观平均意见分值与主观平均意见分值之间的高相关度。  相似文献   

10.
数字语音处理是采用数字化的方法,对语音的传送、存储、识别、编码等进行数字化处理,涉及多个学科,广泛应用于数字通信、语言学习、自动翻译、人工智能等多个领域。滤波器在数字信号处理中发挥着重要作用。设计一个低通滤波器,对语音信号进行滤波,以获得语音信号的低频分量。  相似文献   

11.
These days’ speech processing devices like voice-controlled devices, radio, and cell phones have gained more popularity in the area of military, audio forensics, speech recognition, education and health sectors. In the real world, speech signal during communication always contains background noise. The main task of speech related applications is voice activity detection (VAD) which include speech communication, speech recognition, and speech coding. Noise-reduction schemes for speech communication may increase the quality of speech and improve working efficiency in military aviation. Most of the developed algorithms can improve the quality of speech but unable to remove the background noise from the speech. This study provides researchers with a summary of the challenges in speech communication with background noise and provides research directions in the area of military personnel and workforces who work in noisy environments. Results of the study reveal that the DSP-based voice activity detection and background noise reduction algorithm reduced the spurious values of the speech signal.  相似文献   

12.
马英  张凌飞  陈善继 《测控技术》2017,36(11):32-35
语音通信中,强烈的背景噪声会影响语音信号的传输质量,为了提高语音通信的抗噪声性能,针对说话时伴随着呼吸引起的宽带噪声,分析传统抗噪声方法存在的问题,提出自相关与同态滤波相结合的改进方法,对纯净的语音信号和噪声信号进行分离,提取纯净语音信号.通过实验仿真明显提高了语音处理系统的传输质量,达到了语音增强的目的,其鲁棒性更好.  相似文献   

13.
本文研究了一种语音信号处理方法、装置及系统,涉及无线通讯技术领域。该方法包括:获取语音信号,并将该语音信号转换为数字编码流,然后对数字编码流进行时域分割,得到多个子帧,并将设定连续数量个子帧划分为一个超帧,以子帧为单位对每个超帧进行超帧同步和乱序处理,得到加扰处理后的加扰编码信号。由于将语音信号在时域内进行分割,通过增加或缩小每个子帧的时长,以及增加或缩小超帧包含的子帧数量,可以增加乱序的长度和数量,使得乱序的组合数量大大增加,从而能够满足实际需要。另外,与频域分割不同,时域的分割很容易实现,并且可以确保各个子时隙(子帧)之间完全独立,相互不影响,从而提高了语音通信质量。  相似文献   

14.
刘玉珍  田金波 《测控技术》2016,35(11):33-35
语音端点检测是语音信号处理过程中的一个重要步骤,其准确性对语音信号处理有直接影响.传统的双门限语音端点检测技术,在纯净语音或高信噪比的情况下,语音端点判断准确,但低信噪比的情况下,端点识别率很低,出错率较高.为了提高低信噪比条件下语音端点检测的识别率,在传统双门限语音端点检测的基础上融合了语音增强,通过Matlab仿真实验,取得了较高的语音端点检测准确率.  相似文献   

15.
Low-rate multimode multiband spectral coding of speech   总被引:1,自引:0,他引:1  
At bit rates of 4 kbps and below, conventional time-domain algorithms such as CELP fail to retain high voice quality and robust performance against background noise as their waveform-matching ability is curtailed by the severely limited codebook space. Spectral coding, on the other hand, offers an effective parametric model, amenable for low-rate implementation. Instead of performing waveform matching, spectral coders preserve only the perceptually important spectral attributes of the speech signal. Spectral coding algorithms encompass a broad family of emerging low-rate speech coding techniques, the common goal being the representation of the short-term spectrum of input speech with a limited set of spectral parameters and the synthesis of the output speech with a set of sinusoids. Pitch, frequency-domain voicing information, and a varying number of spectral magnitudes are the usual parameters of spectral coders. In this paper, we present the enhanced multiband excitation (EMBE) coder as an illustration of this new generation of low-rate spectral coders. The distinguishing features of EMBE are: (a) signaladaptive multimode spectral modeling and parameter quantization, (b) two-band signal-adaptive frequency-domain voicing decision, (c) a novel VQ scheme for the efficient encoding of the variable-dimension spectral magnitude vectors at low-rates, and (d) multi-class selective protection of spectral parameters from channel errors. A 4 kbps implementation of the EMBE spectral coding algorithm with 2.9 kbps source coding and 1.1 kbps for channel coding was specifically designed for satellite-based communication systems, targeting good voice quality at low bit rates and robust performance against channel errors. Fundamental concepts of the EMBE spectral coding algorithm, implementation details, and performance comparisons of the 4 kbps EMBE coder with earlier coders are reported.  相似文献   

16.

含噪条件下的语音增强技术是语音信号领域的重要研究方向之一,该技术对于提升语音视频通话的质量、提高人机交互和语音识别的性能具有重要作用. 为此,提出了基于扩张卷积和密集连接的语音增强网络结构,通过学习语音时频谱的频率、时间轴的上下文信息,有效提高了网络的特征表达能力. 具体来说,所提结构将扩张卷积融入到时间、频率处理的基础单元中,以确保在频率方向和时间方向上均可获得足够大的感受野,提取出深层语音特征;同时,密集连接被应用到这2个基础单元的级联结构中,由此可避免多处理模块级联带来的信息丢失,从而增强特征利用效率. 实验结果表明所提出的语音增强网络在语音质量客观评估(perceptual evaluation of speech quality,PESQ)和短时客观可懂度(short-time objective intelligibility,STOI)以及各类主观平均意见方面的总体评分,相比于现有的各类语音增强模型,均居于领先水平. 此外,所提网络对各种含噪条件的泛化能力也在实验中得以评估.

  相似文献   

17.
语音信箱中的DSP并行处理系统设计   总被引:1,自引:0,他引:1  
根据语音信箱系统的需要,给出了一种基于TMS320C50时分多用串口上的DSP并行处理子系统的硬件设计和软件应用。它可同时完成多路语音信号的处理,而语音处理程序可以加载,提高了系统的灵活性。同时该子系统的应用不只限于语音处理,也可用于其它需要进行多路数字信号处理的场合。  相似文献   

18.
韩钰  普杰信 《计算机应用》2010,30(2):564-566
混音处理在网络电话会议系统中起着举足轻重的作用,怎样解决混音中带来的溢出和噪声问题又是混音处理的核心。通过对现有混音算法中存在问题的分析,提出了一种自适应减谱法,在不发生溢出现象的基础上,对语音信号进行傅里叶变换,从带噪语音的功率谱中减去噪声功率谱,从而得到较为纯净的语音频谱来降低噪声,再进行傅里叶反变换将其与混音权重相适应,使混音后的音质更清晰且流畅,避免了混音过程中的噪声问题,提高了混音后的质量,音质更接近于现场会议,可以应用于多媒体电话会议系统中。  相似文献   

19.
During the last five decades, extensive researches have been carried out in the field of speech compression, which has resulted in various techniques for speech coding. Researchers have been in full swing for more efficient speech coding and their effort is still continuing in different parts of the world. In this paper we are proposing an alternative method for better speech coding. In the proposed technique we use discrete wavelet transform to decompose the signal and wavelet energy is used to differentiate between active voice region and silence region in the speech signal. Depending upon the region’s status the system, different thresholding strategies have been chosen which leads to a better compression without any loss of speech intelligibility. The proposed method is evaluated in terms of qualitative and quantitative parameters. In this paper we also propose an alternative parameter for MOS values which is here after known as System Recognition Rate.  相似文献   

20.
情感特征的提取是语音情感识别的重要方面。由于传统信号处理方法的局限,使得提取的传统声学特征特别是频域特征并不准确,不能很好地表征语音的情感特性,因而对情感识别率不高。利用希尔伯特黄变换(HHT)对情感语音进行处理,得到情感语音的希尔伯特边际能量谱;通过对不同情感语音的边际能量谱基于Mel尺度的比较分析,提出了一组新的情感特征:Mel频率边际能量系数(MFEC)、Mel频率子带频谱质心(MSSC)、Mel频率子带频谱平坦度(MSSF);利用支持向量机(SVM)对5种情感语音即悲伤、高兴、厌倦、愤怒和平静进行了识别。实验结果表明,通过该方法提取的新的情感特征具有较好的识别效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号