首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 249 毫秒
1.
基于谱熵的语音检测   总被引:4,自引:0,他引:4  
根据离散余弦变换(DCT)特性和最大离散熵定理,该文提出利用短时语音余弦变换谱的谱熵进行语音信号检测(Voice activity detection)。在强噪声环境下,传统的能量,过零率,相关等检测方法将会失效,而谱熵法则具有稳健的抗噪特性。计算机模拟显示这是一种比较好的抗噪语音检测方案.  相似文献   

2.
王辉  袁淑丹 《电声技术》2013,(11):40-44
为了提高低信噪比下语音端点检测的准确性,提出一种基于经验模态分解与功率谱熵的语音端点检测方法。对带噪语音信号进行经验模态分解获得一系列语音本征模函数,选取功率谱熵作为语音端点检测的特征,并计算特定阶本征模函数的功率谱熵实现语音的端点检测。通过EMD分解可以有效地消除白噪声的影响,仿真结果表明,在低噪比情况下结合经验模态分解和功率谱熵的方法能够有效实现语音端点检测。  相似文献   

3.
《电子质量》2007,(12):63-63
离散余弦变换(DCT)是N.Ahmed等人在1974年提出的正交变换方法。它常被认为是对语音和图像信号进行变换的最佳方法。由于近年来数字信号处理j什=片(DSP)的发展,加上专用集成电路设计上的优势,这就牢固地确立离散余弦变换(DCT)在目前图像编码中的重要地位,成为H.261、dPEG、MPEG等国际上公用的编码标准的重要环节。在视频压缩中,最常用的变换方法是DCT.DCT被认为是性能接近K—L变换的准最佳变换,变换编码的主要特点有:  相似文献   

4.
周伟栋  杨震  于云 《信号处理》2016,32(3):287-295
本文根据语音信号在离散余弦变换(discrete cosine transform,DCT)域上的近似稀疏性,将压缩感知(compressed sensing,CS)应用于语音增强。提出了一种基于压缩感知的语音增强新算法。算法采用对语音信号具有一定鲁棒性的行阶梯矩阵,对含噪语音进行压缩观测,通过改进的正交匹配追踪OMP(orthogonal matching pursuit,OMP)算法重构语音信号,最后用低通滤波器对重构语音进行平滑滤波,实现语音增强。实验结果表明:本文所提语音增强算法在提高输出信噪比的同时,减少了重构时间,具有较强的鲁棒性。   相似文献   

5.
在分析了多普勒信号的特性及语音信号的区别后,采用自适应离散余弦变换算法对多普勒信号进行了压缩编码,在中等编码速率下得到了较好的压缩编码效果。文中提出了相关-自适应离散余弦变换(C-ADCT)压缩编码算法,改进算法提高了自适应离散余弦变换算法的抗噪性能。  相似文献   

6.
基于压缩感知观测序列倒谱距离的语音端点检测算法   总被引:2,自引:0,他引:2  
叶蕾  孙林慧  杨震 《信号处理》2011,27(1):67-72
本文基于语音信号在离散余弦基上的近似稀疏性,采用稀疏随机观测矩阵和线性规划重构算法对语音信号进行压缩感知与重构。研究了语音信号的压缩感知观测序列特性,根据语音帧和非语音帧压缩感知观测序列频谱幅度分布分散且差异较大的特性,提出基于压缩感知观测序列倒谱距离的语音端点检测算法,并对4dB-20dB下的带噪语音进行端点检测仿真实验。仿真结果显示,基于压缩感知观测序列倒谱距离的语音端点检测算法与奈奎斯特采样下语音的倒谱距离端点检测算法一样具有良好的抗噪性能,但由于采用压缩采样,减少了端点检测算法的运算数据量。   相似文献   

7.
【】语音端点检测是目前语音信号相关处理前端一个重要的环节,良好的检测效果可大大提高后续语音处理的效率。本文以模拟装甲车内部环境噪声对带噪语音进行端点检测,旨在通过设计良好的端点检测算法来提高后续语音增强的效果。从实战角度出发,语音端点检测的需求为较高的准确性和实时性以及鲁棒性。本文结合语音信号特性,采取以谱减法作为预处理的基础上通过能熵比对带噪语音进行端点检测,通过实验仿真的方式证明其可行性。  相似文献   

8.
端点检测是语音信号处理过程中非常重要的一步,它的准确性直接影响到语音信号处理的速度和结果。提出了基于ICA(独立分量分析)增强和谱熵的语音端点检测方法。仿真实验表明此方法快速有效,具有较强的抗噪能力,特别适合低信噪比下的端点检测。  相似文献   

9.
提出一种改进的基于离散余弦变换的语音增强算法。在信噪比较低时,传统的基于离散余弦变换的语音增强算法效果较好,能较大幅度地提高信号的信噪比;而当信噪比高时,利用这种方法会滤掉一些有用的信号成份。新算法首先计算出所有高阶离散余弦变换系数对应的时域信号中语音信号出现的可能性大小,然后根据某个阈值计算是否在估计噪声信号绝对值的均方差时保留该系数。实验结果表明在含噪语音信号的信噪比高于10dB时,新算法较传统的基于离散余弦变换的算法具有较好的性能。  相似文献   

10.
本文通过将语音信号处理与图信号处理相结合,为语音样点构建出一种基于遗忘因子的遗忘图拓扑结构,利用基于遗忘图拓扑结构的图邻接矩阵所定义的图傅里叶变换(Graph Fourier Transform, GFT),研究语音图信号的图频域特性。并在此研究基础上,本文将基于自适应子带谱熵(Adaptive Band-partitioning Spectral Entropy, ABSE)算法的端点检测方法拓展至图频域,设计了一种图自适应子带谱熵(Graph Adaptive Band-partitioning Spectral Entropy, GABSE)算法。实验表明,本文所提出的基于遗忘图的GABSE算法可以使得语音段与非语音段谱熵差异更加显著,较传统ABSE算法端点检测及rVAD语音端点检测方法正确率提高了10%~20%,同时也验证了此语音遗忘图结构有效性。   相似文献   

11.
残差信号中的基音信息对语音的说话人个性特征有着重要的影响.本文首先通过转换后的语音谱包络特征参数(LSP)来预测相应的目标基音周期,再利用预测的目标基音周期来修改源语音的残差信号,从而生成所需要的目标语音残差信号.客观评测和主观听觉测试都表明,本文的残差信号生成算法(PP DCT,Pitch Prediction Discrete Cosine Trans-form)性能要好于以往的残差预测法.  相似文献   

12.
基于多元Laplace语音模型的语音增强算法   总被引:1,自引:0,他引:1  
传统的短时谱估计语音增强算法通常假设语音谱分量相互独立,没有考虑语音谱分量间的相关性。针对这一问题,该文提出一种新的基于多元Laplace分布模型的短时谱估计算法。首先,假设语音的离散余弦变换(DCT)系数服从多元Laplace分布,以此利用谱分量间的相关性;在此基础上,利用多元随机矢量的高斯尺度混合模型表示,推导得到语音DCT系数矢量的最小均方误差(MMSE)估计的解析表达式;并进一步推导了基于该分布模型的语音存在概率,对最小均方误差估计子进行修正。实验结果表明,该算法在抑制背景噪声和减少语音失真等方面优于传统的语音增强方法。  相似文献   

13.
该文针对低信噪比环境下二相编码(BPSK)信号参数估值问题,提出一种基于功率谱离散余弦变换(DCT)的BPSK信号参数估值方法。该方法利用DCT的能量集中特性,通过对提取到的BPSK信号功率谱进行离散余弦变换(DCT)和阈值处理可以得到BPSK信号的码长估计。再进行逆离散余弦变换,可以进一步实现对BPSK信号功率谱的降噪处理,消除噪声对估值的影响,进而利用功率谱特征实现对载频和子脉冲宽度的准确估计。实验表明,该方法在低信噪比环境下,可以准确地识别出BPSK信号的码长和对BPSK信号载频和子脉冲宽度的精确估计,并在信噪比时,较对比方法载频和子脉冲宽度的估值准确率分别提高了22.1%和28.3%。  相似文献   

14.
基于FPGA的高分辨率图像DCT域增强   总被引:1,自引:1,他引:0  
为了提高高分辨率图像的质量,实现快速的图像增强算法,提出在离散余弦变换(DCT)的对比度测度下,通过DCT矩阵中不同频率的系数关系对DCT系数块进行分类,对不同类型的系数块做不同强度的自适应增强算法,并在FPGA上得到实现。提出的方法在不影响原始图像压缩性能的情况下有效地增强了图像明亮或黑暗区域的细节,同时减少了因图像增强而带来的压缩图像块效应。给出算法原理及在FPGA上的具体实现方法,并给出了实验结果。结果表明,该算法在改善图像主、客观质量方面和运算效率上都能够达到较好的效果。  相似文献   

15.
谭园园  耿志  李俊山  薛菊 《现代电子技术》2005,28(7):117-118,121
基图像是图像正交变换中比较重要的概念,但目前的文献对基图像的解释不够清楚,对基图像的绘制也没有提及。以二维DCT为例对基图像的概念和意义进行了详细地阐述;分析、解释了基图像的绘制原理,提出了一种用Matlab绘制二维DCT基图像的简便方法,该方法也适用于绘制其他正交变换的基图像。  相似文献   

16.
Structural and statistical characteristics of signals can improve the performance of Com-pressed Sensing (CS). Two kinds of features of Discrete Cosine Transform (DCT) coefficients of voiced speech signals are discussed in this paper. The first one is the block sparsity of DCT coefficients of voiced speech formulated from two different aspects which are the distribution of the DCT coefficients of voiced speech and the comparison of reconstruction performance between the mixed program and Basis Pursuit (BP). The block sparsity of DCT coefficients of voiced speech means that some algorithms of block-sparse CS can be used to improve the recovery performance of speech signals. It is proved by the simulation results of the mixed program which is an improved version of the mixed program. The second one is the well known large DCT coefficients of voiced speech focus on low frequency. In line with this feature, a special Gaussian and Partial Identity Joint (GPIJ) matrix is constructed as the sensing matrix for voiced speech signals. Simulation results show that the GPIJ matrix outperforms the classical Gaussian matrix for speech signals of male and female adults.  相似文献   

17.
The adaptive reconstruction for the lost information of the rectangular image area is very important for the robust transmission and restoration of the image. In this paper, a new reconstruction method based on the Discrete Cosine Transform (DCT) domain has been put forward. According to the low pass character of the human visual system and the energy distribution of the DCT coefficients on the rectangular boundary, the DCT coefficients of the rectangular image area are adaptively selected and recovered. After the Inverse Discrete Cosine Transform (IDCT), the lost information of the rectangular image area can be reconstructed. The experiments have demonstrated that the subjective and objective qualities of the reconstructed images are enhanced greatly than before.  相似文献   

18.
DWT BASED HMM FOR FACE RECOGNITION   总被引:1,自引:0,他引:1  
A novel Discrete Wavelet Transform (DWT) based Hidden Markov Module (HMM) for face recognition is presented in this letter. To improve the accuracy of HMM based face recognition algorithm, DWT is used to replace Discrete Cosine Transform (DCT) for observation sequence ex- traction. Extensive experiments are conducted on two public databases and the results show that the proposed method can improve the accuracy significantly, especially when the face database is large and only few training images are available.  相似文献   

19.
In this letter, a new Linde-Buzo-Gray (LBG)-based image compression method using Discrete Cosine Transform (DCT) and Vector Quantization (VQ) is proposed. A gray-level image is firstly decomposed into blocks, then each block is subsequently encoded by a 2D DCT coding scheme. The dimension of vectors as the input of a generalized VQ scheme is reduced. The time of encoding by a generalized VQ is reduced with the introduction of DCT process. The experimental results demonstrate the efficiency of the proposed method.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号