期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

语音信号特征参数研究

SHI Hai-yan 《数字社区&智能家居》2008,(4)

在语音技术的发展过程中使用了大量的语音信号特征参数,好的语音信号特征参数能对语音识别起至关重要的作用。本文对语音信号特征参数、语音信号特征参数的选择进行了介绍,并介绍了语音信号的短时能量、短时平均幅度的提取。相似文献

2.

用于语音动画合成的语音特征提取和聚类技术 总被引：4，自引：0，他引：4

叶静董兰芳王洵《微型机与应用》2004,23(8):47-49

在基于图像的人脸语音动画合成过程中,为了保证音频帧和视频帧的精确映射关系,需要提取鲁棒的语音信号特征参数,并对特征参数聚类。本文介绍了直接从原始语音信号中提取LPC复倒谱及短时能量组成特征矢量的方法,以及对特征矢量进行聚类的方法。相似文献

3.

基于短时能量—LPCC的语音特征提取方法研究

王钟斐王彪《计算机与数字工程》2012,40(11):79-80,127

为了提高语音信号的识别率,提出了一种基于短时能量—LPCC的语音特征提取方法。该方法在LPCC参数的基础上,增加每帧信号的短时能量信息,使得新参数能够更为准确的表征语音信号。通过仿真实验,说明了新特征参数取得了较高的识别率。相似文献

4.

基于短时能零熵的端点检测方法 总被引：1，自引：0，他引：1

尹岩岩殷业罗汉文钱栋军《计算机仿真》2012,29(11):408-411

端点检测技术是语音识别系统预处理阶段中的第一个关键技术,而传统的端点检测特征参数LPC距离、倒谱特征、TF参数和分形特征等参数的运算量太大,对硬件要求很高,阻碍了人机交互技术在日常生活中的普及。通过对语音信号三个端点检测的特征参数短时平均过零率、短时能量和基本谱熵逐一分析研究,提出了一种新型的语音参数——短时能零熵值,并作为主要参数应用于端点检测中。实验证明,短时能零熵值结合了信号的时域和频域语音特征,能够对背景噪声做出反馈、并且可以在复杂的背景噪音环境下对语音和非语音做出有效、稳定的区分,其端点检测的隔离度较大,具有稳健的抗噪特性。相似文献

5.

基于mel标度频谱和音素分割的汉语语音单词端点检测方法 总被引：3，自引：0，他引：3

丁昊姚天任《计算机与数字工程》2005,33(3):57-59

利用语音声学信号的频谱分析来寻找连续语音信号帧的分割点,再结合音素分割方法,成功的提高了分割精度。实验表明mel标度频谱法比传统的以信号的短时能量,过零率等简单特征作为判决特征参数的语音端点检测方法更适合语音的分割。相似文献

6.

用于自动字幕生成系统的语音端点检测算法

李祺马华东冯硕《软件学报》2008,19(Z1):96-103

字幕信息有助于观众对音视频内容进行理解,在音视频文件中起着不可或缺的作用.针对自动字幕生成系统的要求,提出了一种灵活、高效的语音端点检测算法,可以在复杂背景噪声的情况下,从连续的音频信号中提取语音端点.将短时能量、短时过零率、短时信息熵这3种基本音频参数进行结合,形成新的音频特征参数:短时能零熵(EZE-feature),在结合了音频信号时域特征和频域特征优点的同时,规避了它们各自的不足.在此基础上,还提出了一种环境自适应的语音端点判定算法,在端点检测过程中对背景噪声进行实时分析,并根据背景噪声的变化对短时能零熵参数进行调整.该语音端点检测算法已被成功应用于自动字幕生成系统中. 相似文献

7.

基于DSP的语音识别的设计与实现

张文婷《数字社区&智能家居》2009,(23)

该系统选用了TI公司的TMS320VC5402作为处理器芯片,选择对小词汇量语音识别系统进行研究。实现小词汇量的语音识别主要包括以下三个方面的工作:端点检测、特征提取和模式匹配。在端点检测中,通过对过零率和短时能量参数的检测来判断起始点和结束点,去掉噪声,从而提取出语音信号数据。在特征提取中,首先对语音信号进行分帧、然后计算每帧语音信号的特征参数,该文采用线性预测倒谱参数作为特征参数,这些特征参数组成特征矢量,从而构成语音模板。在模式匹配中,采用了动态时间归整方法,将测试模板与参考模板进行匹配,比较两者之间的失真,得出识别判决的依据。相似文献

8.

基于短时能量的语音信号端点检测

SHI Hai- yan 《数字社区&智能家居》2008,(18)

语音信号端点检测是语音信号的预处理,正确的语音信号端点检测结果直接影响语音识别等后续工作的运算量和准确率。本文介绍了时域方法中基于短时能量的语音信号端点检测方法,并用三种不同的短时能量计算方式和五种短时能量阈值进行了端点检测实验。相似文献

9.

特定人孤立词的语音识别系统研究 总被引：1，自引：0，他引：1

彭辉魏玮陆建华《控制工程》2011,18(3):397-400,404

语音识别是让机器自动识别和理解语音信号,并把语音信号转变为相应的文本或命令的技术.通过对特定人孤立词语音特点的研究,在对语音信号进行预处理的过程中,选择过零率与短时平均能量两项指标作为对语音信号端点检测的依据,提取语音线性预测系数,通过计算分析后获得线性预测倒谱系数,作为语音特征参数.选择动态时间规整法为模板匹配算法,... 相似文献

10.

一种改进的基于倒谱距离端点检测方法研究

董胡《计算机与数字工程》2013,41(7)

在讨论传统倒谱距离语音端点检测方法不足的基础上,提出了一种改进方法.通过对语音信号三个端点检测的特征参数短时能量、短时平均过零率和倒谱距离逐一分析研究,提出了一种结合三者特征的语音参数,将其应用于端点检测中.实验结果表明,该方法相对于基本倒谱距离检测方法,在低信噪比时检测性能有较明显提高. 相似文献

11.

语音信号中基频提取方法研究与综述

郑尚新曹梦霞《电脑与信息技术》2014,(2):8-10

基频(也称音高或F0)及其变化规律是语音信号的一个重要特征。语音作为一种近似周期性的信号,准确提取音频的基频特征参数对语音的后期处理如语音识别等有重要意义。许多学者也在此做了大量的研究工作,并提出了相关算法,取得了较好的结果。文章对语音信号的基频提取算法进行研究,做了一番系统的梳理和简介。相似文献

12.

基于短时平均能量和短时过零率的藏语语音端点检测研究

卓嘎边巴旺堆姜军《数字社区&智能家居》2014,(11):7466-7469

语音端点检测是语音处理分析过程中的重要环节之一,该文介绍了语音端点检测的两个传统算法即短时平均能量和短时过零率,并将这两种算法结合起来进行藏语语音进行端点检测。运用Matlab编程和仿真验证了双门限判断法在藏语语音端点检测中的准确性。这种方法降低了藏语语音处理的时间、提高了处理的质量、可用来进行一些藏语语音识别的特征参数的提取。相似文献

13.

语音驱动人脸动画中语音参数的提取技术

下载免费PDF全文

陈新周东生张强魏小鹏《计算机工程》2007,33(6):225-227

语音特征参数的提取是语音驱动人脸动画中语音可视化的前提和基础，该文立足于语音驱动的人脸动画技术，较为系统地研究了语音参数的提取。在参数精度方面，引入了用小波变换重构原始信号的思想，对重构后的信号进行参数提取，从而为语音驱动人脸动画系统建立良好的可视化映射模型奠定了基础。相似文献

14.

语音信号的预处理和特征提取技术

张节《数字社区&智能家居》2009,5(8):6280-6282

语音信号处理是一门多学科交叉的综合学科,它包含了语音学和数字信号处理等基础学科。这篇文章对语音信号作了两个方面的研究：语音信号的预处理和语音信号的特征提取。预处理是为了更好地进行语音信号的特征提取。是语音信号特征提取获得成功的重要保障。语音信号的预处理介绍了信号的主分量分析（PCA）技术和白化（whitening）技术．而语音信号的特征提取分为时域的和频域的特征提取。并用Madab编程实现了一段语音信号的分析处理。相似文献

15.

On the impact of excitation and spectral parameters for expressive statistical parametric speech synthesis

《Computer Speech and Language》2014,28(5):1209-1232

This paper presents a study on the importance of short-term speech parameterizations for expressive statistical parametric synthesis. Assuming a source-filter model of speech production, the analysis is conducted over spectral parameters, here defined as features which represent a minimum-phase synthesis filter, and some excitation parameters, which are features used to construct a signal that is fed to the minimum-phase synthesis filter to generate speech. In the first part, different spectral and excitation parameters that are applicable to statistical parametric synthesis are tested to determine which ones are the most emotion dependent. The analysis is performed through two methods proposed to measure the relative emotion dependency of each feature: one based on K-means clustering, and another based on Gaussian mixture modeling for emotion identification. Two commonly used forms of parameters for the short-term speech spectral envelope, the Mel cepstrum and the Mel line spectrum pairs are utilized. As excitation parameters, the anti-causal cepstrum, the time-smoothed group delay, and band-aperiodicity coefficients are considered. According to the analysis, the line spectral pairs are the most emotion dependent parameters. Among the excitation features, the band-aperiodicity coefficients present the highest correlation with the speaker's emotion. The most emotion dependent parameters according to this analysis were selected to train an expressive statistical parametric synthesizer using a speaker and language factorization framework. Subjective test results indicate that the considered spectral parameters have a bigger impact on the synthesized speech emotion when compared with the excitation ones. 相似文献

16.

基于动静态组合特征参数的语音识别 总被引：1，自引：0，他引：1

王旭韩志艳王健薛丽芳《计算机科学》2008,35(7):129-132

基于语音信号的时变特性,本文提出了动静态特征参数结合的语音信号识别方法,首先在特征参数提取中引入了小波包变换,借助MFCC(Mel-Frequency Cepstrum Coefficient)参数的提取方法,用小波包变换代替傅立叶变换和Mel滤波器组,提取了新的静态特征参数DWPTMFCC(Discrete Wavelet Packet Transform Mel-Frequency Coefficient),然后把它与一阶DWPTMFCC差分参数相结合成一个向量,作为一帧语音信号的参数,通过试验和仿真,此参数具有很高的识别率,是一种很好的语音特征参数.并且把混沌特性引入到神经元,构成混沌神经网络,把这种神经网络用于语音识别,并与常用的BP神经网络识别方法进行了比较.试验结果表明,混沌神经网络的平均识别率要高于同等条件下常用的神经网络方法的识别率. 相似文献

17.

基于VC和Matlab的实时语音识别系统研究

伊磊刘任平聂欢欢《计算机时代》2011,(9):32-33

介绍了一种基于VC和Matlab混合编程的实时语音识别系统。在VC环境下,通过借助Windows MultimediaAPI实现对信号的实时采集,并且通过Matlab强大的计算功能,实现对语音信号的端点检测、特征值提取和模板匹配,从而实现实时的语音识别。相似文献

18.

一种新的基于信息熵的带噪语音端点检测方法 总被引：5，自引：0，他引：5

严剑峰付宇卓《计算机仿真》2005,22(11):117-120

在自动语音识别和变速率语音编码技术中,语音端点检测是前端处理的一个重要环节.而在实际的噪声环境下,一些传统的端点检测方法已不适用.该文提出了一种新的基于信息熵的语音端点检测方法,该方法通过对语音信号的短时功率谱进行谱分析,由此构造熵函数作为端点检测的特征参数.实验结果表明,该方法在噪声环境下性能优于传统的基于能量的端点检测方法.而且相对于基于频谱谱熵的算法,在低信噪比（SNR〈0dB）情况下,该文方法有更好的鲁棒性,可使平均检测精确度进一步提高约5%. 相似文献

19.

模糊神经网络语音数据融合算法的研究 总被引：1，自引：1，他引：1

下载免费PDF全文

梅晓丹张毅刚孙圣和《控制与决策》2003,18(2):213-216

针对高嗓音环境中的语音识别问题，提出一种利用模糊神经网络进行语音数据融合的新算法。该算法按一定模糊规则对语音信号的特征参数进行模糊化，并通过神经网络对每个传感器语音信号的模糊特征参数进行分类和融合。仿真实验表明，该算法鲁棒性更强；与单传感器算法相比，语音识别率得到较大的提高。相似文献