排序方式: 共有42条查询结果,搜索用时 15 毫秒
21.
赵玉晓顾秀秀张二华 《计算机与数字工程》2014,(2):243-247,307
由于传统的说话人识别中,常用的特征参数有线性预测系数(LPC)、Mel频率倒谱系数(MFCC),采用单一特征参数并不能很好地反映说话人特性.针对这种情况,提出了引入Delta特征和特征组合的方法.实验结果表明,引入Delta特征和特征组合对识别效果有明显提高,实验中选用GMM作为说话人识别模型. 相似文献
22.
23.
Pd/Fe双金属对1,2,4-三氯苯的催化脱氯 总被引:4,自引:0,他引:4
采用Pd/Fe双金属体系对1,2,4-三氯苯(1,2,4-TCB)进行了快速催化还原脱氯的研究.结果表明,在钯的催化作用下,零价铁对1,2,4-TCB有较好的还原脱氯效率.当Pd/Fe双金属的钯化氯为0.06%时,催化剂用量为1g/40mL,反应1h后TCB的脱氯率可达99%.反应速率随钯化氯的提高而增加.反应在Pd/Fe表面进行,符合准一级反应,反应速率常数为0.0837min-1.TCB在催化脱氯的过程中先脱氯成为DCB,再依次脱氯为氯苯和苯. 相似文献
24.
针对单声道语音分离中浊音分离的问题,提出了一种准确估计基音周期的方法。首先,以语音的短时平稳性和基音周期的连续性等为线索,利用语音信号的倒谱峰值构成基音周期谱图,并自动提取基音周期轨迹。然后,利用谐波频率为基音频率整数倍的性质来拾取各次谐波的频谱。最后,通过傅里叶逆变换对浊音进行重构。实验结果表明,该方法能准确提取基音周期轨迹,有效分离浊音信号。 相似文献
25.
基于深度学习的声学模型研究 总被引:1,自引:0,他引:1
近年来,深度学习凭借其优越的性能广泛应用于图像处理、自然语言处理、语音识别等领域,它对性能的提升远超于以往的传统方法。论文采取循环神经网络(Recurrent Neural Networks,RNN)中的长短期记忆模型(Long Short Time Memory,LSTM)实现了语音识别中的声学模型构建,并增加反向时序信息对训练的影响,构成了双向长短期记忆模型(Bi-directional Long Short Time Memory,BLSTM)。语音信号是一种复杂的时变信号,而BLSTM能够在处理时间序列数据的同时,选择性地记住有效信息,丢弃无用信息,实验表明该方法的识别率较传统的高斯混合模型-隐马尔可夫模型(Gaussian Mixture Model-Hidden Markov Model,GMM-HMM)有显著的提高。 相似文献
26.
粒子滤波算法在处理最优滤波问题时受到了广泛的重视,对此类算法的收敛性研究是该领域研究的热点问题.首先介绍了一种变换的一般性粒子滤波算法,与一般性粒子滤波算法不同,在每次执行重要性采样步骤后,新算法需要判别是否需要重新执行重采样步骤和重要性采样步骤.随后对新算法的几乎必然收敛性进行了分析,并将对新算法的收敛性讨论推广到一般性粒子滤波算法中.研究了当感兴趣函数在扩展状态后验联合分布下四阶距存在并且递归次数有限时,由一般性粒子滤波算法得出的估计几乎收敛于最优估计的充分条件.最后,通过一组仿真实验来说明一般性粒子滤波算法的几乎必然收敛性. 相似文献
27.
28.
基于Fisher线性判别分析的语音信号端点检测方法 总被引:1,自引:0,他引:1
传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fisher准则求解具有判别信息的最佳投影方向,使得投影后的特征参数具有最小类内散度和最大类间散度,从而增大清音与背景噪声的可分离性。在不同语音库上的实验结果表明,F-MFCC能够在不同信噪比和背景噪声条件下提高语音端点检测的准确率。 相似文献
29.
30.
以便携式回放设备的语音为代表的假冒语音攻击,给说话人识别系统带来了严峻的挑战.针对这种回放语音攻击问题,论文提出一种基于小波包的多频带回放语音鉴别算法.首先,通过小波包分解及重构后的信号进行傅里叶变换,取每一帧频谱的最大值;然后,利用对数运算以及离散余弦变换(DCT)来得到鉴别特征;最后,使用高斯混合模型(GMM)作为... 相似文献