期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

范小春邱政权《计算机工程与应用》2010,46(10):113-114

将小波变换和维纳滤波结合起来对语音进行去噪和MMCE对说话人进行识别。说话人识别近来的关注点主要集中在子带处理的使用上。通过三尺度的Daubechies小波把输入含噪信号分解于不同子带中,然后在各个子带分别通过维纳滤波去噪,再把各个子带的输出通过小波重构恢复信号,最后通过Mel滤波器组把小波系数转换成MFCC（美尔倒谱系数）。提出了一种改进的MCE模型去减少计算量,并进而提高运算速度。实验结果显示：提出的方法减少了计算量,而且提高了系统的辨认率。相似文献

2.

一种适用于说话人识别的改进Mel滤波器 总被引：1，自引：0，他引：1

项要杰杨俊安李晋徽陆俊《计算机工程》2013,(11):214-217,222

Mel倒谱系数（MFcc）侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数（IMFCC）更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。相似文献

3.

改进批处理RPEM算法用于说话人识别

项要杰杨俊安李晋徽杨瑞国《计算机应用研究》2013,30(12):3579-3582

针对传统EM算法训练GMM不能充分利用训练数据所属高斯分量信息, 从而在一定程度上影响说话人识别性能的缺陷, 采用RPEM (竞争惩罚EM)算法训练GMM, 并引入批处理RPEM算法解决RPEM算法运算量大、收敛速度慢的问题, 同时针对RPEM和批处理RPEM算法训练时方差优化存在的问题进行了改进, 提出了改进的批处理RPEM算法。在Chains 说话人识别数据库上的实验表明, 改进的批处理RPEM算法取得了相对于传统EM、RPEM以及批处理RPEM算法更好的性能, 还极大地提高了训练效率, 减小了运算量, 说明了提出的改进批处理RPEM算法用于说话人识别时的有效性。相似文献

4.

基于支持向量机和小波分析的说话人识别 总被引：2，自引：0，他引：2

张振领徐东平贾仰理《计算机工程与设计》2007,28(21):5201-5202,5224

为解决说话人识别问题,提出了一种基于支持向量机和小波分析的识别方法以及其框架模型,即将小波分析应用于信号预处理,并以此为基础,利用其奇异点检测原理将语音信号和噪声分离,实现语音增强,最终基于样本进行训练和测试,采用SVM实现说话人的分类识别. 相似文献

5.

短语音噪声环境下说话人识别特征提取

高会贤马全福郑晓势《计算机应用》2010,30(10):2712-2714

为了使说话人识别系统在语音较短和存在噪声的环境下也具有较高的识别率,基于矢量量化识别算法,对提取的特征参数进行研究。把小波变换与美尔频率倒谱系数(MFCC)的提取相结合,并将改进后的特征与谱质心特征进行了组合,建立了一种美尔频率小波变换系数+谱质心(MFWTC+SC)的新的组合特征参数。经实验表明,该组合特征可以有效地提高说话人识别系统的性能。相似文献

6.

基于小波分析的大词汇汉语连续语音识别系统鲁棒性的研究 总被引：6，自引：0，他引：6

颜龙刘刚郭军《中文信息学报》2006,20(2):62-67

本文提出一种基于小波分析的大词汇汉语连续语音识别的方法,即采用一维小波变换将原始语音信号进行五层小波分解,然后对各层小波系数进行重构,得到五层语音信号,分别对各层语音信号进行训练,得到各层的声学模型,然后结合语言模型对各层声学模型的性能进行测试。通过对纯净语音和带噪语音的各层重构语音数据进行测试。结果表明对于含有高斯白噪声的带噪语音,该方法能使系统性能有所提高,但对于粉红噪声,该方法效果不明显。对于含有真实环境噪声的带噪语音,该方法能获得比基线系统更好的性能。相似文献

7.

基于小波理论的多分辨率多传感器数据融合 总被引：1，自引：0，他引：1

胡战虎李言俊《数据采集与处理》2001,16(1):90-93

小波变换的多尺度特点非常适合多尺度信号的处理,可以用于多分辨率多传感器数据融合,本文研究了不波变换的特征,提出基于小波包变换的多分辨率多传感器的数据融合算法,算法不需要把小波系数当成白噪声处理,并一能够有效地降低向量和矩阵维数,减少运算,有较好的滤波性能,同时采用双正交小波包变换,这可以克服基于正交小波包变换的多尺度滤波中正交小波因不具有线性相而产生恢复失真的缺陷,进一步提高滤波性能。相似文献

8.

机载高速视觉图像目标识别优化仿真研究

张芬《计算机仿真》2015,32(1)

机载视觉采集器采集图像去噪的性能优劣,影响着目标识别的准确性.在机载高速视觉采集图像过程中,由于距离目标远,飞机速度快,图像采集的结果会包含大量的乘性噪声点,影响采集图像中目标像素可识别特征的质量.传统的图目标识别方法都是通过把这种乘性噪声模糊化,转换成加性噪声进行去噪处理然后加以识别,但是,在这种转换的过程中,会造成关键目标特征丢失,识别效果不好.提出基于改进多小波变换的机载高速视觉采集图像去噪识别方法.获取合适的基小波及小波分解层数目,对含有噪声的信号进行多小波变换操作,根据估计小波系数对信号进行重构操作,获取去噪后的机载高速视觉采集图像,优化识别过程.实验结果表明,利用改进算法进行机载高速视觉采集图像去噪,能够提高机载高速视觉采集图像的信噪比和图像质量. 相似文献

9.

一种小波网络逆变换的谐波检测算法研究

唐红雨陈迅《电子技术应用》2013,39(4)

提出一种小波网络逆变换,在小波对原始信号进行高频、低频段分解时,分别用小波系数模极大值进行奇数和偶数抽取,得到信号的特征向量。再利用BP神经网络对抽取后的信号逼近训练,得到新的小波系数,然后用逆变换进行信号重构。通过比较重构和原始信号。得到谐波值,再反相注入电网进行补偿。实验结果表明,该算法可以满足电力系统谐波检测的要求。相似文献

10.

基于小波分析的脉搏波信号去噪

徐洁付强《计算机仿真》2012,29(9):235-238

脉搏波信号采集过程中存在引入的肌电干扰和基线漂移等噪声,引起脉搏信号不准确。针对传统滤波方法滤除脉搏波噪声性能较低的特点,提出了一种改进的空域相关滤波方法。将信号小波分解后,在小波变换值的相关量中加入一个自适应调整系数,最后用保留的小波系数对原信号进行重构;改进方法具有良好的自适应性能和显著的滤波效果,在有效去除噪声的同时,很好地保留了信号的主要细节。仿真结果表明,改进算法去噪效果好,同时减小误差,提高了信噪比,为脉搏分析提供了准确信息。相似文献

11.

改进卷积输入的端到端普通话语音识别

下载免费PDF全文

王彦哲张立民张兵强李振宇《计算机工程与应用》2019,55(17):143-149

主流神经网络训练的交叉熵准则是对声学数据的每个帧进行分类优化，而连续语音识别是以序列级转录准确性为性能度量。针对这个不同，构建基于序列级转录的端到端语音识别系统。针对低资源语料条件下系统性能不佳的问题，其中模型使用卷积神经网络对输入特征进行处理，选取最佳的网络结构，在时域和频域进行二维卷积，从而改善输入空间中因不同环境和说话人产生的小扰动影响。同时神经网络使用批量归一化技术来减少泛化误差，加速训练。基于大型的语言模型，优化解码过程中的超参数，提高模型建模效果。实验结果表明系统性能提升约24%，优于主流语音识别系统。相似文献

12.

An MLP-orthogonal Gaussian mixture model hybrid model for Chinese bank check printed numeral recognition

Hui Zhu X. L. Tang Peng Liu 《International Journal on Document Analysis and Recognition》2006,8(1):27-34

A hybrid model based on the combination of an orthogonal Gaussian mixture model (OGMM) and a multilayer perceptron (MLP) is proposed in this paper that is to be used for Chinese bank check machine printed numeral recognition. The combination of MLP with OGMM produces a hybrid model with high recognition accuracy as well as an excellent outlier rejection ability. Experimental results show that the proposed model can satisfy the requirements of Chinese bank check printed numeral recognition where high recognition accuracy, high processing speed, and high reliability are needed. Correspondence to: Hui Zhu 相似文献

13.

Speaker identification using multi-step clustering algorithm with transformation-based GMM 总被引：1，自引：0，他引：1

Limin Xu Zhenmin Tang 《Automatic Control and Computer Sciences》2007,41(4):224-231

To improve the performance of speaker recognition, the embedded linear transformation is used to integrate both transformation and diagonal-covariance Caussian mixture into a unified framework. In the case, the mixture number of GMM must be fixed in model training. The cluster expectation-maximization (EM) algorithm is a well-known technique in which the mixture number is regarded as an estimated parameter. This paper presents a new model structure that integrates a multi-step cluster algorithm into the estimating process of GMM with the embedded transformation. In the approach, the transformation matrix, the mixture number and model parameters are simultaneously estimated according to a maximum likelihood criterion. The proposed method is demonstrated on a database of three data sessions for text independent speaker identification. The experiments show that this method outperforms the traditional GMM with cluster EM algorithm. This text was submitted by the authors in English. 相似文献

14.

基于多码本矢量量化的非限定文本的联机话者辨认方法

马继涌高文姚鸿勋《计算机研究与发展》1999,36(6):712-716

传统的利用话者的一个时期的语音作为训练语音,进行话者码本训练的方法,识别系统往往不够稳定．为了适应话者自身语音的时变性,文中提出了利用话者不同时期的语音进行训练话者的模型,每个话者具有多个码本．这些码本是采用逐渐减小误识率的优化过程得到的．为了补偿不同信道对系统识别性能的影响,文中给出了一种信道补偿方法．同时提出以一帧高能的浊音语音特征代替一个浊音音素的特征,实现了在线浊音特征提取,利用两级矢量量化及码本索引策略减少了４４％的识别计算量．这些方法大大增加了系统的识别速度和鲁棒性．文中比较了用ＰＬＰ分析和ＬＰＣ倒谱分析进行话者辨认的识别结果．相似文献

15.

基于分层采样的集成k近邻说话人识别算法

钱博唐振民李燕萍徐利敏《计算机工程与应用》2007,43(35):226-229

k近邻学习器将复杂的全局非线性关系映射为大量局部线性关系的组合,具有易解释、易扩展、抗噪能力强等优点,被广泛应用于说话人识别领域并取得了良好的效果。而集成学习算法因其强泛化能力和易于应用的特性得到了许多领域研究者的关注,但是研究表明通过重采样产生训练集差异的集成算法并不能有效地提高k近邻学习器系统的泛化能力。提出了一种新的BagWithProb采样算法产生训练集。实验表明,该算法可以有效地扩展训练集差异,提高集成系统性能。此外,还提出了基于环域分层采样的算法以加快k近邻识别算法在识别阶段的运算速度。相似文献

16.

基于MAP估计的直接均值移动归一化训练方法

丰洪才卢正鼎《小型微型计算机系统》2005,26(3):352-355

提出了一种基于数学统计模型化的说话人归一化训练方法，它将与状态相关的直接均值移动归一化训练方法和MAP／WNR模型自适应方法结合到统一的鲁棒性框架中，为模型自适应方法提供了更加合适的初始模型，在提高自适应速度和保持足够的模型平滑度之间得到了较好的平衡，实验表明，该方法可有效的提高有监督模式下语音识别的鲁棒性。相似文献

17.

基于多重分形和半监督EM的LPI雷达信号识别

王星符颖陈游周一鹏呙鹏程《控制与决策》2018,33(11):1941-1949

针对先验信息不完整的非合作电子对抗背景下的低截获概率雷达信号识别问题,提出一种基于多重分形和半监督最大期望(EM)的识别算法.该算法计算出信号的多重分形谱,提取出信号的多重分形谱参数特征;针对EM算法中全部未标记样本集的加入会造成收敛速度缓慢甚至有可能影响到分类精度的缺陷,引入Self-training思想,提出一种基于Self-training的半监督EM算法.该算法通过挑选最为确定的一个或多个未标记样本来更新样本集,使得未标记样本集不断缩小进而加快分类器的训练速度,也可有效避免错误的累加,在一定程度上可提高分类精度.理论分析和仿真结果表明,在LPI雷达信号识别问题上,所提出的算法在不同的信噪比下具有更高的分类识别率和更好的实时性. 相似文献

18.

基于GFCC与RLS的说话人识别抗噪系统研究

茅正冲王正创黄芳《计算机工程与应用》2015,51(10):215-218

为了提高说话人识别抗噪系统的性能,提出了将RLS自适应滤波器作为语音信号去噪的预处理器,进一步提高语音信号的信噪比,再通过Gammatone滤波器组,对去噪后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC,进而将特征参数GFCC用于说话人识别系统中。仿真实验在高斯混合模型识别系统中进行。实验结果表明,采用这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显的提高。相似文献