首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
为了进一步提升i-vector说话人识别模型的系统性能,探讨了基于i-vector的说话人识别系统中训练时长、男女比例和高斯混合度对系统识别性能的影响。针对训练时长、男女比例和高斯混合度设置了一组实验,结合目前最流行的语音识别工具Kaldi进行验证,得出i-vector说话人识别算法的最佳参数,为以后的基于i-vector说话人识别算法研究提供数据依据。  相似文献   

2.
陈瑶玲  杨鉴  陈江  徐永华 《信息技术》2010,(6):32-34,39
支持向量机是统计学习理论的一个重要分支,也是解决模式识别问题的一个有力工具.现简要介绍支持向量机理论,构建基于径向基函数的支持向量机,对分别来自两个不同的电话语音数据库中的汉语普通话、英语、日语、白族语和纳西语等5种语言进行识别研究.实验结果表明,支持向量机, 对不同数据库语言的语种识别依然能达到比较高的识别率.  相似文献   

3.
本文对广播信号语种识别的关键技术和方法进行了研究,提出了基于模板匹配的语种识别方法,可应用于短波频段广播信号监测自动化.  相似文献   

4.
5.
付英  刘增力 《通信技术》2022,(4):435-442
针对汉语方言识别率低和在噪声环境下鲁棒性差问题,将特征提取与语音增强结合,提出一种基于变分模态分解(Variational Mode Decomposition,VMD)的改进梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和Teager能量算子倒谱系数(Teager...  相似文献   

6.
王侠  顾明亮  高原  马勇 《电声技术》2011,35(12):39-41,46
提出一种基于GMM的区分不同性别的汉语方言识别系统,系统提取语音的RASTA - PLP特征,在方言电话语音库上进行仿真实验,结果表明在GMM模型阶数为32时,系统的识别率可达到98.66%.同时还将RASTA -PLP特征与SDC特征对比,结果表明系统识别率最高可提高6.05%,且RASTA - PLP特征在性别分类...  相似文献   

7.
8.
针对广播语种识别问题,提出一种语音时域滤波方法,用gammatone时域函数与预处理后的语音信号进行卷积滤波,再分帧加窗并求对数化能量得到时域GF(gammatone filterbank)特征.将特征参数图像化表示,然后通过VGG19和Resnet34分类网络进行语种识别实验.同时,也使用自动色阶算法对加噪语音的图像...  相似文献   

9.
徐凡  杨剑峰  颜为之  王明文 《信号处理》2021,37(10):1860-1871
方言语音识别是方言保护的核心环节。传统的方言语音识别模型缺乏考虑方言语音中特定方言音素的重要性,同时缺少多种语音特征提取及融合,导致方言语音识别性能不高。本文提出的端到端方言语音识别模型充分发挥了残差CNN(Convolutional Neural Networks)和Bi-LSTM(Bi-directional Long Short-Term Memory)分别在语音帧内和帧间特征提取的优势,并利用多头自注意力机制有效提取不同方言中特定方言音素信息构成语音发音底层特征,利用该方言发音底层特征进行方言语音识别。在基准赣方言和客家方言两种方言语音语料库上的实验结果表明本文提出的方言语音识别模型显著优于现有基准模型,通过对注意力机制的可视化进一步分析了模型取得性能提升的根本原因。   相似文献   

10.
针对单一信号特征CFCC与GFCC在低信噪比下识别率不高的问题,提出一种噪声环境下听觉特征融合的语种识别方法。在特征提取前端对含噪语音信号进行端点检测,然后结合谱减法与维纳滤波器对信号进行噪声滤除;再根据人耳听觉频率集中范围采用带通滤波器滤除高频以及低频中噪声,进一步减小噪声对信号特征提取的影响;提取GFCC融入CFCC构成融合特征,再采用主成分分析对融合特征进行降维处理;最后将处理后的融合特征通过频域注意力Fcanet网络模型进行分类识别。实验对比不同特征在不同信噪比下的性能实验表明,融合特征较单一特征语种识别率有显著提升,特别在0 dB信噪比下较单一特征GFCC和CFCC识别准确率分别提升了9.75%和11.08%,具有较强的鲁棒性。  相似文献   

11.
在基于GMM的语种识别系统中,实际环境和个人因素一直是影响识别率提高的因素。本文从各模型帧似然概率的统计特性出发,提出了一种新的帧似然概率变换方法,它把帧概率按照一定规则变换成权值。识别时不依靠概率的绝对值,而是依靠帧概率在所有其它语种模型中的相对位置来决定模型总得分。理论分析和实验结果表明,同传统方法相比,本文提出的方法能较好地提高语种识别率。  相似文献   

12.
陈卫东  王晓亚  解静 《无线电工程》2009,39(9):16-18,54
语种识别是多语种信息服务和机器翻译等处理任务的必要预处理过程。提出了基于线性预测倒谱系数的多语言识别系统,由于LPCC属于倒谱域的语音特征,能够比较简单地分离开语音信号中的声门激励信号与声道冲激响应,所以系统中选择使用LPCC作为特征参数,并使用K-均值的矢量量化方法进行聚类得到训练的初始码本。通过对不同帧长的测试,得到选择较长的帧长时可以获得较好的识别概率的结论。  相似文献   

13.
肜娅峰  陈晨  陈德运  何勇军 《电子学报》2021,49(11):2186-2194
身份-矢量(identity-vector,i-vector)方法作为说话人确认领域中的主流方法之一,能够通过学习总变化空间来获取有效的低维说话人特征——i-vector特征.但是当开发集数据不充足时,会导致学习到的总变化空间模型误差较大;同时,还无法有效确认此时的总变化空间是否因为预先设置的维度过高而学到了冗余信息.为此,本文将贝叶斯主成分分析(Bayesian Principal Component Analysis,BPCA)引入总变化空间的学习过程中,利用其来为总变化空间引入更多的先验信息,从而对开发集数据中包含的信息进行补充,并在先验信息的约束下削弱总变化空间中无效维的影响.实验结果表明,当开发集数据不充足时,相比于传统的总变化空间学习方法,BPCA方法能够有效提升说话人确认系统的识别性能.  相似文献   

14.
刘健刚  董静 《电子器件》2011,(4):482-484
在基于GMM的语种识别系统中,实际环境和个人因素一直是影响识别率提高的因素.从各模型帧似然概率的统计 特性出发,提出了一种新的帧似然概率变换方法,它把帧概率按照一定规则变换成权值.识别时不依靠概率的绝对值,而是 依靠帧概率在所有其它语种模型中的相对位置来决定模型总得分.理论分析和实验结果表明,同传统方法相比,本文提出的...  相似文献   

15.
实际的研究表明,语音情感识别方法有多种.介绍了一种基于GMM的语音情感识别方法,包括该方法的优点、存在的问题或不足等,并对此进行了思考,给出了一些处理办法.  相似文献   

16.
针对单一特征在描述方言间差异性方面存在不足和传统高斯混合通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)在训练时存在混叠的问题,在将经验模式分解引入到特征提取的基础上,融合多特征形成高维特征。进一步,通过多次训练GMMUBM,筛选出最具区分性的方言模型以提升各方言模型间的区分性。方言种类识别对比实验结果表明,基于融合特征与改进GMM-UBM的方法优于传统方法。  相似文献   

17.
基于高斯滤波器及费舍尔准则的特征提取方法   总被引:1,自引:0,他引:1  
针对梅尔倒谱系数与翻转梅尔倒谱系数在语种识别应用中的不足,采用高斯滤波器代替三角滤波器,提出一种新的梅尔倒谱系数提取方法,解决传统梅尔倒谱系数提取中邻近滤波器相关性较弱的问题,并结合Fisher准则构造出最优混合特征参数,采用高斯混合模型分别对不同混合特征进行语种识别。实验结果表明:基于高斯滤波器及Fisher准则的改进梅尔倒谱系数混合特征参数作为语种识别特征具有较高的识别准确率。  相似文献   

18.
19.
论文研究了小波包变换及LPCC参数的提取,在此基础上,提取了基于小波包变换和LPCC的新参数(DWT-LPCC),并基于GMM系统进行说话人识别实验。结果表明,相对于LPCC参数,DWT-LPCC参数大大提高了噪声环境下的说话人识别率。  相似文献   

20.
以基于状态映射的中英跨语种自适应方法为研究对象,将状态映射应用于跨语种自适应中,对自适应中两种使用状态映射信息的方式(数据映射和变换映射)进行了比较分析.通过实验发现,基于状态映射的自适应方法具有一定的效果,CSMAPLR算法优于CMLLR算法,而且两种方式各有优劣.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号