期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

叶寒生陶进绪张东文余斌《计算机仿真》2009,26(3)

针对在干净的语音环境下说话人识别率很高,但噪声环境下说话人识别率急剧下降的问题,提出了一种在噪声环境下,利用信噪比权重对说话人的特征信息MFCC系数和基音周期进行非线性融合,同时对MFCC特征参数进行基于帧信噪比权重得分,并同传统的高斯混合模型算法和基于FO-MFCC联合分布的特征融合方法,在噪声环境下分别进行了说话人识别的性能比较,同时对提出的融合算法进行了仿真实现.实验结果表明:在噪声的环境下方法相比上述传统说话人识别方法,性能有了明显的提高,在干净的语音环境下性能相当. 相似文献

2.

基于时频分布与MFCC的说话人识别

金银燕于凤芹何艳《计算机系统应用》2012,21(4):189-192,178

针对MFCC不能得到高效的说话人识别性能的问题,提出了将时频特征与MFCC相结合的说话人特征提取方法。首先得到语音信号的时频分布,然后将时频域转换到频域再提取MFCC+MFCC作为特征参数,最后通过支持向量机来进行说话人识别研究。仿真实验比较了MFCC、MFCC+MFCC分别作为特征参数时语音信号与各种时频分布的识别性能,结果表明基于CWD分布的MFCC和MFCC的识别率可提高到95.7%。相似文献

3.

基于CCA和PCA的说话人特征降维研究

陈觉之张贵荣周宇欢《计算机与现代化》2013,(6):16-19

为提高说话人识别的性能,提出将CCA与PCA联合用于说话人特征降维的方法:先用CCA融合基于声道模型的LPC特征和基于听觉模型的MFCC特征,提升这两类不同特征的相关性;然后用PCA进一步去除冗余特征,降低有效特征的维数。实验显示,这两种降维方法联合的降维效果与单一的CCA降维、PCA降维或手动降维的效果比有明显提高。相似文献

4.

基于MFCC与分形维数混合参数的语音识别 总被引：5，自引：0，他引：5

雷涛姚明海马洪蕊《控制工程》2005,(Z1)

针对语音气流中具有混沌特征,而分形可以定量地分析混沌现象,故分形可用来分析语音信号。语音波形具有分形特征,将分形用于改善语音识别技术更好地表现语音的特征,避免传统的分段线性处理所产生的局限性。将传统特征参数MFCC与分形特征结合起来,组成混合参数用于语音识别。实验结论显示,基于MFCC与分形维数混合参数的语音识别方法要好于使用单一MFCC参数的语音识别方法。相似文献

5.

基于加权Mel倒谱系数的说话人识别 总被引：2，自引：0，他引：2

刘亚丽杨鸿武黄德智《计算机应用与软件》2009,26(9):24-27

说话人识别中的首要问题是从语音信号中提取能唯一表现说话人个性特征的有效而稳定可靠的特征参数.把感知加权技术应用到Mel倒谱分析中,通过对基于心理声学模型计算得到的信号掩蔽比插值获得权重函数,并将权重函数应用到Mel倒谱分析中获得加权Mel倒谱系数(WMCEP),以此为特征进行说话人识别.实验结果表明,WMCEP比MFCC和Mel倒谱系数(MCEP)能更好地逼近说话人的谱包络,在噪声环境下的鲁棒性更好,因此其识别性能要优于MFCC和MCEP. 相似文献

6.

PCA-VQ融合降维的SMO-SVM说话人识别研究

席青云孙同日陶佰睿杨文博　　苗凤娟《传感技术学报》2023,36(2):275-279

针对说话人语音原始梅尔频率倒谱系数(MFCC)特征参数维数较高造成的模型计算效率低以及不稳定的问题,基于序列最小优化(SMO)高效算法求解支持向量机(SVM)基本型的对偶问题,开展主成分分析-矢量量化((PCA-VQ)融合降维的SMO-SVM说话人识别算法研究。改进后的算法在MATLAB平台上仿真通过。仿真结果表明:通过PCA-VQ融合算法对MFCC特征参数进行优化降维后,SMO-SVM说话人识别模型的正确率提高3.77%,训练时间节省1.24 s,具有较好推广应用价值。相似文献

7.

基于小波调制尺度的语音特征参数提取方法 总被引：3，自引：0，他引：3

马昕杜利民《计算机应用》2005,25(6):1342-1344

时频分析的理论基础上,提出了一种基于小波调制尺度特征的参数提取方法。根据人对调制谱信息的感知特性及干扰在调制谱中的特点,采用小波分析技术及归一化处理求得归一化的小波调制尺度特征参数,并以此作为语音的动态特征应用于语音识别系统。通过与MFCC一阶、二阶系数对比的汉语音节识别实验表明,该方法在抗噪声干扰和说话速率变化等方面比MFCC的一阶、二阶系数的性能优越,为提高语音识别鲁棒性提供了一种新途径。相似文献

8.

基于GMM的说话人识别研究与实践

辛全超吴萍《计算机与数字工程》2009,37(6):11-15

说话人识别作为当今的一个研究热点,具有广泛的应用和研究前景。文章针对说话人识别的前端处理进行了相关研究,设计并实现了一个有效的处理算法。提取出Mel频率倒谱系数MFCC,讨论了MFCC各维参数对最终结果的贡献。文章通过研究高斯混合模型GMM的模型训练,使用最大似然估计算法和期望一最大化算法,在研究和改进基础上开发了一个基于高斯混合模型的说话人识别系统。同时完成了多线程并行测试与MFEC各维参数对最终识别结果的增益比较研究。相似文献

9.

基于遗传算法数据降维的汉语数字语音识别

高文曦孙小琪镇丽华《计算机系统应用》2016,25(1):150-153

针对语音信号特征参数LPCC和MFCC相结合后数据维数过高,导致识别器性能下降的问题,提出采用遗传算法对初始特征参数进行降维,来提高识别性能.首先提取语音信号的LPCC和MFCC,然后采用遗传算法对其进行特征降维,最后将得到的低维数据送入支持向量机进行识别.仿真实验结果表明,采用遗传算法进行特征降维与传统的PCA降维相比,识别率提高了12.2%,和初始特征相比识别率降低了1.23%,但是识别时间提高了4.5倍. 相似文献

10.

基于共振峰和梅尔倒谱的声纹特征提取SOC设计

席青云邱长江陶佰睿关新宇　　苗凤娟《传感技术学报》2023,36(5):782-787

反映声道(谐振器)物理特性且不易受环境影响的元音共振峰可以更好地反映说话人的声纹特征,为此提出了说话人共振峰自适应MFCC(梅尔倒谱系数)特征提取SOC(片上系统)设计。首先提取说话人语音元音的三组共振峰来设计Mel三角形滤波器组,并基于传统MFCC与共振峰改进MFCC矩阵参数比值设计自适应融合说话人语音特征以改进MFCC。在MATLAB中完成性能仿真,在QUARTUS II中完成VERILOG-HDL代码设计,在FPGA(现场可编程门阵列)开发板上完成SOC设计、编译、仿真和验证下载。结果表明,在较高信噪比环境下,基于自适应融合和共振峰改进的MFCC得到的特征向量比传统的MFCC具有更强的鲁棒性,此技术在说话人声纹身份识别传感器设计中有较大应用推广价值。相似文献