首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
基于MFCC的说话人识别系统   总被引:7,自引:0,他引:7  
说话人识别可以被看作语音识别的一种,是当前的研究热点之一.本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-Frequency Ceptral Coefficients ,MFCC)作为特征参数.试验比较了MFCC、差分MFCC组合MFCC分别与VQ、DTW相结合的识别率.得出差分MFCC组合MFCC优于MFCC.  相似文献   

2.
基于小波神经网络的原理对与文本无关的说话人进行了识别.通过分析网络结构,提出了优化网络初始参数的方法,加快了小波网络的收敛速度;采用分组器与阵列搜索算法相结合,减少了识别时的搜索时间.实验结果表明该识别系统能大大提高识别人数和识别速度,在43人的语音识别中,识别率达到97.67%.  相似文献   

3.
受到模型规模大和计算量大的限制,经典的基于高斯混合模型的说话人识别方法不适合于资源有限的PDA平台实时说话人自动识别要求。以Mel倒谱系数为说话人特征,运用主成分分类技术,结合定点数计算技术实现实时说话人自动识别。在19个用户的语音库上进行系统识别实验,此新型分类技术的训练时间缩短为基线系统的1/50,测试时间缩短为1/12,模型规模缩小为1/6,同时识别性能达到94.7%。  相似文献   

4.
赵振东  张静  李圆  胡喜梅 《通信技术》2009,42(10):192-193
提出了基于高斯混合模型(GMM)说话人分类的分级说话人识别系统,同时将小波神经网络(WNN)引入到子识别系统中。分别对未分级说话人识别系统和分级说话人识别系统进行了比较。仿真实验结果表明,分级网络在保证正确识别率的同时,不仅改善了网络训练速度,亦大大提高了识别响应速度。  相似文献   

5.
6.
刘晋胜  周靖 《信息技术》2009,33(8):68-70,73
系统通过提取线性预测倒谱系数作为特征参数进行说话人识别研究.在具有VLIW(甚长指令集)体系结构的DSP芯片上,对提取的特征参数在进行并行遗传算法寻优,以获取说话人的最优参数进行说话人识别.实验结果表明,采用硬件并行遗传算法比简单遗传算法对特征参数进行优化识别,识别时间大幅减少,识别率有较大提高,为说话人识别的应用提供较强的参考价值.  相似文献   

7.
比较了基于因特网的说话人识别技术中Mel倒谱特征各阶参数的抗噪性能,并分析和验证了交织及丢失数据替代技术对改善基于因特网的说话人识别系统性能的重要作用。  相似文献   

8.
基于不变集多小波的语音特征参数提取   总被引:1,自引:0,他引:1  
在研究不变集多小波理论的基础上,借鉴Mel频率倒谱系数(MFCC)的提取算法,用多小波交换代替傅里叶变换及Mel滤波.构造了一种新的语音特征参数MWBC。汉语数字识别实验结果表明,提出的新语音特征参数MWBC的识别性能和抗噪性能均优于MFCC,为提高语音识别系统的噪声鲁棒性提供了一条新途径。  相似文献   

9.
高斯混合模型采用固定混合数结构的建模方法并不符合说话人语音特征分布的多样性,从而出现过拟合或者欠拟合的情况并影响系统的识别性能。提出一种混合数可变的自适应高斯混合模型并将其应用于说话人识别。模型训练中根据说话人语音特征参数分布的聚类特性,采用吸收合并与分裂机制动态调整混合数以获得更加精确的拟合性能,提高系统识别率。实验结果显示,在特征参数MFCC和BFCC(Bilinear Frequency Cepstrum Coefficients)下相对误识率分别下降了41.41%和22.21%。  相似文献   

10.
基于聚类统计与文本无关的说话人识别研究   总被引:6,自引:2,他引:4  
从语音信号特征矢量的空间映射出发,在二元分裂算法的基础上提出了一种裂合并的聚类算法,并用于与本文无关的说话人识别研究,初步建立了基于聚类统计的开放系统,该系统用说话人语音信号在特征空间的分布中心建立参考模板,用聚类统计中心代替待识语音段的特征矢量进行了模式匹配计算,系统规模的越大,节省的计算量就越多。在小规模说话人辨认系统的实践研究中,研究了特征矢量的加权,语音段的时长以及a因子的选择对系统性能的影响。  相似文献   

11.
为提高掌纹图像识别率,首先利用手掌的几何轮廓对所采集到的掌纹图像进行预处理,进行分割得到感兴趣的区域.再利用小波变换对掌纹图像分别进行多层分解,进而提取小波特征.最后利用BP神经网络进行分类.通过仿真实验表明,与单一的神经网络方法进行掌纹识别相比,这种将小波分析与神经网络相结合的方法收敛步数少、用时短、具有较高的识别率.  相似文献   

12.
一种自适应的小波神经网络   总被引:7,自引:1,他引:6  
本文受感知域划分思想的启发,将小波的多分辨分析与BP网结构相结合,构造了一种新的小波神经网络.该小波神经网络利用多分辨分析生成小波树,小波树的生长与网络的训练相结合,自适应地生成隐层结点,并且删除分类不佳的结点.以声纳信号进行了实验,结果表明:该网络充分发挥了小波的特点,将模式识别的特征抽取与分类器设计融为一体.  相似文献   

13.
论文研究了小波包变换及LPCC参数的提取,在此基础上,提取了基于小波包变换和LPCC的新参数(DWT-LPCC),并基于GMM系统进行说话人识别实验。结果表明,相对于LPCC参数,DWT-LPCC参数大大提高了噪声环境下的说话人识别率。  相似文献   

14.
车牌识别(LPR)是智能交通中关键技术之一。针对目前车牌识别技术存在的一些问题,详细分析基于BP神经网络的车牌字符识别方法,对BP神经网络收敛速度慢且容易陷入局部极小点的缺陷进行改进。经仿真实验结果表明效果良好。  相似文献   

15.
论文通过提取输入语音的美尔倒谱系数,线性预测倒谱系数及其差分的双重方法,在建模过程中,对原有的矢量量化模型进行改进,形成一种新的连续码字分布的矢量量化模型,并与传统的动态时间规整算法和矢量量化方法比较,进行与文本有关的说话人识别实验,获得了较好的效果。  相似文献   

16.
说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个人特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。神经网络是一种基于非线性理论的分布式并行处理网络模型,具有很强的模式分类能力及对不完全信息的鲁棒性,为说话人识别技术提供了一种独特的方法。BP(Back-propagation Neural Network)是一种非循环多级网络训练算法,有输入层,输出层和N个隐含层组成。首先概述了语音识别技术,介绍了BP神经网络训练过程的7个步骤及其模型,如何建立BP神经网络模型。同时介绍了与其相关的特征参数的提取,神经网络的训练和识别过程,最后,通过编程在Linux系统下实现说话人身份的识别。  相似文献   

17.
基于小波神经网络非线性预测方法的研究   总被引:2,自引:0,他引:2  
针对非线性预测问题,提出了小波神经网络算法.该算法采用权重贡献率分析法和关键神经节点法分析权重,精进模型,利用具有优良渐进性的递推预报误差法训练小波的尺度因子和平移因子,并提出了一种网络的改进算法.通过对导航设备的仿真预测,该算法优于同等规模的BP神经网络,其收敛速度快,预测精度高.  相似文献   

18.
主要利用人工神经网络的理论知识研究在图像识别中的应用为目的,研究图像识别中图像分割的技术,同时详细分析了多层前馈神经网络的描述及BP算法工作过程。介绍隐层的选择及隐层神经元数选择的一些经验方法。针对BP算法存在的问题,提出加可变动量因子的BP算法,通过对网络训练过程参数调整以及增加可变动量因子等方面进行优化改进,实验证明加快了训练速度,改善了BP网络的学习效果。  相似文献   

19.
李卫  宋弘  姜天华 《通信技术》2010,43(6):213-215,218
以ARM和嵌入式操作系统Windows CE为平台设计了基于小波神经网络的语音识别系统。首先介绍了语音识别的基本原理、系统的硬件组成、系统的功能结构、系统的工作原理,然后叙述了小波和神经网络的理论知识及算法,最后介绍了嵌入式语音系统的软件设计。由于采用S3C2410芯片负责系统的控制和识别工作,而语音信号的特征提取和训练算法全部由SPCE061A芯片来完成,从而使得语音识别系统识别率提高,可移植性好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号