首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 93 毫秒
1.
基于PCNN和RBF的孤立词语音识别研究   总被引:1,自引:0,他引:1  
通过对孤立词语音识别现状的研究,提出了一种利用简化脉冲耦合神经网络PCNN和径向基函数RBF神经网络进行语音识别的新方法.利用语音信号的"可视"特性--语谱图,采用PCNN得到它的时间序列标识图作为语音信号的特征参数,辅以传统的RBF的语音识别方法,实现了孤立词语音识别.仿真结果表明,与其它方法比较,该方法能够达到较高的语音识别率.  相似文献   

2.
基于免疫RBF神经网络的语音情感识别   总被引:2,自引:1,他引:1  
本文针对语音情感识别中BP神经网络收敛速度慢和正确率低的问题,提出了一种训练径向基函数(RBF)网络的混合算法。在语音情感特征提取的基础上,采用免疫RBF神经网络进行情感识别,同时还训练了一个BP网络进行对比实验,得到了比较理想的识别结果。  相似文献   

3.
基于HMM与RBF的混合语音识别新方法   总被引:5,自引:0,他引:5  
提出了一种隐马尔可夫模型(HMM)和径向基函数神经网络(RBF)相结合的语音识别新方法。该方法首先利用HMM生成最佳语音状态序列,然后用函数逼近技术产生对最佳状态序列进行时间规正,最后通过RBF神经网络进行分类识别。理论和实验结果表明,该系统比HMM具有更好的识别效果,特别对提高易混淆词的识别性能尤为显著。  相似文献   

4.
一种基于径向基神经网络的车牌字符识别方法   总被引:1,自引:0,他引:1  
径向基函数神经网络具有局部逼近的能力和局部可调的特性,以车牌字符识别为例,构造了一种实用型的径向基神经网络,并与传统的BP神经网络作了对比.实验结果表明,在车牌字符识别中,径向基网络的识别能力、分类能力及识别速度等均优于BP网络.  相似文献   

5.
为了解决传统径向基(Radial basis function,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,使用深度自编码网络作为语音识别的声学模型,分析梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)和基于Gammatone听觉滤波器频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)下非特定人小词汇量孤立词的抗噪性能。实验结果表明,深度自编码网络在MFCC特征下较径向基神经网络表现出更优越的抗噪性能;而与经典的MFCC特征相比,GFCC特征在深度自编码网络下平均识别率相对提升1.87%。  相似文献   

6.
一种基于HMM和ANN的语音情感识别分类器   总被引:2,自引:0,他引:2  
罗毅 《微计算机信息》2007,23(34):218-219,296
针对在语音情感识别中孤立使用隐马尔科夫模型(HMM)固有的分类特性较差的缺点,本文提出了利用隐马尔科夫模型和径向基函数神经网络(RBF)对惊奇,愤怒,喜悦,悲伤,厌恶5种语音情感进行识别的方法。该方法借助HMM规整语音情感特征向量,并用RBF作为最终的决策分类器。实验结果表明在本文的实验条件下此方法和孤立HMM相比具有更好的性能,厌恶的识别率有了较大改进。  相似文献   

7.
基于混合模型HMM/RBF的数字语音识别   总被引:5,自引:0,他引:5  
王朋  陈树中 《计算机工程》2002,28(12):136-138
提出一种离散隐马尔科夫模型(hidden Markov model,HMM)和径向基函数(radial basis function,RBF)神经网络相结合应用于汉语数码语音识别(Mmandarin Ddigit Speech Recognition,MDSR)的方法,同时采用了一系列改进方法,使汉语数码语音的识别率达到了99.7%。  相似文献   

8.
基于非线性降维算法的容特征映射与径向基神经网络的快速性,提出了基于Isom ap与径向基(RBF)神经网络的图像识别方法,降维方法用测地距离取代传统的欧式距离,有助于挖掘高维数据的内在结构,径向基神经网络能够快速模拟对象数据集,识别真假图像。同时该方法结合了频谱分析对初始图像进行预处理,减少了计算量。实验结果表明该方法能快速识别真假图像,提高识别率。  相似文献   

9.
语音转换是指在保持源说话人语义内容不变的前提下,通过改变源说话人的个性特征,使其听起来像目标说话人的语音。本文提出一种自适应粒子群优化算法训练径向基函数神经网络进行语音特征建模,以获取说话人谱包络的映射关系;此外,考虑到说话人谱包络参数与基频有着密切的联系,利用基于径向基函数神经网络的联合谱包络基频变换方法,将谱包络参数与基频联合进行建模和转换,使得转换后的基频含有更多的说话人个性特征。最后,运用主、客观方法对获得的转换语音进行性能测试。实验表明,与主流的基于高斯混合模型的语音转换相比,使用自适应粒子群优化的径向基函数神经网络方法能够获得更好的转换性能,且更加适用于男声到女声的转换。  相似文献   

10.
基于径向基概率神经网络,提出一种扫描工程图纸图像分割后的图形符号识别方法,针对已分割的扫描工程图纸图形符号图像,首先进行二值化处理,然后对二值图形符号图像进行Hu不变矩特征提取,再使用一种新型的径向基概率神经网络进行分类,从而实现图像识别.为加快径向基概率神经网络的收敛速度,采用递归最小二乘算法进行训练.实验结果表明,径向基概率神经网络在识别性能与速度等方面非常适合于工程图纸的图形符号识别。  相似文献   

11.
采用改进的MFCC语音特征参数(Mel频率离散小波倒谱系数),使用支持向量机作为分类算法,构建了低信噪比环境下的孤立词非特定人语音识别系统,取得了较高的识别率。将实验结果与基于RBF神经网络的识别结果进行比较,结果表明在低信噪比时,SVM的识别率比使用RBF神经网络有较大提高,具有非常好的鲁棒性。  相似文献   

12.
基于RBF神经网络的抗噪语音识别   总被引:1,自引:0,他引:1  
针对目前在噪音环境下语音识别系统性能较差的问题,利用RBF神经网络具有最佳逼近性能、训练速度快等特性,分别采用聚类和全监督训练算法,实现了基于RBF神经网络的抗噪语音识别系统。聚类算法的隐含层训练采用K-均值聚类算法,输出层的学习采用线性最小二乘法;全监督算法中所有参数的调整基于梯度下降法,它是一种有监督学习算法,能够选出性能优良的参数。实验表明,在不同的信噪比下,全监督算法较之聚类算法有更高的识别率。  相似文献   

13.
The kernel function is the core of the Support Vector Machine (SVM), and its selection directly affects the performance of SVM. There has been no theoretical basis on choosing a kernel function for speech recognition. In order to improve the learning ability and generalization ability of SVM for speech recognition, this paper presents the Optimal Relaxation Factor (ORF) kernel function, which is a set of new SVM kernel functions for speech recognition, and proves that the ORF function is a Mercer kernel function. The experiments show the ORF kernel function's effectiveness on mapping trend, bi-spiral, and speech recognition problems. The paper draws the conclusion that the ORF kernel function performs better than the Radial Basis Function (RBF), the Exponential Radial Basis Function (ERBF) and the Kernel with Moderate Decreasing (KMOD). Furthermore, the results of speech recognition with the ORF kernel function illustrate higher recognition accuracy.  相似文献   

14.
为了提高语音端点检测效果,将小波分析和神经网络相融合,提出一种基于小波神经网络的语音端点检测算法(WA-PCA-RBF)。利用小波分析提取语音信号的特征向量,采用主成分分析法选择语音信号特征,消除冗余特征,将选择特征向量作为RBF神经网络输入,通过遗传算法优化RBF神经网络参数建立语音端检测模型。结果表明,相对于传统语音端点检测算法,WA-PCA-RBF提高了语音端点检测正确率,具有更好的适应性和鲁棒性,可满足实际系统需求。  相似文献   

15.
数字信号处理技术的迅速发展,为语音识别的实时实现提供了可能。采用TI公司的DSP芯片TMS320VC5409,建立一个汉语数字的语音实时识别系统。DSP的多通道缓冲串口与模数转换芯片的连接实现语音信号的采样;分别使用64k的程序和数据存储空间;系统的输出是使用TL16C550实现异步通信串口并使之与计算机RS232串口连接以观察识别结果。系统运行算法主要有字端点检测、特征提取和识别算法。实验结果表明,该系统基本能实现预期识别目标。  相似文献   

16.
小波网络和RBF网络的抗噪语音识别   总被引:1,自引:0,他引:1       下载免费PDF全文
针对目前在噪音环境下语音识别系统性能较差的问题,利用小波神经网络融合了小波变换良好的时频局域化性质和RBF神经网络具有最佳分类能力和辨识能力等特性。构建了一个用小波基替代RBF网络中激活函数的小波-RBF神经网络结构,并采用全监督训练算法,实现了基于小波-RBF网络的抗噪语音识别系统。实验结果表明该系统比RBF网络具有更好的识别效果,尤其在噪声环境下,具有更强的鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号