首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为了解决噪声环境下语种识别准确率低的问题,提出一种将梅尔倒谱系数和伽马频率倒谱系数融合的语种识别方法。首先提取语音的梅尔倒谱系数和伽马频率倒谱系数,并依据语种识别中的贡献度对特征进行筛选;接着将特征映射在由梅尔域-伽马域组成的空间坐标系中,以得到梅尔伽马倒谱系数(MGCC);最后,将特征输入深度神经网络中进行语种识别。实验结果表明,所提方法的识别准确率和速度远高于使用单一声学特征及其他语种特征的方法。在纯净环境下,所提方法的语种识别准确率可以达到99.38%,在-5 dB低信噪比环境下也可达到89%以上。这充分证明了所提方法的有效性和鲁棒性。  相似文献   

2.
为了优化组合特征在异常声音识别中的效率,提出一种用集合经验模态分解(EEMD)对异常声音帧信号进行有效性检测和提取多层特征的算法.首先对异常声音帧信号进行集合经验模态分解,得到固有模态函数;然后根据给定的固有模态函数层数阈值,对该帧信号进行有效性检测;再对有效帧信号的每一层固有模态函数提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、线性预测倒谱系数、短时能量和能量比,并将它们归一化后拼接成多层特征.根据提取的特征,用深度卷积神经网络实现异常声音识别分类.仿真结果表明,提出的新方法在4类异常声音识别中的识别率可以达到98.65%.  相似文献   

3.
论述了声纹识别技术的基本原理,采用DSP及其他可编程芯片设计出声纹识别系统的硬件部分,阐述了其结构及工作原理。基于隐马尔可夫模型为算法,以线性预测倒谱系数和Mel频域倒谱系数为特征矢量进行了系统仿真。结果表明,在结合使用两种倒谱系数及差分时,系统具有较高的识别率。  相似文献   

4.
根据流型轮廓特征提取的不变矩能有效检测出具有平移、旋转、比例变化的图像特性,提出了一种基于图像不变矩与粒子群优化神经网络相结合的气液两相流流型识别的新方法。该方法利用高速摄影系统获取水平管道内气液两相流的流动图像,经过图像处理后和形态学轮廓提取图像不变矩特征向量,并以此特征向量作为流型样本对粒子群优化神经网络进行训练,实现了对流动图像的流型智能化识别。实验结果表明,训练成功的粒子群优化神经网络能够快速准确识别水平管道内的7种典型流型,整体识别率达到97.5%,为流型在线识别提供了一种新的有效方法。  相似文献   

5.
针对电力变压器故障难以准确诊断的问题,提出了一种基于改进粒子群算法(PSO)的模糊神经网络(FNN)诊断模型。该模型运用模糊神经网络,同时结合变压器故障与变压器油中各气体成分之间的密切关系,确定了神经网络输入变量,同时在标准粒子群算法中引入遗传变异因子对模型进行训练,提高了训练精度。MATAB软件测试结果表明,模型预测精度较高,可进一步研究应用。  相似文献   

6.
基于改进的PSO神经网络的手写体汉字识别   总被引:1,自引:0,他引:1  
为了克服手写体汉字识别中传统神经网络训练算法存在网络易于过早收敛的缺陷,本文提出采用自适应惯性权值的粒子群优化算法训练神经网络,即利用粒子更新迭代训练神经网络最优的权值和阈值,其中对粒子更新的惯性权值进行了自适应性的改进.试验中提取了大量汉字样本的笔画数量信息和分布信息作为特征向量,利用改进的粒子群神经网络对汉字进行分类,并与BP神经网络的识别效果做了比较.结果表明:自适应惯性权值的粒子群优化算法能有效避免网络"早熟",大大提高了网络训练精度,网络对汉字的识别正确率明显提高.  相似文献   

7.
用多窗谱估计和伽马通滤波改进经典的梅尔倒谱特征(MFCC)的识别性能,并与delta特征相结合,提出了一种基于加权参数设置策略的混合特征话者识别算法.该算法解决了梅尔倒谱系数方差过大、听觉特征不明显及话者识别算法特征单一的问题.仿真结果表明:与MFCC和线性预测的提取方法相比,该算法鲁棒性能更优,对不同噪声环境的适应性更好.  相似文献   

8.
冰冻灾害下覆冰易于造成断线倒塔等电力事故,提出一种基于改进粒子群算法优化NRBF神经网络的覆冰厚度预测模型.通过改进粒子群算法,优化最近邻聚类算法的聚类半径,确定NRBF神经网络隐含层节点个数,并运用优化后的神经网络对覆冰厚度进行预测.以2006年湖南电网220kV黔平线路的覆冰数据为例,分析验证了该模型的合理性,为输电线路防冰、除冰提供理论依据.  相似文献   

9.
针对低信噪比下语种识别正确率低的问题,提出了一种声道冲激响应频谱参数和Teager能量算子倒谱参数融合的识别方法.根据语音中不同特征信息量分布特性,首先在特征提取前端引入低通滤波器滤除信号高频部分,并采用重采样方法降低采样率,再基于信号频谱提取声道冲激响应频谱参数,然后融合Teager能量算子倒谱参数,最后通过高斯混合通用背景模型进行语种识别验证.不同信噪比条件下性能测试表明,所提方法相对于基于单一的梅尔频率倒谱系数特征、单一的伽玛通频率倒谱系数特征和基于对数梅尔尺度滤波器组能量特征,在低信噪比下提升约15 dB,显著提高了识别正确率.  相似文献   

10.
设计了一种软硬结合的多模态情感识别系统,使用语音和面部表情两个模态,通过梅尔频率倒谱系数与卷积神经网络对情感进行识别和分类,同时将语音情感识别迁移到神经网络计算棒以降低环境负载. 在模态融合时,采用决策层融合的方式来提高识别准确率. 实验结果表明,系统拥有较高的识别准确率,且能够在性能较差的运行环境中保持运行速度.  相似文献   

11.
针对短期电力负荷预测问题,提出了一种基于改进粒子群算法(PSO)的BP神经网络预测模型.选取与电力负荷大小密切相关的季节、天气情况、当天最高温度、当天最低温度、日期性质、上年同期历史数据为神经网络的输入变量,电力负荷大小为输出变量,建立基于BP神经网络的电力负荷预测模型,同时利用改进的粒子群算法对神经网络进行训练.该训练算法具有较高的精度,能够建立较精确的短期电力负荷测量模型.仿真结果表明,基于改进粒子群算法的BP神经网络电力负荷预测模型预测精度较高,具有一定的应用价值.  相似文献   

12.
电力负荷预测通常采用神经网络方法,该方法训练时间较长,并且由于负荷受到气象因素影响,该算法预测的精度不是很高.为了克服当前存在的问题,采用粒子群算法优化BP神经网络的权值和阈值,归一化处理气象因素,利用神经网络预测短期电力负荷.实验结果表明,该方法比单纯BP神经网络预测具有明显优势.  相似文献   

13.
基于PSO优化BP神经网络的光伏发电量预测   总被引:1,自引:0,他引:1  
为了实现对光伏发电量的预测,降低光伏并网的不利影响,通过建立粒子群算法(Particle Swarm Optimization,PSO)优化的前馈神经网络光伏系统发电预测模型,进行光伏发电量的预测。该模型采用粒子群优化算法来优化神经网络内部权重和阈值,不仅收敛快,而且不易陷入局部极值,具有较强的泛化能力。以天气参数和光伏发电历史数据作为样本,比较了该模型与未经优化神经网络模型的预测效果。结果表明,经PSO优化的神经网络模型预测精度更高,预测性能更好。  相似文献   

14.
提出了一种基于梅尔频率倒谱系数相关性的语音感知哈希内容认证算法. 该算法提取分段语音的声纹梅尔频率倒谱系数作为感知特征. 为提高算法的安全性,算法利用伪随机序列作为密钥,计算得到梅尔频率倒谱系数与伪随机之间的相关度,最后量化相关值并加密生成感知哈希序列. 语音认证过程中,采用相似性度量函数用来衡量哈希序列之间的距离,同时与汉明距离方法进行了比较. 仿真结果表明,该算法对语音内容保持操作,如重采样、MP3压缩等具有较好的鲁棒性,相似性度量函数也对语音篡改检测定位具有较高的灵敏性.  相似文献   

15.
针对传统语音特征参数经短波信道传输后严重变形,导致语音身份识别性能下降的问题,提出一种基于线性加权梅尔倒谱系数(LWMFCC)的鲁棒短波语音身份识别方法.首先根据F比方法研究短波信道对线性预测系数(LPCC)和梅尔倒谱系数(MFCC)的影响情况,从声道频率响应的角度分析这两种特征参数变形的共性;然后结合留数归一法和线性预测方法估计语音功率谱,并将功率谱经过梅尔滤波、离散余弦转换和相对谱滤波后,提取出自适应补偿信道影响的特征LWMFCC;最后采用高斯混合模型实现身份识别.实验结果表明,该方法提取的特征对短波信道的影响具有稳健特性,能显著提高身份识别率.  相似文献   

16.
为了解决BP神经网络在短期电力负荷预测中存在局部极小、收敛速度慢等问题,本文采用粒子群算法(Particle Swarm Optimization,PSO)优化Elman动态神经网络进行精准预测。根据输入输出参数个数确定Elman神经网络结构,利用PSO算法优化网络的权值和阈值,并将优化后的最优个体赋给Elman动态神经网络作为初始权值、阈值进行网络训练,从而建立基于PSO-Elman的电力负荷预测模型。采用某钢厂实测电力数据对该方法和模型进行验证,并与传统的BP、Elman网络模型预测方法进行对比,结果表明该方法和模型在有效缩短网络收敛时间的同时,具备更高的负荷预测精度和稳定性。  相似文献   

17.
特征提取是说话人识别系统中的一项关键技术,讨论了在说话人识别中语音特征的提取,详细介绍了求取MEL倒谱系数MFCC和线性预测倒谱系数LPCC的具体步骤和算法,并对MFCC和LPCC语音特征参数做出了理论分析和实验数据比较,通过实验论证了对于低频语音,采用MFCC参数的说话人识别在屏蔽噪音和抗噪声能力都优于采用LPCC参数的说话人识别.  相似文献   

18.
基于矢量量化方法的说话人识别技术   总被引:1,自引:0,他引:1  
说话人识别是一项通过语音来识别说话人身份的技术,它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合,基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适,该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时,该系统具备拒绝识别集外人的功能。  相似文献   

19.
为了实时准确地预测交通流量,本文采用一种改进的粒子群算法对径向基函数(radical basis function,RBF)神经网络进行优化,RBF神经网络隐层中心向量由最近邻聚类确定,使用适度值择优的原理对离子群算法进行改进,将改进的粒子群算法用于最近邻聚类半径的优化,合理确定了粒子群的隐层结构。同时,运用Matlab仿真软件建立新的RBF模型,并对交通流进行预测和分析。仿真结果表明,粒子群优化RBF的相对平均误差为3.94,改进粒子群优化RBF相对平均误差为2.67,通过误差对比,改进的RBF神经网络算法具有更好的预测效果,在预测速度和精度上均优于粒子群优化RBF神经网络交通流预测算法。该研究应用前景广阔。  相似文献   

20.
提出了一种基于模型融合的声效检测方法.首先提取对所有声效模式都具有良好辨识能力的谱信息熵特征,并进行声效辨识度分析;然后引入互补模型进行声效识别,从模型层面实现了整体谱特征、梅尔频率倒谱系数和谱信息熵的融合.对孤立词测试集进行了声效检测实验,识别精度为81.6%,实验结果表明,谱信息熵在3类特征中具有最好的分类能力,而互补模型能够有效集成3种特征蕴含的显著性信息.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号