首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对单一特征参数表征语音信息不够全面的缺点,利用时域特征参数和频域不同特征参数的优点,融合频域特征参数MFCC、GFCC、MFCC一阶差分、GFCC一阶差分和时域特征参数短时能量,然后将多维度的融合特征参数进行主成分分析降维。降维后的特征参数送入双向长短时记忆神经网络模型进行识别训练。仿真实验表明,本文目标参数参与训练的说话人识别模型取得了99.61%的识别正确率,较其他说话人识别模型的识别率更高。  相似文献   

2.
基于MFCC与分形维数混合参数的语音识别   总被引:5,自引:0,他引:5  
针对语音气流中具有混沌特征,而分形可以定量地分析混沌现象,故分形可用来分析语音信号。语音波形具有分形特征,将分形用于改善语音识别技术更好地表现语音的特征,避免传统的分段线性处理所产生的局限性。将传统特征参数MFCC与分形特征结合起来,组成混合参数用于语音识别。实验结论显示,基于MFCC与分形维数混合参数的语音识别方法要好于使用单一MFCC参数的语音识别方法。  相似文献   

3.
为保障电缆不受外力破坏,运用声音信号处理和模式识别技术,对挖掘设备声音信号进行识别。主要研究内容有:1声音信号的倒谱域特征参数分析:Mel频率倒谱系数(MFCC),一阶差分Mel频率倒谱系数(△MFCC);2采用KNN的识别算法进行测试。理论分析和实验结果表明,对于4种设备声音信号,△MFCC识别率可达86.69%,满足实际应用需求。提出的挖掘设备声音信号处理及识别算法具有通用性,可用于地下管道监测等领域。  相似文献   

4.
汉语数字识别常用MFCC作为特征,针对0-9十个数字MFCC样本特征数据量大的问题,提出了用GMM模型对提取的特征参数MFCC的数据进行聚类来减少数据量,以GMM模型参数中的均值作为新的特征,采用动态规划算法进行汉语数字语音识别.仿真实验表明,进行GMM特征变换后的新特征数据为MFCC的30.9%,系统运行时间减少了2...  相似文献   

5.
音符识别是音乐信号分析处理领域内非常重要的研究内容,它为计算自动识谱、乐器调音、音乐数据库检索和电子音乐合成提供技术基础。传统的音符识别方法通过估计音符基频与标准频率进行一一对应识别。然而一一对应较为困难,且随着音符基频的增大将导致误差增大,可识别的音符基频范围不广。为此,文中采用分类的思想进行音符识别。首先,建立所需识别的音符音频库,并针对音乐信号低频信息的重要性,选取梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)和常数Q变换(Constant Q Transform,CQT)作为音符信号提取特征。然后,将提取的特征MFCC和CQT分别作为音符识别的单一特征输入和两者特征融合输入;结合Softmax回归模型在多分类问题中的优势以及BP神经网络良好的非线性映射能力与自学习能力,构建基于Softmax回归模型的BP神经网络多分类识别器。在MATLAB R2016a的仿真环境下,将特征参数输入到多分类器中进行学习与训练,通过调整网络参数来寻找最优解。通过改变训练样本数进行对比实验。实验结果表明,将融合特征(MFCC+CQT)作为特征输入...  相似文献   

6.
介绍了语音的美尔倒谱特征及提取算法,并提取语音段的美尔倒谱特征,建立BP神经网络,用Matlab进行仿真识别,表明能较好的实现连续语音的说话人识别。  相似文献   

7.
基于遗传算法和BP网络的文字识别方法   总被引:6,自引:0,他引:6  
苗琦龙  栾新 《计算机应用》2005,25(Z1):330-332
将基于遗传的BP神经网络算法用于文字识别算法结合了遗传算法和BP网络的优点.先采用遗传学习算法进行全局寻优、再利用BP算法进行精确训练、优化BP(Back Propagation)神经网络权重学习和训练的神经网络文字识别算法.实验结果表明该算法完全达到了文字识别要求,识别率达到了98%.并且在识别速度上也明显优于传统的BP神经网络及其他改进算法,具有精确性、收敛性和识别速度快等特点.  相似文献   

8.
随着Internet技术的发展,网络应用服务越来越丰富多彩。为了对目前互联网中的流量实施有效监控,需要使用协议识别技术,因此,协议识别方法已成为研究热点。然而随着网络协议的复杂化,一些传统的协议识别方法已经不能够准确地识别协议。主要介绍基于数据包Payload特征的识别方法与基于流量特征的SVM识别方法,并提出一种将两者结合的协议识别方案。  相似文献   

9.
基于改进LPCC和MFCC的汉语耳语音识别   总被引:5,自引:0,他引:5       下载免费PDF全文
以提高汉语耳语的识别率为目的,提出了将MFCC、LPCC及它们各自的动态参数等多种特征有效结合进行耳语识别的方法。实验结果说明了LPCC、MFCC结合动态参数可作为汉语耳语音识别的特征参数,且它们的结合提高了系统的识别率,在小字库内得出的识别率为94.5%。  相似文献   

10.
车型识别是智能交通系统中的一个重要组成部分.利用计算机视觉、模式识别等理论方法,对车型的有效特征提取与分类识别进行了深入的研究,提出了一种多特征融合的模糊聚类车型识别方法.通过自动调整各维特征的加权系数来调整特征对分类的贡献,结果表明达到了较好的分类效果.  相似文献   

11.
针对目前我国各油田录井资料利用率低、解释方法陈旧、自动化程度不高的现状,将神经网络技术用于油气识别。介绍了BP模型,及如何处理实际的录井资料。通过实际应用,表明依据录井资料,用神经网络技术进行油气识别,可提高录井资料的利用率以及现场实时解释,且油气识别符合率达到现场的要求。  相似文献   

12.
微表情的变化是非常微小的,这使得微表情的研究非常困难。微表情是不能伪造和压制的,因此也成为判断人们主观情感的重要依据。本文提出了以卷积神经网络及改进长短时记忆网络特征融合为依托的微表情识别方法,先介绍了相关的背景知识,再介绍了实验的预处理过程、特征提取以及相应的特征融合的过程,将所得的结果用于实验模型的预测分类。实验结果表明,新模型具有更好的识别率。  相似文献   

13.
基于DSmT的序列图像智能融合目标识别方法   总被引:2,自引:0,他引:2  
侯俊  苗壮  潘泉 《计算机应用》2006,26(1):120-0122
提出了一种基于BP神经网络和DSmT推理的序列图像目标识别算法。以修正的Hu不变矩为图像特征,利用数据融合的思想对来自目标的序列图像进行时间域融合处理。由BP神经网络对目标的初步识别结果构造基本置信指派函数,用DSmT组合规则进行决策级数据融合,完成了三维飞机图像目标的识别仿真。仿真结果表明,融合方法提高了三维飞机目标识别的准确性。  相似文献   

14.
基于不变矩和神经网络的交通标志识别方法研究   总被引:5,自引:0,他引:5  
在交通标志实时识别过程中,由于参考图像与实测图像不是同时获取的,因此摄像机与被摄交通标志之间的位置难以保证完全相同。于是,所获取的参考交通标志图像与实测交通标志图像之间就可能产生几何失真。几何失真将对于图像识别的结果带来很大的影响。因此,需要寻找一种具有旋转和比例不变性的图像识别方法,以满足实际应用中的需要。针对上述问题,提出了一种基于不变矩和神经网络的交通标志识别算法。实验结果表明,所提出的识别算法具有很好的识别能力。  相似文献   

15.
在表情中含有最多特征信息的是面部眉毛、眼睛和嘴巴这三个区域,为充分利用这些特征,减少图像中无用信息在识别过程中对计算机内存的占用,提高人脸表情识别系统的准确率和速度,首先采用haar 和 adaboost人脸检测算法,对图像中的人脸进行识别,获得人脸图像并提取眉毛、眼睛和嘴巴,生成局部(眉毛、眼睛、嘴巴)二值化图,利用PCA方法对人脸图像降维,降维后的全局和局部灰度特征值组成一个列向量。样本由表情数据库产生,经过神经网络样本训练后,进行表情识别。结果表明,该系统对人脸表情识别速度明显快于Gabor 小波算法;识别的准确率高于单独使用PCA算法和神经网络算法;消耗内存比用Gabor 小波算法少,运行较流畅。得出结论:因为提取出包含表情特征信息集中区的眉毛、眼睛和嘴巴,尽可能地多保留了这些局部特征信息,因而提高了表情识别准确率,同时,采用PCA方法对原始图像进行降维处理,有效的减少了信息冗余。  相似文献   

16.
文章以SVM作为语音识别核心算法,以TMS320C6713DSK作为硬件平台,选择相应的语音识别算法,利用SVM和DSP各自的优势,设计了一款非特定人、小词汇量的连续实时语音识别系统;并在Matlab平台上进行了实验仿真,然后在TMS320C6713DSK开发板上进行论证;实际系统前端采用MFCC特征参数、并用遗传算法与矢量量化混合算法对其进行聚类得到优化码本,所采用种群数为80,码本长度为16,然后将所得码本作为SVM模式训练和识别算法的输入;结果表明,该系统在满足系统实时性的同时也提高了其正识率,具有一定的实用性。  相似文献   

17.
针对传统英语多语音识别准确率低的问题,提出一种基于轻量化神经网络的英语语音识别及控制系统。其中,首先采用MFCC方法对输入语音特征进行提取;然后以时延神经网络TDNN为基础网络,通过步进裁剪得到轻量化的神经网络;最后将提取到的多语音特征输入神经网络中进行识别。结果表明,经过轻量化的神经网络其大小由77 M降低至21 M;在Dev93和Eval92数据集上的测试,其WER值分别为5.12%和3.99%,相较于直接裁剪和未裁剪的WER值更低,英语语音识别准确率更高。由此得出,本研究构建的轻量化神经网络可用于多语音的识别,进而可拓展至包含英语交流机器人在内的领域。  相似文献   

18.
针对病人肺结节大小各异、结节征象复杂造成的结节检测困难问题,基于迁移学习提出一种多尺度和特征融合的肺癌识别方法,根据CT图像预测病人未来一年内患肺癌的概率。根据肺结节和肺肿块大小,采用3种不同尺度的图像块输入三维结节检测网络,避免小尺度输入的结节检测网络难以获取大区域病灶整体特征的问题;在多尺度输入基础上采用特征融合策略,将网络提取的瓶颈层特征和输出层特征融合,充分描述病灶的详细特征。在Kaggle Data Science Bowl 2017数据集上的实验结果表明,所提方法降低了肺癌预测的损失值,提高了肺癌识别精度。  相似文献   

19.
现今关于驾驶员路怒情绪识别方法中语音特性分析相对较少,该研究以路怒情绪为研究对象,利用模拟驾驶系统建立数据集,通过分析驾驶员语音的频谱特征,将时域中短时能量及短时过零率特征参数和改进Mel频率倒谱系数(Mel frequency cepstral coefficients,MFCC)特征参数融合构成特征参数向量,利用萤火虫算法(firefly algorithm,FA)优化PNN神经网络(probabilistic neural networks)并构建识别模型,实现驾驶员路怒情绪的识别。实验结果表明,在相同神经网络下,改进MFCC融合特征提取方法相比传统MFCC特征提取方法具有更好的抗噪性。同时,FA-PNN模型的识别准确率为93.0%,相比传统PNN模型提高了11个百分点;F1-Score值为0.932 8,提高了0.104 7。该研究论证了语音信号处理技术对驾驶员路怒情绪识别的可行性,为汽车主动安全驾驶预警研究提供了新方法。  相似文献   

20.
基于小波包分析和BP神经网络的中医脉象识别方法   总被引:3,自引:0,他引:3  
利用小波变换具有揭示信号时频两域细节和局部特征的能力,提出了将脉象信号的小波包分析和BP神经网络相结合以达到识别中医脉象的新方法。首先对脉象信号作三层小波包分解,利用小波包分解系数重构信号。然后计算第三层从低频至高频八个频带的信号能量,以此能量构造出脉象信号的特征向量送入改进的BP神经网络进行训练。大量样本的实验证实该方法具有识别正确率高、速度快的优点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号