共查询到20条相似文献,搜索用时 15 毫秒
1.
针对单一特征参数表征语音信息不够全面的缺点,利用时域特征参数和频域不同特征参数的优点,融合频域特征参数MFCC、GFCC、MFCC一阶差分、GFCC一阶差分和时域特征参数短时能量,然后将多维度的融合特征参数进行主成分分析降维。降维后的特征参数送入双向长短时记忆神经网络模型进行识别训练。仿真实验表明,本文目标参数参与训练的说话人识别模型取得了99.61%的识别正确率,较其他说话人识别模型的识别率更高。 相似文献
2.
3.
4.
汉语数字识别常用MFCC作为特征,针对0-9十个数字MFCC样本特征数据量大的问题,提出了用GMM模型对提取的特征参数MFCC的数据进行聚类来减少数据量,以GMM模型参数中的均值作为新的特征,采用动态规划算法进行汉语数字语音识别.仿真实验表明,进行GMM特征变换后的新特征数据为MFCC的30.9%,系统运行时间减少了2... 相似文献
5.
音符识别是音乐信号分析处理领域内非常重要的研究内容,它为计算自动识谱、乐器调音、音乐数据库检索和电子音乐合成提供技术基础。传统的音符识别方法通过估计音符基频与标准频率进行一一对应识别。然而一一对应较为困难,且随着音符基频的增大将导致误差增大,可识别的音符基频范围不广。为此,文中采用分类的思想进行音符识别。首先,建立所需识别的音符音频库,并针对音乐信号低频信息的重要性,选取梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)和常数Q变换(Constant Q Transform,CQT)作为音符信号提取特征。然后,将提取的特征MFCC和CQT分别作为音符识别的单一特征输入和两者特征融合输入;结合Softmax回归模型在多分类问题中的优势以及BP神经网络良好的非线性映射能力与自学习能力,构建基于Softmax回归模型的BP神经网络多分类识别器。在MATLAB R2016a的仿真环境下,将特征参数输入到多分类器中进行学习与训练,通过调整网络参数来寻找最优解。通过改变训练样本数进行对比实验。实验结果表明,将融合特征(MFCC+CQT)作为特征输入... 相似文献
6.
7.
基于遗传算法和BP网络的文字识别方法 总被引:6,自引:0,他引:6
将基于遗传的BP神经网络算法用于文字识别算法结合了遗传算法和BP网络的优点.先采用遗传学习算法进行全局寻优、再利用BP算法进行精确训练、优化BP(Back Propagation)神经网络权重学习和训练的神经网络文字识别算法.实验结果表明该算法完全达到了文字识别要求,识别率达到了98%.并且在识别速度上也明显优于传统的BP神经网络及其他改进算法,具有精确性、收敛性和识别速度快等特点. 相似文献
8.
随着Internet技术的发展,网络应用服务越来越丰富多彩。为了对目前互联网中的流量实施有效监控,需要使用协议识别技术,因此,协议识别方法已成为研究热点。然而随着网络协议的复杂化,一些传统的协议识别方法已经不能够准确地识别协议。主要介绍基于数据包Payload特征的识别方法与基于流量特征的SVM识别方法,并提出一种将两者结合的协议识别方案。 相似文献
9.
以提高汉语耳语的识别率为目的,提出了将MFCC、LPCC及它们各自的动态参数等多种特征有效结合进行耳语识别的方法。实验结果说明了LPCC、MFCC结合动态参数可作为汉语耳语音识别的特征参数,且它们的结合提高了系统的识别率,在小字库内得出的识别率为94.5%。 相似文献
10.
11.
针对目前我国各油田录井资料利用率低、解释方法陈旧、自动化程度不高的现状,将神经网络技术用于油气识别。介绍了BP模型,及如何处理实际的录井资料。通过实际应用,表明依据录井资料,用神经网络技术进行油气识别,可提高录井资料的利用率以及现场实时解释,且油气识别符合率达到现场的要求。 相似文献
12.
微表情的变化是非常微小的,这使得微表情的研究非常困难。微表情是不能伪造和压制的,因此也成为判断人们主观情感的重要依据。本文提出了以卷积神经网络及改进长短时记忆网络特征融合为依托的微表情识别方法,先介绍了相关的背景知识,再介绍了实验的预处理过程、特征提取以及相应的特征融合的过程,将所得的结果用于实验模型的预测分类。实验结果表明,新模型具有更好的识别率。 相似文献
13.
14.
基于不变矩和神经网络的交通标志识别方法研究 总被引:5,自引:0,他引:5
在交通标志实时识别过程中,由于参考图像与实测图像不是同时获取的,因此摄像机与被摄交通标志之间的位置难以保证完全相同。于是,所获取的参考交通标志图像与实测交通标志图像之间就可能产生几何失真。几何失真将对于图像识别的结果带来很大的影响。因此,需要寻找一种具有旋转和比例不变性的图像识别方法,以满足实际应用中的需要。针对上述问题,提出了一种基于不变矩和神经网络的交通标志识别算法。实验结果表明,所提出的识别算法具有很好的识别能力。 相似文献
15.
在表情中含有最多特征信息的是面部眉毛、眼睛和嘴巴这三个区域,为充分利用这些特征,减少图像中无用信息在识别过程中对计算机内存的占用,提高人脸表情识别系统的准确率和速度,首先采用haar 和 adaboost人脸检测算法,对图像中的人脸进行识别,获得人脸图像并提取眉毛、眼睛和嘴巴,生成局部(眉毛、眼睛、嘴巴)二值化图,利用PCA方法对人脸图像降维,降维后的全局和局部灰度特征值组成一个列向量。样本由表情数据库产生,经过神经网络样本训练后,进行表情识别。结果表明,该系统对人脸表情识别速度明显快于Gabor 小波算法;识别的准确率高于单独使用PCA算法和神经网络算法;消耗内存比用Gabor 小波算法少,运行较流畅。得出结论:因为提取出包含表情特征信息集中区的眉毛、眼睛和嘴巴,尽可能地多保留了这些局部特征信息,因而提高了表情识别准确率,同时,采用PCA方法对原始图像进行降维处理,有效的减少了信息冗余。 相似文献
16.
文章以SVM作为语音识别核心算法,以TMS320C6713DSK作为硬件平台,选择相应的语音识别算法,利用SVM和DSP各自的优势,设计了一款非特定人、小词汇量的连续实时语音识别系统;并在Matlab平台上进行了实验仿真,然后在TMS320C6713DSK开发板上进行论证;实际系统前端采用MFCC特征参数、并用遗传算法与矢量量化混合算法对其进行聚类得到优化码本,所采用种群数为80,码本长度为16,然后将所得码本作为SVM模式训练和识别算法的输入;结果表明,该系统在满足系统实时性的同时也提高了其正识率,具有一定的实用性。 相似文献
17.
针对传统英语多语音识别准确率低的问题,提出一种基于轻量化神经网络的英语语音识别及控制系统。其中,首先采用MFCC方法对输入语音特征进行提取;然后以时延神经网络TDNN为基础网络,通过步进裁剪得到轻量化的神经网络;最后将提取到的多语音特征输入神经网络中进行识别。结果表明,经过轻量化的神经网络其大小由77 M降低至21 M;在Dev93和Eval92数据集上的测试,其WER值分别为5.12%和3.99%,相较于直接裁剪和未裁剪的WER值更低,英语语音识别准确率更高。由此得出,本研究构建的轻量化神经网络可用于多语音的识别,进而可拓展至包含英语交流机器人在内的领域。 相似文献
18.
针对病人肺结节大小各异、结节征象复杂造成的结节检测困难问题,基于迁移学习提出一种多尺度和特征融合的肺癌识别方法,根据CT图像预测病人未来一年内患肺癌的概率。根据肺结节和肺肿块大小,采用3种不同尺度的图像块输入三维结节检测网络,避免小尺度输入的结节检测网络难以获取大区域病灶整体特征的问题;在多尺度输入基础上采用特征融合策略,将网络提取的瓶颈层特征和输出层特征融合,充分描述病灶的详细特征。在Kaggle Data Science Bowl 2017数据集上的实验结果表明,所提方法降低了肺癌预测的损失值,提高了肺癌识别精度。 相似文献
19.
现今关于驾驶员路怒情绪识别方法中语音特性分析相对较少,该研究以路怒情绪为研究对象,利用模拟驾驶系统建立数据集,通过分析驾驶员语音的频谱特征,将时域中短时能量及短时过零率特征参数和改进Mel频率倒谱系数(Mel frequency cepstral coefficients,MFCC)特征参数融合构成特征参数向量,利用萤火虫算法(firefly algorithm,FA)优化PNN神经网络(probabilistic neural networks)并构建识别模型,实现驾驶员路怒情绪的识别。实验结果表明,在相同神经网络下,改进MFCC融合特征提取方法相比传统MFCC特征提取方法具有更好的抗噪性。同时,FA-PNN模型的识别准确率为93.0%,相比传统PNN模型提高了11个百分点;F1-Score值为0.932 8,提高了0.104 7。该研究论证了语音信号处理技术对驾驶员路怒情绪识别的可行性,为汽车主动安全驾驶预警研究提供了新方法。 相似文献