首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
一种基于MFCC的音频数据检索方法   总被引:3,自引:1,他引:2  
以LPC倒谱系数(LPCC)为特征参数的音频数据检索是人们常用的一种方法,但这种方法没有充分考虑到人耳听觉的非线性特性.因此,提出了一种采用MFCC及其差分倒谱系数相结合作为特征参数来做音频数据检索的方法.通过实验对比分析结果表明,这种音频数据检索方法比LPCC的检索具有更高的识别率.  相似文献   

2.
基于音频信号的轴承故障诊断方法   总被引:1,自引:0,他引:1  
介绍了一种基于隐马尔可夫模型的轴承故障音频信号诊断方法。通过对轴承音频信号的 Mel 频率倒谱系数特征提取,分别采用离散 HMM 和连续高斯混合密度 HMM 两种方法进行建模与诊断研究。与 CGHMM 方法相比,DHMM 方法运算速度快,但诊断精度低。而从总体上来看,两种方法都具有运算速度快,诊断精度高的优点。结果表明,本文方法具有很好的应用前景。  相似文献   

3.
提出了基于Mel倒谱系数和加权的一阶、二阶差分Mel倒谱系数特征参数组合的环境音分类,实验结果表明以MFCC+α△MFCC+β△△MFCC为特征参数的分类正确率明显高于MFCC、MFCC+△MFCC和MFCC+△MFCC+△MFCC。  相似文献   

4.
为了对现场机械或设备进行监控、诊断和识别,以音频为监控手段,引入矢量量化(VQ)算法并建立机械设备音频的离散隐Markov模型(DHMM)。特征参数采用MFCC,码书设计采用Linde-Buzo-Gray(LBG)算法;推导出Baum-Welch算法参数重估的多观察序列的最简标定形式;分析了多种HMM类型,提出了适合机械设备音频的HMM。实验在22种音频中进行,识别准确率在97%以上,证明了方法的有效性。  相似文献   

5.
基于DHMM的轴承故障音频诊断方法   总被引:4,自引:0,他引:4       下载免费PDF全文
轴承音频信号包含了大量的运行状态信息,与振动信号相比,音频信号的采集是非接触式的,具有使用方便和成本低廉等优势。通过提取机械轴承音频信号的Mel频率倒谱系数(MFCC)特征参数,并使用具有良好识别和抗噪性能的隐马尔可夫模型(HMM)分析轴承运行状态,首次将HMM对音频信号的分析方法应用于故障诊断。为了能够实现对轴承故障的实时诊断,采用计算量较小的离散HMM(DHMM)模型加快训练和识别速度。实验结果表明,该方法对轴承运行状态的识别正确率接近90%,识别时间约为31 ms,效果较好,有效可行,具有很好的应用前景。  相似文献   

6.
现代通信中,说话人的身份认证技术一直是通信行业研究的重点和热点。而基于GMM和MFCC的说话人识别技术,是目前为止相对成熟和常用的方法。对说话人识别系统的构成做了相关的研究,并通过MATLAB编程,设计了一款以MFCC作为特征参数,基于GMM模型的说话人识别系统。经过实验测试,本系统能基本满足工作及家庭生活环境下的说话人识别需要。  相似文献   

7.
说话人识别是根据检测到的语音进行说话人身份的认证.是将待识别语音与数据库中的说话人语音进行匹配的过程。设计基于高斯混合模型(GMM)说话人识别系统,提取输入语音的Mel倒谱系数作为观察向量,用GMM算法进行说话人语音模型训练和识别。同时设计基于TMS320DM3730DSP的嵌入式硬件平台,并在该平台上实现所设计的说话人识别系统。为进行性能测试,自行录制相应的语音材料库,录音的人数为38人,其中男19人,女19人。经测试表明,在正常环境下.该设计的说话人系统识别率可达到95%以上。  相似文献   

8.
通过提取基音频率、明亮度、带宽、过零率、响度、均方根、相邻点之间距离的均值和方差及Mel倒谱系数这8个特征构造特征集,在此基础上提出一种基于最近特征线的音频分类算法,对其进行枪声、鞭炮声、喇叭声及说话声的分类实验中,结果表明,该算法的分类效果较好,错误率可低至11.76%。  相似文献   

9.
MFCC特征改进算法在语音识别中的应用   总被引:2,自引:0,他引:2       下载免费PDF全文
本文的目的是阐明一种Mel频率倒谱参数特征的改进算法。该算法是通过线性预测的方法从语音信号中提取出残差相位,同时将残差相位与传统的MFCC相结合,并应用到语音识别系统中。该改进算法比传统的MFCC算法具有更好的识别率。  相似文献   

10.
基于LPCMCC的音频数据检索方法   总被引:1,自引:0,他引:1       下载免费PDF全文
江基华  李应 《计算机工程》2009,35(11):246-247
LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法的检索精度高于LPCC,检索效率高于美尔倒谱系数(MFCC)。  相似文献   

11.
寇占奎  徐江峰 《计算机工程与设计》2012,33(9):3323-3326,3341
提出了一个基于语音特征和均值量化的DWT域半脆弱音频数字水印方案.该方案对语音特征进行提取得到梅勒频率倒谱系数(MFCC),对其进行turbo纠错编码,通过均值量化把该编码作为水印嵌入到载体语音中.实验分析结果表明,该方案既对音频的一般操作有较强的鲁棒性,又对篡改音频操作有很强的敏感性,同时水印提取不需要额外的水印信号,准确度高.  相似文献   

12.
基于发音特征的音/视频双流语音识别模型*   总被引:1,自引:0,他引:1  
构建了一种基于发音特征的音/视频双流动态贝叶斯网络(dynamic Bayesian network, DBN)语音识别模型,定义了各节点的条件概率关系,以及发音特征之间的异步约束关系,最后在音/视频连接数字语音数据库上进行了语音识别实验,并与音频单流、视频单流DBN模型比较了在不同信噪比情况下的识别效果。结果表明,在低信噪比情况下,基于发音特征的音/视频双流语音识别模型表现出最好的识别性能,而且随着噪声的增加,其识别率下降的趋势比较平缓,表明该模型对噪声具有很强的鲁棒性,更适用于低信噪比环境下的语音识别  相似文献   

13.
针对现有语音情绪识别中存在无关特征多和准确率较差的问题,提出一种基于混合分布注意力机制与混合神经网络的语音情绪识别方法。该方法在2个通道内,分别使用卷积神经网络和双向长短时记忆网络进行语音的空间特征和时序特征提取,然后将2个网络的输出同时作为多头注意力机制的输入矩阵。同时,考虑到现有多头注意力机制存在的低秩分布问题,在注意力机制计算方式上进行改进,将低秩分布与2个神经网络的输出特征的相似性做混合分布叠加,再经过归一化操作后将所有子空间结果进行拼接,最后经过全连接层进行分类输出。实验结果表明,基于混合分布注意力机制与混合神经网络的语音情绪识别方法比现有其他方法的准确率更高,验证了所提方法的有效性。  相似文献   

14.
针对前馈神经网络难以处理时序数据的问题,提出将双向循环神经网络(BiRNN)应用在自动语音识别声学建模中。首先,应用梅尔频率倒谱系数进行特征提取;其次,采用双向循环神经网络作为声学模型;最后,测试不同参数对系统性能的影响。在TIMIT数据集上的实验结果表明,与基于卷积神经网络和深度神经网络的声学模型相比,识别率分别提升了1.3%和4.0%,说明基于双向循环神经网络的声学模型具有更好的性能。  相似文献   

15.
针对现有采煤机滚筒载荷识别方法相关算法实施难度大、工程实现方式复杂、应用难度高等问题,通过分析采煤机工作时音频信号的特征,提出一种基于音频识别的采煤机滚筒载荷识别方法。为确保每个分析周期内的音频信号具有同一运行标准下的负载工况,将截割电流与牵引速度作为变量引入到动态能量计算中,采用动态能量归一化算法(DENA)对采煤机原始音频信号进行归一化处理;将归一化后的信号与标准工况库中的信号进行对比分析,通过最大相异系数判断两者之间的差异性,从而确定滚筒载荷特征,实现滚筒载荷识别判断。试验结果表明:DENA可有效抑制音频信号中的噪声能量,提升音频信号中关键特征值的分辨率,采煤机在截割煤、岩时的音频信号特征参数界限明显,未出现交叉混叠现象;在理想情况下,即最大相异系数小于0.189时,总的煤岩界面识别率可达到78.6%。  相似文献   

16.
Content based music genre classification is a key component for next generation multimedia search agents. This paper introduces an audio classification technique based on audio content analysis. Artificial Neural Networks (ANNs), specifically multi-layered perceptrons (MLPs) are implemented to perform the classification task. Windowed audio files of finite length are analyzed to generate multiple feature sets which are used as input vectors to a parallel neural architecture that performs the classification. This paper examines a combination of linear predictive coding (LPC), mel frequency cepstrum coefficients (MFCCs), Haar Wavelet, Daubechies Wavelet and Symlet coefficients as feature sets for the proposed audio classifier. Parallel to MLP, a Gaussian radial basis function (GRBF) based ANN is also implemented and analyzed. The obtained prediction accuracy of 87.3% in determining the audio genres claims the efficiency of the proposed architecture. The ANN prediction values are processed by a rule based inference engine (IE) that presents the final decision.  相似文献   

17.
环境声音分类(ESC)是音频处理领域的重要分支之一,在未来多媒体应用中有重要的作用。音频识别是提取音频中特定的声学特性,将音频分类至样本对应的正确场景,有助于感知和理解周围环境。现阶段音频识别主要是通过信号处理技术和机器学习方法达成。随着人工智能飞速发展,传统的音频处理技术以及机器学习方法面临着巨大的挑战,ESC的识别准确性有待进一步提高。结合残差网络和随机森林两种方法,将一维时域信号的音频数据转换为二维数据形式的梅尔声谱图,预训练残差网络获得一个精度较高的网络模型作为特征提取器,利用该网络模型提取音频中的深层特征,再利用随机森林对深层特征进行分类。该方法在ESC任务上识别率提升了近10%,取得了较好的分类结果。  相似文献   

18.
为降低特征识别的复杂度,提出基于特征实体、特征实面和特征虚面概念的层次性特征分类方法.通过构造2类神经网络输入矩阵,利用神经网络在特征识别中所具有的优势,实现基于特征面的分层特征识别方法.实例表明:该方法在识别去除材料的特征时比较有效,但识别特征的范围受到一定限制.  相似文献   

19.
提出了一种基于雷达和视觉传感器融合的实时车辆检测和识别系统。雷达数据用来测量前方车辆的距离和缩小图像中车辆尾部的搜索区域。利用视频传感器,可以验证雷达目标和确定车辆的宽度及横向位置。所做工作如下:第一,提出了一种新的进化优化对称测度方法;第二,阐述了一种车辆检测和识别算法,此算法包括两个步骤:(1)利用基于一组Haar滤波器和AdaBoost学习算法检测器的生成假设;(2)利用进化优化与生物机制车辆识别系统的验证假设。第三,利用经典的混淆矩阵及宽度和横向位置的准确度信息来对系统的性能做出评价。实验训练和测试了超过30 000幅图片,结果表明本系统具有良好的鲁棒性和实时性。  相似文献   

20.
利用局部特征的子空间车辆识别算法   总被引:2,自引:0,他引:2       下载免费PDF全文
利用改进的主成分分析(Principal Component Analysis,PCA)方法,通过研究不同的车辆特征(如全局特征、各种局部特征)对静态图像车辆识别效果的影响,提出了一种新的静态图像车辆识别算法。该算法可有效降低光照和背景噪声对识别的影响,实现对存在部分遮挡的车辆检测。实验结果表明,该算法具有良好的鲁棒性和车辆识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号