共查询到19条相似文献,搜索用时 125 毫秒
1.
为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFCC相比,在纯净语音库及噪声环境中均具有较好的识别性能。 相似文献
2.
3.
基于Fisher比的梅尔倒谱系数混合特征提取方法 总被引:1,自引:0,他引:1
针对语音识别中梅尔倒谱系数(MFCC)对中高频信号的识别精度不高,并且没有考虑各维特征参数对识别结果影响的问题,提出基于MFCC、逆梅尔倒谱系数(IMFCC)和中频梅尔倒谱系数(MidMFCC),并结合Fisher准则的特征提取方法。首先对语音信号提取MFCC、IMFCC和MidMFCC三种特征参数,分别计算三种特征参数中各维分量的Fisher比,通过Fisher比对三种特征参数进行选择,组成一种混合特征参数,提高语音中高频信息的识别精度。实验结果表明,在相同环境下,新的特征与MFCC参数相比,识别率有一定程度的提高。 相似文献
4.
语音变调常用于掩盖说话人身份,各种变声软件的出现使得说话人身份伪装变得更加容易。针对现有变调语音检测方法无法判断语音是经过了何种变调操作(升调或降调)的问题,通过分析语音变调在信号频谱,尤其是高频区域留下的痕迹,提出了基于翻转梅尔倒谱系数(IMFCC)统计矩特征的电子变调语音检测方法。首先,提取各语音帧IMFCC及其一阶差分;然后,计算其统计均值;最后,在该统计特征上利用支持向量机(SVM)多分类器的设计来区分原始语音、升调语音和降调语音。在TIMIT和NIST语音集上的实验结果表明,所提方法无论对于原始语音、升调语音还是降调语音都具有良好的检测性能。与MFCC作为特征构造的基线系统相比,所设计的特征的方法明显提高了变调操作的识别率。在较少的训练资源的情况下,所提方法也获得了比基于卷积神经网络(CNN)的框架更好的性能;此外,在不同数据集和不同变调方法上也都取得了较好的泛化性能。 相似文献
5.
在伴随着外部噪声的情况下,待识别的声纹美尔频率倒谱系数特征各项属性很容易受到外部噪声的干扰发生改变,造成声纹特征的识别的精度不高.为提高精度,提出了一种用支持向量机的美尔频率倒谱系数特征干扰去除算法.确定分类决策函数时充分考虑美尔频率倒谱系数与声纹中心以及噪声之间的关系,并且将声纹特征引入核函数,将原空间样本数据通过非线性变换映射到高维特征空间,在高维空间中求最优或广义最优分类面,实现对语音特征的干扰消除.实验表明,利用改进算法实现了声纹特征中过零率,倒谱特征、矩形窗和汉明窗长的短时能量函数特征的优化. 相似文献
6.
反映声道(谐振器)物理特性且不易受环境影响的元音共振峰可以更好地反映说话人的声纹特征,为此提出了说话人共振峰自适应MFCC(梅尔倒谱系数)特征提取SOC(片上系统)设计。首先提取说话人语音元音的三组共振峰来设计Mel三角形滤波器组,并基于传统MFCC与共振峰改进MFCC矩阵参数比值设计自适应融合说话人语音特征以改进MFCC。在MATLAB中完成性能仿真,在QUARTUS II中完成VERILOG-HDL代码设计,在FPGA(现场可编程门阵列)开发板上完成SOC设计、编译、仿真和验证下载。结果表明,在较高信噪比环境下,基于自适应融合和共振峰改进的MFCC得到的特征向量比传统的MFCC具有更强的鲁棒性,此技术在说话人声纹身份识别传感器设计中有较大应用推广价值。 相似文献
7.
针对传统环境音分类模型对环境音特征提取不充分,以及卷积神经网络用于环境音分类时全连接层易造成过拟合现象的问题,提出了梅尔倒谱系数(MFCC)、深层卷积和Bagging算法相结合的环境音分类方法。首先,针对原始音频文件,利用预加重、加窗、离散傅里叶变换、梅尔滤波器转换、离散余弦映射等方法建立梅尔倒谱系数特征模型;然后,将特征模型输入卷积深度网络进行第二次特征提取;最后,借鉴强化学习思想,用Bagging集成算法集成线性判别分析器、支持向量机(SVM)、Softmax回归、XGBoost四个模型,以投票预测的形式对网络输出结果进行预测。实验结果表明,所提方法能够有效提高对环境音的特征提取能力和深层网络在环境音分类上的抗过拟合能力。 相似文献
8.
基于动态时间规整的飞控系统故障诊断 总被引:3,自引:1,他引:2
针对飞控系统故障诊断,提出了一种利用动态信息对故障进行检测的新方法.通过建立的作动器正常模型,其解析输出值与作动器末端线位移传感器输出值比较,获得残差向量,对该残差序列采用动态时间规整算法,与已知的故障样本进行匹配,进一步确认和定位故障.由于该算法是一种柔性模式匹配算法,能够对存在全局或局部扩展、压缩或变形的模式进行匹配,解决动态模式的相似度量和分类问题,仿真结果表明,该算法能够准确识别单一故障和组合故障,对噪声干扰具有很好的鲁棒性. 相似文献
9.
为解决目前婴儿智能监护产品对婴儿哭声识别不准确的问题,设计了能准确识别婴儿哭声的婴儿智能监护系统;使用RT5350芯片作为处理器,使用PAP7501芯片实现对视频信号和音频信号的采集;对系统移植了Linux内核,使用多线程编程技术编写了应用程序;通过提取梅尔频率倒谱系数作为特征参数,使用动态时间规整算法作为识别算法,实现了对婴儿哭声的准确识别;该系统可以与云服务器通信,实现婴儿哭声报警功能;该系统可以与用户的终端设备通信,实现视频数据和音频数据的传输;该智能监护系统极大地方便了用户对婴儿的监护。 相似文献
10.
搭载Android智能手机平台,结合了梅尔倒谱系数和共振峰特征参数,在安卓平台上设计开发出一款集心音采集、心音显示以及心音识别等功能的心音身份识别系统。在该系统中,首先对采集的待测心音信号进行数字化、预加重、分帧、加窗处理,然后提取出心音信号的梅尔倒谱系数特征参数,利用动态时间规整算法将其与数据库模板心音逐一进行模式匹配,并将拥有最小欧氏距离的数据库模板心音作为最终识别结果,最后展示出待测心音和数据库所有模板心音的共振峰特性对比图,定性地反映待测心音和数据库模板心音的差异,给用户直观的判断和感受,进一步认证识别的结果。系统界面简洁,操作方便,识别速度较快,实现了真机运行,并达到了预期效果。 相似文献
11.
12.
针对动态时间弯曲方法计算时间过长的问题,提出增量动态时间弯曲来度量较长时间序列之间的相似性。首先利用动态时间弯曲方法对历史时间序列数据进行相似性度量,得到相应的历史最优弯曲路径和路径中各元素的累积距离代价。其次,通过逆向弯曲度量方法完成当前序列数据 的相似性度量,结合历史数据信息找到与历史弯曲路径相交且度量时间序列距离为当前最小值的新路径,进而实现增量动态时间弯曲的相似性度量。该方法不仅具有良好的度量质量,还具有较高的时间效率。数值实验表明,对于大部分时间序列数据集,新方法的分类准确率和计算性能要优于经典动态时间弯曲。 相似文献
13.
对于股票联动性的研究,传统时间序列分析方法及目前数据挖
掘技术主要使用国内或者国外股票指数来研究市场、板块或行业之间的联动关系,并得到一
些较为宏观的结论,存在着缺少直接分析与挖掘个股数据之间的联动性的问题。鉴于此,本文提出一种基于动态时间弯曲的股票时间序列联动性研究方法。通过动态时间弯曲找出若干只形态相似的股票,并在此基础上获得相关的重要信息,再提出基于动态时间弯曲的k-means聚类方法实现股票聚类,进而得到具有相同波动趋势的股票簇。实验结果表
明,新方法能从大量股票中准确找到具有联动关系的个股,区分开不同波动趋势的股票簇,具有一定的优越性。 相似文献
14.
15.
16.
基于动态时间弯曲的时序数据聚类算法的研究 总被引:14,自引:0,他引:14
时间序列是一类重要的复杂类型数据,时间序列知识发现正成为知识发现的研究热点之一。欧几里的距离及其扩展作为相似测度被广泛应用于时间序列的比较中,但是这种距离测度对数据没有好的鲁棒性。动态时间弯曲技术是基于非线性动态编程的一种模式匹配算法。该文提出了基于动态时间弯曲技术的相似搜索算法,通过计算时序数据之间的最短弯曲路径来获得序列的匹配。对综合控制时序数据进行基于不同距离测度的聚类分析对比结果表明该文提出的算法有很高的精度和对振幅差异、噪声和线性漂移有强的鲁棒性,具有良好的应用价值。 相似文献
17.
现有的粒子滤波故障预报方法主要是通过粒子滤波算法得到对应时刻的预测值,然后比较预测序列与观测序列的距离来对故障进行预报,但这种基于相同长度时间序列的故障预报方法不能处理预测序列与观测序列长度不同的情况.本文借助适用于不同长度时间序列的动态时间弯曲技术,对故障相关的时间序列进行分析,从动态时间弯曲算法度量设备正常工作的时间序列与潜在故障引起的异常序列之间相似度的角度,设计了系统正常度及反常度来判别设备是否正常运行,进而对潜在故障进行预报.实验结果验证了该方法的可行性,并能及时准确地预报出系统故障. 相似文献
18.
19.
针对常用方法忽略变量相关性和局部形状特性问题,提出基于加权动态时间弯曲的多元时间序列相似性匹配方法(CPCA-SWDTW).首先,在原加权动态时间弯曲算法基础上,引入形态因子,提出基于形态特征的加权动态时间弯曲算法(SWDTW).然后,提取多元时间序列的主成分作为模式表示,消除变量间的相关性,同时将方差贡献率作为相应主成分的权重.在此基础上,运用SWDTW,度量多元时间序列间的相似度.最后,通过相似性搜索实验表明,CPCA-SWDTW具有较好的准确性和鲁棒性.敏感性分析说明CPCA-SWDTW在一定程度上受到权重函数参数的影响. 相似文献