共查询到20条相似文献,搜索用时 718 毫秒
1.
语音特征提取的常用方法有LPCC、MFCC、PLP等,这些方法都是基于语音信号短时平稳的特性。利用二次特征提取可以通过对原始特征实施加权、微分、组合、筛选进一步提高识别率。本文介绍了语音识别和说话人识别中特征提取的常用方法以及最新发展,最后介绍了Hilbert- Huang这一新兴理论成果以及在特征提取中的应用。 相似文献
2.
说话人识别中语音特征参数的研究 总被引:2,自引:0,他引:2
一般的说话人识别系统包括特征提取和识别模型两部分,其中特征参数的选择对系统的识别性能有关键性的影响,现就特征提取展开研究,介绍了各种常用的语音特征参数及目前主流的两种参数的提取过程,并论述了小波分析应用于语音特征参数提取中的优势。 相似文献
3.
4.
介绍说话人识别技术发展情况,阐述包括特征提取、识别算法和区分算法在内的文本无关说话人识别系统的整体技术框架和基本工作原理针对文本无关说话人识别相关技术给出了近几年主要发展的高斯超向量—支持向量机模型(GSV-SVM)、联合因子分析模型(JFA)和鉴别性向量(i-vector)模型,并对3种模型进行了分析比较:指出GSV-SVM模型可以提高识别系统性能;JFA模型能提高系统性能但计算量过大,难以实现应用;i-vector模型降低了计算量,并能提高识别精确度和效率,是目前的研究热点。最后指出当前文本无关说话人识别的研究难点和热点。 相似文献
5.
6.
基于小波变换的鲁棒型特征提取及说话人识别 总被引:4,自引:0,他引:4
说话人识别系统在实际应用中面临的主要困难之一是鲁棒性问题,干净语音环境下识别率很高的说话人识别系统,在有噪语音环境下识别性能显著降低。解决这一问题的方法之一是寻找具有鲁棒性的特征参数。本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的鲁棒型特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在加性高斯白噪声环境下进行的识别实验结果表明,本文提出的特征提取算法可以有效地提高说话人识别系统在噪声环境下的识别性能。 相似文献
7.
噪声环境下说话人识别的组合特征提取方法 总被引:1,自引:0,他引:1
针对在干净语音环境下识别率很高的说话人识别系统,在噪声环境下识别率显著降低的缺点,本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的组合特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在噪声环境下进行的识别实验结果表明,本文提出的组合特征提取算法可以在噪声环境下有效地提高说话人识别系统的识别性能。 相似文献
8.
9.
将主分量分析(PCA)方法结合到说话人识别的特征提取中,去除MFCC特征各维分量之间的相关性和冗余信患,达到去相关、降维、降噪的目的,节省后续阶段的计算开销.研究了2种PCA与说话入识别结合的方法,取得了较好的效果. 相似文献
10.
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。通过说话人识别相关技术的研究,提出并设计了一个基于VQ的说话人识别系统,实验证明,当用于训练的数据量较小时,可以得到比较稳定的识别性能。 相似文献
11.
12.
姬敬 《智能计算机与应用》2012,(2):24-26,29
传统光学字符识别(Optical Character Recognition,OCR)方法一般只提取图像亮度特征,在图像退化较严重时识别准确率不高。针对这一问题,提出一种新的扫描字符特征提取方法。除各通道亮度外,还提取像素位置、亮度的一阶导、二阶导等特征构成特征图像,并根据各个特征对图像的贡献程度进行加权处理。计算以当前像素为中心的局部区域特征图像块的协方差矩阵作为当前像素的描述子,然后在黎曼空间对字符实施分类。实验结果表明,采用典型的结构化分类器时,该特征提取方法对字符识别的准确率高于传统方法,表现出较强的鲁棒性。 相似文献
13.
14.
由于虹膜自身具备独特性和随机性,因此需要对其进行特征提取操作,找出具有识别意义的虹膜纹理信息并将其编码,然后依据特定的判决标准来判断两幅图像是否源于同一人,从而实现虹膜识别的功能。该文对传统LBP算子进行改进,极大程度上缩减了描述码维数,并结合位移差分图像匹配方法,得到一种快速、有效的特征方法。通过对CASIA虹膜数据库进行实验比较,该方法能够获得理想的识别效果。 相似文献
15.
针对源说话人与目标说话人之间声学差异过大影响语音转换效果的问题,提出一种基于声道归一化调整的语音转换方法。该方法通过STRAIGHT分析-合成模型提取说话人的个性化特征参数。在频谱训练阶段,对已提取的Mel频率倒谱系数利用声道归一化和高斯混合模型的方法进行训练映射。主观听音测试证明,该方法的转换效果优于传统的不使用声道归一化的高斯混合模型。 相似文献
16.
基于LPC分析的语音特征参数研究及其在说话人识别中的应用 总被引:3,自引:0,他引:3
对LPC(线性预测系数)参数及其派生参数进行了研究,重点讨论了各参数的计算方法,在此基础上提出了一种由LPC参数和语音帧能量构成的组合参数。利用GMM对20个说话人进行了闭集文本无关说话人识别实验。结果表明,与LPC参数的派生参数相比,该组合参数可以以较少的运算量取得与LPC派生参数相当的识别效果;与直接使用LPC参数相比,该组合参数能够在运算量增加不明显的情况下改进系统的性能,特别是在测试音长度较短的情况下,对性能的改进尤为明显。 相似文献
17.
针对监控视频中运动目标实时特征提取的需求,在目标检测与特征提取串行算法的基础上,提出了基于OpenMP和多核CPU平台的三层并行优化算法。首先,在算法顶层,将串行算法抽象为两个模块组成的流水线,提出了流水线并行优化算法和相应的缓存管理策略;接着,在算法中层,考虑到特征提取模块中各子模块的功能独立性,设计了功能划分并行优化算法;最后,在算法底层,利用纹理特征提取模块的数据独立性,提出了数据划分并行优化算法。实验结果表明,该三层双模块并行优化算法在四核CPU平台上获得了接近Amdahl极限的加速比,基本实现了实际监控视频中运动目标检测与特征提取的实时处理。该多层次多模块并行优化方法普遍适用于串行算法在多核平台上进行并行优化的分析。 相似文献
18.
In this study, we propose a new deep learning architecture named Multi-Level Dense Network (MLDNet) for multi-focus image fusion (MFIF). We introduce shallow and dense feature extraction in our feature extraction module to extract images features in a more robust way. In particular, we extracted the features from a mixture of many distributions from prior to the complex distribution through densely connected convolutional layers, then the extracted features are fused to form dense local feature maps. We added global feature fusion into the proposed architecture in order to merge the dense local feature maps of each source image into a fused image representation for the reconstruction of the final fused image. Our proposed MLDNet learns feature extraction, feature fusion and reconstruction within the same network to provide an end-to-end solution for MFIF. Experimental results demonstrate that our proposed method achieved significant performance against different state-of-the-art MFIF methods. 相似文献
19.
基于轮廓波的纹理图像特征提取方法 总被引:1,自引:0,他引:1
文利用轮廓波分解的方向性和能量变化特性,提出了一种适用于纹理图像的特征提取方法。该方法首先通过方向可控滤波器(Steerable Filter)获得纹理图像的角度信息,然后进行轮廓波分解提取纹理在不同分解方向上的特征向量,最后将纹理的角度和方向分解的能量信息一起作为纹理的特征。由于轮廓波的方向和分解层次数目可以灵活地调节,因此特征值数量也是调节的,以达到最好的识别分类效果。本文利用简单的距离分类器对所提出的算法进行了验证,以Brodatz纹理库中的旋转纹理图像为标准,纹理分类的结果达到了满意的效果。 相似文献
20.
We propose an input variable selection method based on discriminant features. By analyzing the relationship between the input space and feature space obtained by discriminant analysis, the input variables that contain a large amount of discriminative information are selected, while input variables with less discriminative information are discarded. By this, the signal to noise ratio of the data can be improved. The proposed method can be applied not only to the feature extraction methods based on covariance matrix but also to the methods based on image covariance matrix. The experimental results obtained with various data sets show that the proposed method results in improved classification performance regardless of the dimension and type of data. 相似文献