首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 718 毫秒
1.
阎福智 《中国新通信》2013,(21):127-128
语音特征提取的常用方法有LPCC、MFCC、PLP等,这些方法都是基于语音信号短时平稳的特性。利用二次特征提取可以通过对原始特征实施加权、微分、组合、筛选进一步提高识别率。本文介绍了语音识别和说话人识别中特征提取的常用方法以及最新发展,最后介绍了Hilbert- Huang这一新兴理论成果以及在特征提取中的应用。  相似文献   

2.
说话人识别中语音特征参数的研究   总被引:2,自引:0,他引:2  
陈杰  张玲华 《信息技术》2006,30(11):88-90
一般的说话人识别系统包括特征提取和识别模型两部分,其中特征参数的选择对系统的识别性能有关键性的影响,现就特征提取展开研究,介绍了各种常用的语音特征参数及目前主流的两种参数的提取过程,并论述了小波分析应用于语音特征参数提取中的优势。  相似文献   

3.
说话人识别系统研究   总被引:1,自引:0,他引:1  
张东阳  张国杰 《通信技术》2007,40(11):356-358
说话人识别是指通过说话人的语音来自动识别出说话人的身份.这种识别系统在许多领域内有着良好的应用前景.文中回顾了说话人识别技术的发展历史,阐述了说话人识别技术的基本原理以及与语音识别技术的区别,介绍了识别技术的几种分类.文中重点介绍了说话人识别的相关技术:特征提取和模式匹配.描述了特征提取和模式匹配各自的任务和特点,强调了它们在说话认识别系统中的关键性作用.  相似文献   

4.
介绍说话人识别技术发展情况,阐述包括特征提取、识别算法和区分算法在内的文本无关说话人识别系统的整体技术框架和基本工作原理针对文本无关说话人识别相关技术给出了近几年主要发展的高斯超向量—支持向量机模型(GSV-SVM)、联合因子分析模型(JFA)和鉴别性向量(i-vector)模型,并对3种模型进行了分析比较:指出GSV-SVM模型可以提高识别系统性能;JFA模型能提高系统性能但计算量过大,难以实现应用;i-vector模型降低了计算量,并能提高识别精确度和效率,是目前的研究热点。最后指出当前文本无关说话人识别的研究难点和热点。  相似文献   

5.
王书诏  邱天爽 《电声技术》2007,31(1):51-55,65
说话人识别是语音信号处理中的重要组成部分,是当前的研究热点之一。详细介绍了说话人识别的基本原理,从特征提取、模型训练和分类等几个方面就近年的主要研究情况进行综述和评价,并在此基础上探讨了研究难点和发展前景。  相似文献   

6.
基于小波变换的鲁棒型特征提取及说话人识别   总被引:4,自引:0,他引:4  
说话人识别系统在实际应用中面临的主要困难之一是鲁棒性问题,干净语音环境下识别率很高的说话人识别系统,在有噪语音环境下识别性能显著降低。解决这一问题的方法之一是寻找具有鲁棒性的特征参数。本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的鲁棒型特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在加性高斯白噪声环境下进行的识别实验结果表明,本文提出的特征提取算法可以有效地提高说话人识别系统在噪声环境下的识别性能。  相似文献   

7.
噪声环境下说话人识别的组合特征提取方法   总被引:1,自引:0,他引:1  
芮贤义  俞一彪 《信号处理》2006,22(5):673-677
针对在干净语音环境下识别率很高的说话人识别系统,在噪声环境下识别率显著降低的缺点,本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的组合特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在噪声环境下进行的识别实验结果表明,本文提出的组合特征提取算法可以在噪声环境下有效地提高说话人识别系统的识别性能。  相似文献   

8.
介绍了说话人识别技术的基本概念和发展历史,列举并比较了几种常用的特征提取和模式匹配方法,总结了当前存在的问题并对其发展进行了展望.  相似文献   

9.
将主分量分析(PCA)方法结合到说话人识别的特征提取中,去除MFCC特征各维分量之间的相关性和冗余信患,达到去相关、降维、降噪的目的,节省后续阶段的计算开销.研究了2种PCA与说话入识别结合的方法,取得了较好的效果.  相似文献   

10.
檀蕊莲 《信息技术》2010,34(8):103-104
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。通过说话人识别相关技术的研究,提出并设计了一个基于VQ的说话人识别系统,实验证明,当用于训练的数据量较小时,可以得到比较稳定的识别性能。  相似文献   

11.
针对传统语音信号识别过程中出现的识别率较低或者是计算时间复杂度高的问题,提出了基于希尔伯特黄变换(HHT)的快速声频传感器车辆识别方法.该方法将HHT算法和语音信号特征提取中常用的梅尔倒谱系数(MFCC)相结合,形成一种新的特征提取方法.实验中,将这种方法分别与K-近邻算法(K-NN)、支持向量机算法(SVM)和稀疏表示分类算法(SRC)配合进行语音信号识别,结果表明,该特征提取方法与K-NN分类算法配合,在识别率和算法运行效率方面具有明显的优势.  相似文献   

12.
传统光学字符识别(Optical Character Recognition,OCR)方法一般只提取图像亮度特征,在图像退化较严重时识别准确率不高。针对这一问题,提出一种新的扫描字符特征提取方法。除各通道亮度外,还提取像素位置、亮度的一阶导、二阶导等特征构成特征图像,并根据各个特征对图像的贡献程度进行加权处理。计算以当前像素为中心的局部区域特征图像块的协方差矩阵作为当前像素的描述子,然后在黎曼空间对字符实施分类。实验结果表明,采用典型的结构化分类器时,该特征提取方法对字符识别的准确率高于传统方法,表现出较强的鲁棒性。  相似文献   

13.
基于视频的监控系统存在很多不足,声学场景识别系统依据基于人耳听觉仿生的目标声音识别技术,积极探索先进的人耳仿生理论、特征提取技术、目标声音分类技术,实现对声音场景进行自动化分类和信息抽取,具有广泛的应用前景。  相似文献   

14.
霍君 《电子质量》2014,(3):78-85
由于虹膜自身具备独特性和随机性,因此需要对其进行特征提取操作,找出具有识别意义的虹膜纹理信息并将其编码,然后依据特定的判决标准来判断两幅图像是否源于同一人,从而实现虹膜识别的功能。该文对传统LBP算子进行改进,极大程度上缩减了描述码维数,并结合位移差分图像匹配方法,得到一种快速、有效的特征方法。通过对CASIA虹膜数据库进行实验比较,该方法能够获得理想的识别效果。  相似文献   

15.
针对源说话人与目标说话人之间声学差异过大影响语音转换效果的问题,提出一种基于声道归一化调整的语音转换方法。该方法通过STRAIGHT分析-合成模型提取说话人的个性化特征参数。在频谱训练阶段,对已提取的Mel频率倒谱系数利用声道归一化和高斯混合模型的方法进行训练映射。主观听音测试证明,该方法的转换效果优于传统的不使用声道归一化的高斯混合模型。  相似文献   

16.
对LPC(线性预测系数)参数及其派生参数进行了研究,重点讨论了各参数的计算方法,在此基础上提出了一种由LPC参数和语音帧能量构成的组合参数。利用GMM对20个说话人进行了闭集文本无关说话人识别实验。结果表明,与LPC参数的派生参数相比,该组合参数可以以较少的运算量取得与LPC派生参数相当的识别效果;与直接使用LPC参数相比,该组合参数能够在运算量增加不明显的情况下改进系统的性能,特别是在测试音长度较短的情况下,对性能的改进尤为明显。  相似文献   

17.
针对监控视频中运动目标实时特征提取的需求,在目标检测与特征提取串行算法的基础上,提出了基于OpenMP和多核CPU平台的三层并行优化算法。首先,在算法顶层,将串行算法抽象为两个模块组成的流水线,提出了流水线并行优化算法和相应的缓存管理策略;接着,在算法中层,考虑到特征提取模块中各子模块的功能独立性,设计了功能划分并行优化算法;最后,在算法底层,利用纹理特征提取模块的数据独立性,提出了数据划分并行优化算法。实验结果表明,该三层双模块并行优化算法在四核CPU平台上获得了接近Amdahl极限的加速比,基本实现了实际监控视频中运动目标检测与特征提取的实时处理。该多层次多模块并行优化方法普遍适用于串行算法在多核平台上进行并行优化的分析。  相似文献   

18.
In this study, we propose a new deep learning architecture named Multi-Level Dense Network (MLDNet) for multi-focus image fusion (MFIF). We introduce shallow and dense feature extraction in our feature extraction module to extract images features in a more robust way. In particular, we extracted the features from a mixture of many distributions from prior to the complex distribution through densely connected convolutional layers, then the extracted features are fused to form dense local feature maps. We added global feature fusion into the proposed architecture in order to merge the dense local feature maps of each source image into a fused image representation for the reconstruction of the final fused image. Our proposed MLDNet learns feature extraction, feature fusion and reconstruction within the same network to provide an end-to-end solution for MFIF. Experimental results demonstrate that our proposed method achieved significant performance against different state-of-the-art MFIF methods.  相似文献   

19.
基于轮廓波的纹理图像特征提取方法   总被引:1,自引:0,他引:1  
赵一凡  夏良正  潘泓 《信号处理》2010,26(2):161-165
文利用轮廓波分解的方向性和能量变化特性,提出了一种适用于纹理图像的特征提取方法。该方法首先通过方向可控滤波器(Steerable Filter)获得纹理图像的角度信息,然后进行轮廓波分解提取纹理在不同分解方向上的特征向量,最后将纹理的角度和方向分解的能量信息一起作为纹理的特征。由于轮廓波的方向和分解层次数目可以灵活地调节,因此特征值数量也是调节的,以达到最好的识别分类效果。本文利用简单的距离分类器对所提出的算法进行了验证,以Brodatz纹理库中的旋转纹理图像为标准,纹理分类的结果达到了满意的效果。   相似文献   

20.
We propose an input variable selection method based on discriminant features. By analyzing the relationship between the input space and feature space obtained by discriminant analysis, the input variables that contain a large amount of discriminative information are selected, while input variables with less discriminative information are discarded. By this, the signal to noise ratio of the data can be improved. The proposed method can be applied not only to the feature extraction methods based on covariance matrix but also to the methods based on image covariance matrix. The experimental results obtained with various data sets show that the proposed method results in improved classification performance regardless of the dimension and type of data.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号