共查询到17条相似文献,搜索用时 46 毫秒
1.
VQ+WNN(Vector Quantization and Wavelet Neural Network)说话人识别系统主要利用VQ进行矢量量化,将量化矢量送到小波神经网络进行说话人训练和识别。经过VQ量化后的特征矢量可以大大减少小波神经网络的运算量,提高网络的收敛速度与识别精度。虽然运算量是可以接受的,但如果在矢量量化之前采用分量处理方法,去除对识别精度影响不大的特征矢量,则可进一步减少运算量,而识别精度基本维持不变。 相似文献
2.
噪声环境下,为了提高说话人识别系统的鲁棒性,需要对系统进行各种抗噪声处理。采用梅尔频率倒谱系数作为语音的特征参数,矢量量化方法进行模式匹配,将改进的基于听觉掩蔽效应的语音增强器作为预处理器,对语音信号首先进行降噪处理。语音增强器实验结果表明,经过降噪处理后提高了输入信号的信噪比,减少了语音失真,同时很好地抑制了背景噪声和残余音乐噪声。将经过降噪处理的语音信号送入说话人识别系统,提高了系统的识别性能。 相似文献
3.
采用遗传算法的VQ码本设计及说话人识别 总被引:2,自引:0,他引:2
矢量量化(VQ)方法是文本无关说话人识别中广泛应用的建模方法之一。在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能。考虑到遗传算法(GA)是一种具有全局化寻优搜索能力的算法,本文提出了遗传算法和K均值算法相结合的综合分析方法GA-K进行码本设计,改善了码本的质量。讨论了具体的算法实现,分析了在不同的特征参数LPCC及MFCC、不同测试语音长度下的说话人识别性能。实验结果显示,GA-K方法优于传统的LBG算法,可以很好地协调收敛性和识别率之间的关系。 相似文献
4.
5.
6.
7.
8.
9.
说话人识别中语音特征参数的研究 总被引:2,自引:0,他引:2
一般的说话人识别系统包括特征提取和识别模型两部分,其中特征参数的选择对系统的识别性能有关键性的影响,现就特征提取展开研究,介绍了各种常用的语音特征参数及目前主流的两种参数的提取过程,并论述了小波分析应用于语音特征参数提取中的优势。 相似文献
10.
11.
作为一种感知周围环境十分有效的方法,环境声音识别(Environment Sound Recognition,ESR)被广泛地应用在机器人导航、移动机器人、音频检索、音频取证以及其它基于情景感知、可穿戴的应用中.目前,较为简单的分类器已经大规模应用在ESR问题中,但却不能很好地反映和识别环境声音,而深度神经网络作为一种高性能、多层的神经网络,为更好地描述原始数据特征和解决模式识别问题提供了更有效的途径.为此,本文将深度神经网络应用在环境声音识别问题中,并对音频特征进行特征融合,通过训练深度信念网络(Deep Belief Network,DBN)进行环境场景的识别.实验结果表明,基于特征融合的方法的识别性能相较于分别采用音频特征的方法识别在性能上有明显提升,且将深度学习应用在ESR问题中具有明显的优势. 相似文献
12.
13.
结合传统中医理论和现代信号处理技术以脉象信号的LPC系数、LPC倒谱系数和MEL频率倒谱参数作为识别的特征矢量,运用VQ模型对胃癌、肺癌、乳腺癌等病症患者的脉象信号进行建模以及识别的研究.此研究为病症脉象识别和辅助诊断疾病提供了一种有效的方法. 相似文献
14.
话者识别系统的时间鲁棒性是影响话者识别系统实用化的关键问题之一。为了提高系统的时间鲁棒性,本文提出了基于子带矢量量化及人工神经网络的话者模型。将语音文本的有效频段划分为几个子带,分别求取子带上的知闰量化码本,利用BP 工神经网络对训练数据在各个子带上的量化误差进行拟合,即可训练出话者模型(SBVQ码本及BPNN的权值矩阵 、确认阈值)该话者模型反映了不同频段对话者识别系统性能的不同影响,并可将时间 相似文献
15.
针对声纹识别算法中的矢量量化方法,给出一种新的初始码本选择策略:超球面极值选择法;对提出的新策略进行性能分析,证明该方法在矢量量化码本训练过程中收敛速度快,不存在振荡点与空胞腔问题,计算量小,易于实现;应用此策略实现了基于矢量量化的说话人识别系统,与传统选择策略的系统识别结果进行统计比较,结果表明由改进超球面极值选择法得到的说话人矢量量化码本,识别性能好,具有可应用价值。 相似文献
16.
17.
Speaker recognition: a tutorial 总被引:33,自引:0,他引:33
Campbell J.P. Jr. 《Proceedings of the IEEE. Institute of Electrical and Electronics Engineers》1997,85(9):1437-1462
A tutorial on the design and development of automatic speaker-recognition systems is presented. Automatic speaker recognition is the use of a machine to recognize a person from a spoken phrase. These systems can operate in two modes: to identify a particular person or to verify a person's claimed identity. Speech processing and the basic components of automatic speaker-recognition systems are shown and design tradeoffs are discussed. Then, a new automatic speaker-recognition system is given. This recognizer performs with 98.9% correct decalcification. Last, the performances of various systems are compared 相似文献