期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

ZHANG Peng 王成儒《无线电通信技术》2008,34(4)

VQ+WNN(Vector Quantization and Wavelet Neural Network)说话人识别系统主要利用VQ进行矢量量化,将量化矢量送到小波神经网络进行说话人训练和识别。经过VQ量化后的特征矢量可以大大减少小波神经网络的运算量,提高网络的收敛速度与识别精度。虽然运算量是可以接受的,但如果在矢量量化之前采用分量处理方法,去除对识别精度影响不大的特征矢量,则可进一步减少运算量,而识别精度基本维持不变。相似文献

2.

噪声环境中基于VQ说话人识别

张飞云王红艳《现代电子技术》2009,32(22):119-122

噪声环境下,为了提高说话人识别系统的鲁棒性,需要对系统进行各种抗噪声处理。采用梅尔频率倒谱系数作为语音的特征参数,矢量量化方法进行模式匹配,将改进的基于听觉掩蔽效应的语音增强器作为预处理器,对语音信号首先进行降噪处理。语音增强器实验结果表明,经过降噪处理后提高了输入信号的信噪比,减少了语音失真,同时很好地抑制了背景噪声和残余音乐噪声。将经过降噪处理的语音信号送入说话人识别系统,提高了系统的识别性能。相似文献

3.

采用遗传算法的VQ码本设计及说话人识别 总被引：2，自引：0，他引：2

芮贤义俞一彪《信号处理》2005,21(3):289-292

矢量量化(VQ)方法是文本无关说话人识别中广泛应用的建模方法之一。在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能。考虑到遗传算法(GA)是一种具有全局化寻优搜索能力的算法,本文提出了遗传算法和K均值算法相结合的综合分析方法GA-K进行码本设计,改善了码本的质量。讨论了具体的算法实现,分析了在不同的特征参数LPCC及MFCC、不同测试语音长度下的说话人识别性能。实验结果显示,GA-K方法优于传统的LBG算法,可以很好地协调收敛性和识别率之间的关系。相似文献

4.

基于MVQM的说话人识别的研究

谢建平成新民赵力《电声技术》2006,(2):41-43

提出了一种新的说话人识别方法。该方法综合了VQ和GMM的优点,通过用VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果证明了该方法的有效性。相似文献

5.

说话人识别技术探讨

高会贤郑晓势赵彦玲《电声技术》2008,32(1):52-55

介绍了说话人识别技术的基本概念和发展历史,列举并比较了几种常用的特征提取和模式匹配方法,总结了当前存在的问题并对其发展进行了展望. 相似文献

6.

基于VQ的与文本无关的说话人确认系统

陈明义周昆湘曾理文《信息技术》2007,31(3):97-98,127

通过介绍说话人确认系统，采用能够反映人对语音的感知特性的Mel频率倒谱系数（MFCC）作为特征参数，同时提出了用训练得到的码本以及平均失真作为表征说话人的模型，对说话人确认系统中距离测度做出了相应的改动。实验结果表明系统具有较好的性能。相似文献

7.

说话人识别的几种方法 总被引：5，自引：1，他引：4

宁飞陈频《电声技术》2001,(12):9-14

以说话人识别的几个关键问题为纲,说明了国内外现有的识别方法和结果,以及存在的问题和难点,并提出了一些新想法。相似文献

8.

说话人识别综述 总被引：2，自引：0，他引：2

杨迪戚银城刘明军张华芳子武军娜《电子科技》2012,25(6):162-165

在分析说话人识别原理和方法的基础上,对近年来说话人识别技术的发展进行了综述。分析了当前说话人识别技术中使用的多种特征和模式识别方法,并对其今后的研究前景和发展方向进行了展望。相似文献

9.

说话人识别中语音特征参数的研究 总被引：2，自引：0，他引：2

陈杰张玲华《信息技术》2006,30(11):88-90

一般的说话人识别系统包括特征提取和识别模型两部分，其中特征参数的选择对系统的识别性能有关键性的影响，现就特征提取展开研究，介绍了各种常用的语音特征参数及目前主流的两种参数的提取过程，并论述了小波分析应用于语音特征参数提取中的优势。相似文献

10.

基于VQ的说话人自动识别系统的实现

桂苹吴镇扬赵力王维新《电声技术》2003,(10):11-14

文中以语音信号的LPC倒谱系数、△倒谱系数、基音周期和△基音周期的混合特征参数作为识别说话人的特征，运用VQ技术实现了说话人自动识别。在10个说话人，1800个汉语数字和单词语音的语音库上进行了系统的识别实验，其中单音节语音的平均识别率达到了92％，双音节语音达到了96．67％，四音节语音达到了97．67％。相似文献

11.

基于深度学习的环境声音识别

郑铁然史秋莹《智能计算机与应用》2018,(5):34-37,41

作为一种感知周围环境十分有效的方法,环境声音识别(Environment Sound Recognition,ESR)被广泛地应用在机器人导航、移动机器人、音频检索、音频取证以及其它基于情景感知、可穿戴的应用中.目前,较为简单的分类器已经大规模应用在ESR问题中,但却不能很好地反映和识别环境声音,而深度神经网络作为一种高性能、多层的神经网络,为更好地描述原始数据特征和解决模式识别问题提供了更有效的途径.为此,本文将深度神经网络应用在环境声音识别问题中,并对音频特征进行特征融合,通过训练深度信念网络(Deep Belief Network,DBN)进行环境场景的识别.实验结果表明,基于特征融合的方法的识别性能相较于分别采用音频特征的方法识别在性能上有明显提升,且将深度学习应用在ESR问题中具有明显的优势. 相似文献

12.

模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别 总被引：4，自引：0，他引：4

吴晓娟韩先花聂开宝《电子与信息学报》2002,24(6):845-849

该文提出了一种将模糊C-均值聚类法与矢量量化法相结合进行说话人识别的方法。该算法将从语音信号中提取的 12阶 LPC(线性预测编码)倒谱系数作为待分类样本的 12个指标,先用矢量量化法求出每个说话人表征特征参数的码书,作为模糊聚类算法的聚类中心,最后将待识别的特征矢量以得到的码书为聚类中心,进行聚类识别。该算法所使用的特征参数较少,计算比较简单,但识别率较矢量量化法高。相似文献

13.

基于VQ的病症脉象识别系统的实现

彭涛俞一彪《信息技术》2008,32(1):80-82

结合传统中医理论和现代信号处理技术以脉象信号的LPC系数、LPC倒谱系数和MEL频率倒谱参数作为识别的特征矢量,运用VQ模型对胃癌、肺癌、乳腺癌等病症患者的脉象信号进行建模以及识别的研究.此研究为病症脉象识别和辅助诊断疾病提供了一种有效的方法. 相似文献

14.

基于子带VQ及ANN的话者确认系统的设计

方绍武戴蓓倩《电路与系统学报》1999,4(4):24-29

话者识别系统的时间鲁棒性是影响话者识别系统实用化的关键问题之一。为了提高系统的时间鲁棒性,本文提出了基于子带矢量量化及人工神经网络的话者模型。将语音文本的有效频段划分为几个子带,分别求取子带上的知闰量化码本,利用ＢＰ工神经网络对训练数据在各个子带上的量化误差进行拟合,即可训练出话者模型（ＳＢＶＱ码本及ＢＰＮＮ的权值矩阵、确认阈值）该话者模型反映了不同频段对话者识别系统性能的不同影响,并可将时间相似文献

15.

声纹识别的应用与矢量量化算法研究

石柱《电声技术》2006,(10):44-48

针对声纹识别算法中的矢量量化方法,给出一种新的初始码本选择策略:超球面极值选择法;对提出的新策略进行性能分析,证明该方法在矢量量化码本训练过程中收敛速度快,不存在振荡点与空胞腔问题,计算量小,易于实现;应用此策略实现了基于矢量量化的说话人识别系统,与传统选择策略的系统识别结果进行统计比较,结果表明由改进超球面极值选择法得到的说话人矢量量化码本,识别性能好,具有可应用价值。相似文献

16.

说话人辨认系统中码本生成的新算法

张玲华石操张子菁杨震郑宝玉《信号处理》2004,20(4):391-394

提出了一种新的适用于离散HMM说话人辨认系统的VQ码本训练方法,码本的训练准则是使码本中各码字的利用率趋于均等.将新方法训练的码本与用LBG算法训练的码本进行了比较,实验表明,在基于离散HMM的说话人辨认系统中,用新方法训练的码本性能优于用LBG算法训练的码本,特别是在与文本无关的情况下,使系统的正确辨认率显著提高. 相似文献

17.

Speaker recognition: a tutorial 总被引：33，自引：0，他引：33

Campbell J.P. Jr. 《Proceedings of the IEEE. Institute of Electrical and Electronics Engineers》1997,85(9):1437-1462

A tutorial on the design and development of automatic speaker-recognition systems is presented. Automatic speaker recognition is the use of a machine to recognize a person from a spoken phrase. These systems can operate in two modes: to identify a particular person or to verify a person's claimed identity. Speech processing and the basic components of automatic speaker-recognition systems are shown and design tradeoffs are discussed. Then, a new automatic speaker-recognition system is given. This recognizer performs with 98.9% correct decalcification. Last, the performances of various systems are compared 相似文献