期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张庆芳赵鹤鸣《计算机工程与应用》2006,42(10):65-68

基于矢量量化的说话人识别,因其运算过程简单等特点,在文本无关的说话人识别领域有着广泛的应用。论文根据说话人识别中训练语音的特点并结合快速搜索算法,对矢量量化的码书形成算法进行了改进,提出了一种基于改进算法的与文本无关的说话人识别方法。经实验结果证明,论文的方法加快了码书的形成,减少了码书形成的计算量,改善了码本的性能,提高了说话人识别的识别率。相似文献

2.

语音识别中基于i-vector的说话人归一化研究

李亚琦黄浩《现代计算机》2014,(5):3-7

i-vector是反映说话人声学差异的一种重要特征,在目前的说话人识别和说话人验证中显示了有效性。将i-vector应用于语音识别中的说话人的声学特征归一化,对训练数据提取i-vector并利用LBG算法进行无监督聚类．然后对各类分别训练最大似然线性变换并使用说话人自适应训练来实现说话人的归一化。将变换后的特征用于训练和识别．实验表明该方法能够提高语音识别的性能。相似文献

3.

说话人识别中随机局部搜索算法的研究

下载免费PDF全文

蒋皓石杜谋辉林嘉宇《计算机工程与科学》2006,28(7):85-86

目前在矢量量化的码本训练中经典的聚类方法是LBG算法,但该算法的主要缺陷是对初始码书的依赖性较大,容易过早地陷入局部极小.本文在基于矢量量化的说话人识别中研究了一种随机局部搜索的聚类算法.该算法不依赖初始条件,结构规则,容易实现,效果好,具有很优越的全局优化搜索能力,在语音参数聚类实验中表现出了很好的性能,得到的码书质量也优于经典的LBG-算法,从而为在基于矢量量化的说话人识别中设计准全局最优码书提供了一种新思路. 相似文献

4.

基于独立分量分析和矢量量化的说话人识别

屈微刘贺平《计算机应用》2005,25(10):2401-2403

使用独立分量分析（ICA）来提取说话人特征并与矢量量化（VQ）判决方法相结合,实现了一个高性能的基于ICA特征的VQ （ICA VQ）说话人识别系统。通过ICA变换得到说话人语音特征基函数系数用于生成VQ码书,并导出包含能量失真的ICA VQ码书失真测度和质心确定条件,生成最终的判决。仿真实验中ICA提取的特征分别用于不同系统实现说话人确认任务,各系统的DET曲线对比验证了VQ方法用于ICA特征分类判决的优势,同时不同码书尺寸下的等差率（EER）对比证明了VQ码书设计的有效性。相似文献

5.

说话人识别中基于聚类特征的矢量量化技术

徐利敏唐振民何可可钱博《计算机工程与应用》2007,43(27):196-198

为解决采用矢量量化的方法进行说话人识别时出现的失真问题,根据汉语语音的发音特性,提出了将矢量量化与语音特征的聚类技术相结合的方法,在进行矢量量化码书训练之前,先对特征矢量进行聚类筛选。实验结果表明,当测试语音片段长度为4 s时,在保持95％左右识别率下,采用普通矢量量化方法需64码本数,而采用该文方法只需8码本数,降低了8倍。结果说明该方法不但在一定程度上解决了因训练样本不足而引起的失真问题,而且通过方法的改进,实现了采用较低码字数产生较好的识别结果,从而提高识别效率。相似文献

6.

一种基于K-SVD的说话人识别方法

马振张雄伟杨吉斌《计算机工程与应用》2012,48(34):112-115,135

为了充分提取语音中的个人特征信息,类比矢量量化,提出了一种基于K-均值奇异值分解(K-SVD)的说话人识别方法。利用K-SVD训练得到的字典可较好地保存语音信号中的个人特征信息。利用这一特性,通过K-SVD从训练数据中提取包含说话人个人特征信息的字典,利用该字典实现说话人识别。相对于传统方法,该方法能够更好地利用语音的稀疏性保存语音中的个人特征信息并减小重构误差。实验仿真结果表明,与基于矢量量化的说话人识别方法相比,该方法在多说话人的情况下具有更好的识别率,具有更高的实用价值。相似文献

7.

基于双约简的GMM说话人辨识

LIU Xue-yan YUAN Bao-ling ZHANG Na 《数字社区&智能家居》2008,(36)

如何能够快速准确的实现说话人识别是说话人识别研究的一个重要环节。提出双约简GMM的说话人确认方法,对语音参数进行核K-均值聚类,提取聚类中心的语音特征矢量作为训练数据,并对其进行fisher比约简,提取具有区分力强的维数。实验表明该文提取方法可以减少训练时间,并提高系统的鲁棒性。相似文献

8.

基于概率统计直方图的压缩域说话人识别

屈丹闫红刚唐晖王炳锡《数据采集与处理》2009,24(5)

压缩域说话人识别算法(Compressed-domain automatic speaker recognition,CD-ASR)即从压缩语音数据中直接提取压缩参数进行说话人识别,无需参数译码和波形合成.本文提出了基于概率统计直方图的VoIP压缩域说话人识别算法,包括矢量量化统计直方图和高斯混合模型统计直方图两种方法.在给出了G.729,G.723.1(6.3 kb/s),G.723.1(5.3 kb/s)压缩码流的压缩域特征提取方案后,分别以矢量量化统计直方图和高斯混合模型统计直方图作为识别模型进行说话人识别.实验结果表明,概率统计直方图法比在压缩码漉中提取同样识别参数的GMM模型,识别率有很大提高. 相似文献

9.

基于改进PSCO-SVM的多生物特征融合技术的研究

骆瑞玲陈敏《计算机光盘软件与应用》2013,(18):59-61

为了解决单通道生物特征识别的缺陷,在信息融合的基础上提出了一种基于人脸和语音融合的生物特征识别模型,实现了特征层的融合。对人脸图像采用主成分分析法(PCA)进行特征提取,对说话人采用fisher判别进行特征维数的约简。同时,提出一种基于PSO的多粒子群协调优化(PSCO)方法,并将其用于训练SVM来实现人脸和语音的混合认证系统,实验结果表明该方法取得了较好的识别效果。相似文献

10.

基于段级特征的对话环境下说话人分段算法

王波徐毅琼李弼程《计算机工程与设计》2007,28(10):2401-2402,2416

提出了一种使用段级语音特征对测试进行说话人分段从而实现对话环境下说话人分段算法,算法实现中基于车比雪夫和不等式提出了基于协方差模型的段级特征的距离测度描述.该识别方法根据实验选择了合适的段级特征语音段长度,实验结果表明基于段级特征的说话人识别方法在有效地在对话环境下将多人的语音进行分段,从而提高了说话人识别系统的精度和识别速度. 相似文献

11.

基于方差归一化失真测度的改进的LBG算法 总被引：3，自引：1，他引：2

方绍武戴蓓倩陆伟《计算机工程与应用》2000,36(2):27-29,39

矢量量化（ＶＱ）技术在话者识别系统中得到了广泛的应用。ＶＱ码本的产生通常采用ＬＢＧ算法,失真测度则为对矢量的各分量等权重的欧氏距离。在话者识别系统中特征矢量的各个分量的分布是有差别的,且对于不同的话者,这种差别的程度又是不一样的。由于不同分布的各维参数对话者识别的有效性各不相同,因此,文章提出了一种能反映这种有效性差别的失真测度,即：方差归一化失真测度。以该失真测度为基础,并结合时序相关的初始码本设计方法及有效的零胞腔处理技术,文章提出了改进的ＬＢＧ算法,同时利用该算法训练出改进的ＶＱ话者模型,并进行了话者识别实验。相似文献

12.

说话人自适应训练方法在连续语音识别中的应用

罗骏欧智坚王作英《中文信息学报》2004,18(3):62-66

自适应技术在近年来得到越来越多的重视,其中应用广泛的包括MAP、MLLR,该技术利用少量特定人数据就可以调整码本,快速地提升识别性能,它要求原始的码本有很好的说话人无关性。本文介绍了结合MLLR自适应的说话人自适应训练(Speaker Adaptive Training,以下简称SAT)算法,这种方法将每个说话人码本视为说话人无关码本经过线性变换的结果,在此基础上训练的说话人无关码本更有效剔除了说话人相关信息,因此在说话人自适应中时能根据特定数据调整更好地逼近说话人特性,从而有更好的性能表现。相似文献

13.

模糊聚类在自适应矢量量化码本训练中的应用

张俐李晶皎顾树生《计算机研究与发展》2000,37(6):710-713

自适应矢量量化在语音处理中有广泛的应用,提出了一种基于ＳＦＣＭ算法的自适应矢量量化码本的训练方法,其特点是通过模糊聚类方法,重新调整训练样本与码字之间的隶属度,达到最小编码失真,使码本更适合新说话人,且计算简单,方法的实验结果表明,可以使编码平均失真下降。相似文献

14.

基于非参数直方图模型的鲁棒说话人识别算法

李燕萍唐振民丁辉张燕《数据采集与处理》2010,25(1)

建立一种非参数模型来刻画说话人的特征分布,并采用地面移动距离来度量分布之间的相似性.该方法能有效地利用有限的数据表达说话人的身份信息,直接计算特征分布与测试语音分布之间的距离,与传统的矢量量化和高斯混合模型相比,不需要通过对所有语音帧计算总平均失真误差和最小相似度,计算简单,主要能够降低系统对数据量的依赖性.并且通过自适应直方图均衡化方法对原始语音特征进行修正,使得噪声环境下获得的语音特征经过修正后更符合真实分布,增强了特征的抗噪性.实验表明,本文提出的方法在噪声环境下的短语音说话人识别系统中表现出较强的优势. 相似文献

15.

VQ话者模型中失真测度的鲁棒性研究

方绍武戴蓓倩《数据采集与处理》2000,15(2):157-161

文中研究表明,反映说话人特征信息的特征参数矢量的各个分量通常具有不同的分布,对正确识别说话人身份的有效性是有差别的。文中将这种有效性差别作为权重矢量反映到失真测度计算公式中,提出了一种新的失真测度,即方差归一化失真测度可有效提高话者识别系统的识别性能。进一步的实验还表明,该失真测度能提高话者识别系统的时间鲁棒性。文中同时还给出了适合于话者识别的参数归正方法：帧内幅度归正。相似文献

16.

基于话者特征图案的BPNN话者模型 总被引：1，自引：0，他引：1

方绍武戴蓓倩《计算机学报》2002,25(5):556-560

该文提出了一种用于说话人识别的基于话者特征图案的BPNN话者模型，该话者模型解决了语音信号的时长变化与神经网络输入层结点数固定不变之间的矛盾。利用VQ技术对所有话者的语音样本训练出话者特征图案，再将语音样本对该特征图案进行映射，在映射域解决了语音样本的时间规正问题。同时，该方法还提高了映射域参数的模式分类能力。相似文献

17.

两级特征联合学习的情感说话人识别

下载免费PDF全文

刘金琳李冬冬王喆蔡立志《计算机工程与应用》2023,59(1):149-155

针对说话人识别的性能易受到情感因素影响的问题,提出利用片段级别特征和帧级别特征联合学习的方法。利用长短时记忆网络进行说话人识别任务,提取时序输出作为片段级别的情感说话人特征,保留了语音帧特征原本信息的同时加强了情感信息的表达,再利用全连接网络进一步学习片段级别特征中每一个特征帧的说话人信息来增强帧级别特征的说话人信息表示能力,最后拼接片段级别特征和帧级别特征得到最终的说话人特征以增强特征的表征能力。在普通话情感语音语料库（MASC）上进行实验,验证所提出方法有效性的同时,探究了片段级别特征中包含语音帧数量和不同情感状态对情感说话人识别的影响。相似文献