期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张一清李轶《杭州电子科技大学学报》2005,25(4):58-61

说话人识别是一项通过语音来识别说话人身份的技术，它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合，基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适，该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时，该系统具备拒绝识别集外人的功能。相似文献

2.

矢量量化技术在说话人识别中的应用

崔玫姜献忠《山东电力高等专科学校学报》2006,10(4):55-56,51

矢量化(VQ)是一种及其重要的信号压缩方法,广泛应用于语音信号压缩等领域。说话人识别系统利用所建的VQ码本保存了说话人一定的声道特性,来进行说话人识别,完成这个识别系统有两个步骤:一是建立参考模型码本;二是进行模式匹配。相似文献

3.

基于DSP的语音识别技术在宾馆客房中的应用

高芙楠白雪张文婷《东北电力学院学报》2005,25(2):54-57

结合人们对宾馆客房中电气设备应用的需求．提出一种用DSP实现的说话人识别系统,对客房中基本电气功能进行语音控制,从而将语音识别技术应用到宾馆客房控制中。相似文献

4.

一种基于模型距离的改进的说话人识别技术 总被引：1，自引：0，他引：1

孙林慧杨震《西安邮电学院学报》2005,10(2):118-121

提出了一种测量高斯混合模型距离的方法。基于此方法提出一种改进的说话人识别系统:首先从语音中提取几种参数;再分别训练高斯混合模型;然后选择使说话人辨认系统模型平均距离较大的那种特征参数的高斯混合模型,作为该说话人的训练模型;最后在识别时提取此种特征参数进行识别。本文仿真了两种不同模型平均距离的特征参数的正确识别率。实验结果表明:对说话人辨认系统来说,采用使模型平均距离较大的特征参数,所对应的识别性能较好。相似文献

5.

MFCC和LPCC特征参数在说话人识别中的研究

李泽崔宣马雨廷陈俊宇《河南工程学院学报(自然科学版)》2010,22(2):51-55

特征提取是说话人识别系统中的一项关键技术,讨论了在说话人识别中语音特征的提取,详细介绍了求取MEL倒谱系数MFCC和线性预测倒谱系数LPCC的具体步骤和算法,并对MFCC和LPCC语音特征参数做出了理论分析和实验数据比较,通过实验论证了对于低频语音,采用MFCC参数的说话人识别在屏蔽噪音和抗噪声能力都优于采用LPCC参数的说话人识别. 相似文献

6.

基于小波包分析和支持向量机的说话人识别

王志兰《佳木斯工学院学报》2010,(6):873-875,890

在说话人识别系统中,语音特征参选是系统的关键问题之一.本文研究了MFCC参数、小波包分析.从听觉特性出发,提出基于小波包分析代替傅立叶变换的一种新的特征参数,给出了衡量各种特征参数识别能力的Fisher准则,结合Fisher准则构造一种新的混合特征参数,最后采用支持向量机实现说话人的分类识别.实验数据表明：有效地提高了说话人辨认系统的识别率. 相似文献

7.

提高多说话人孤立数字语音识别率的一些措施

王淑春吴善培《北京邮电大学学报》1992,15(2):29

本文介绍了连续密度隐马尔可夫模型(HMM)多说话人孤立数字语音识别系统,以及我们提出的几种提高多说话人孤立数字语音识别率的措施. 相似文献

8.

基于TSG110的语音识别控制器

马斌张东海阎焕忠彭宇李军《沈阳建筑工程学院学报(自然科学版)》2005,21(1):67-70

目的研究用自然语言向智能家居系统进行信息输入和对相关设备的控制及语音识别控制器设计．方法通过对语音信号特点和识别技术的分析，对语音识别系统的语音特征提取、声学模型与模式匹配、语言模型与语言的处理，阐述了HMM算法和DP匹配的语音识别算法，指出孤立词识别系统结构的特点．结果利用TSG110芯片，给出语音识别控制器的识别技术和系统硬件结构、软件设计及组成方法．结论语音识别技术运用于智能家居系统的语音识别控制器，使其具有语音分析、识别和系统控制等功能，实现信息输入与控制．相似文献

9.

一种鲁棒的说话人识别新特征

谢怡宁黄金杰《哈尔滨理工大学学报》2013,18(4)

说话人识别系统不可避免地会受到噪声的影响,导致性能急剧降低,针对这一问题采用感知最小方差无畸变响应(PMVDR)技术,提出了一种新的语音特征提取方法.该特征基于平移差分倒谱算法,成功地融入了说话人语音的长时信息.所提取的特征不仅在干净环境下能取得良好性能,而且在混噪语音以及信道失配等声学条件下也优于目前主流的特征.在YOHO数据库和ROSSI数据库上的实验结果表明,新特征在噪声和信道畸变的情况下能有效提高识别系统的鲁棒性. 相似文献

10.

MATLAB环境下基于矢量量化的说话人识别系统

宋敏刘幺和谭保华《湖北工业大学学报》2006,21(6):27-29

在MATLAB环境下实现基于矢量量化的说话人识别系统.在实时录音的情况下,利用该识别系统,对不同人的1-7 s的语音进行辨识,准确率可达到98%.识别时间根据使用人数的不同,测试语音长度的不同辨识时间从1-20 s,实现与文本无关的自动说话人确认的实时识别. 相似文献

11.

基于GMM-UBM的说话人确认系统的研究

霍春宝张彩娟赵红敏《辽宁工学院学报》2012,(2):98-101

在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数λ,使似然概率最大。文中通过对GMM的研究提出一种改进的模糊C均值算法（FCM）并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降,本文采用能覆盖话者语音的高斯混合模型．通用背景模型（GMM－UBM）作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。相似文献

12.

利用矢量量化的说话人识别系统的研究 总被引：2，自引：0，他引：2

王吉林《安徽工业大学学报》2005,22(3):282-285

利用矢量量化(VQ)技术实现了与文本有关的说话人识别。系统采用语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,对语音库中语音的平均识别率达到了92％,实时识别率达到90％以上。实验结果表明该系统具有识别精度高、速度快等特点,是一种有效的说话人自动识别的实现方法。相似文献

13.

基于GMM-UBM的说话人确认系统的研究

霍春宝张彩娟赵红敏《辽宁工学院学报》2012,(3):149-151,157

在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数元,使似然概率最大。通过对GMM的研究提出一种改进的模糊C均值算法（FCM）并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降．采用能覆盖话者语音的高斯混合模型-通用背景模型（GMM—UBM）作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。相似文献

14.

基于深度学习的开放场景下声纹识别系统的设计与实现

郭新罗程方邓爱文《南京信息工程大学学报》2021,13(5):526-532

针对现实应用场景中短时语音和混叠有噪声情况下声纹识别准确性低的问题,本文设计了一种改进的基于深度学习的声纹识别算法,提高了声纹识别模型在短时语音和带噪环境下的鲁棒性,并将该模型部署到了嵌入式设备中.本文主要对声纹识别算法的编码层和损失函数进行改进.对于编码层,本文使用了基于差分编码的NeXtVLAD技术,同时对帧级特征中的静态声纹特征和动态声纹特征进行建模.对于损失函数,本文将基于小样本学习框架的余弦-原型损失函数cosine-Prototypical与附加间隔分类损失函数AM-Softmax进行融合来训练声纹识别模型,使得模型在特征空间中的同类特征尽可能集聚,异类特征尽可能分离.此外,本文还将声纹识别算法部署在Raspberry Pi平台上,实现了能快速推理的声纹识别系统.实验结果表明:这种改进的声纹识别系统在多种开放场景下,能够实时、准确地完成声纹识别任务,可以达到实际应用的要求. 相似文献

15.

不定人语音识别系统 总被引：1，自引：0，他引：1

胡春静吴善培《北京邮电大学学报》1995,18(1):25-30

采用了说话人自适应和大数量人的训练数据两种方法解决不定人语音识别问题,在离散隐马尔可夫模型ＤＨＭＭ孤立字语音识别系统中,采用了３种说话人自适应方法,方法１,方法２为码本自适应,方法３为新人数据自适应,并将新建的１０００人的语音库用于不定人语音识别。实验结果表明,说话人自适应方法均有一定的自适应效果,特别是多码本自适应后,识别率可提高１６％,达到９３％以上;在数据库的采用,使得不定人的数字识别率达到相似文献

16.

改进VQ算法在说话人识别中的应用

张庆芳赵鹤鸣《苏州大学学报(工科版)》2005,25(6):1-4

与文本无关的说话人识别方法是当前说话人识别技术的研究重点。基于矢量量化的说话人识别，因其运算过程简单等特点，在说话人识别领域有着广泛的应用。本文对矢量量化的码书形成算法进行了改进，并基于改进算法进行了与文本无关的说话人识别。经实验结果证明，本文的方法改善了码本的性能，提高了说话人识别的识别率。相似文献

17.

基于编码比特流的说话人识别 总被引：1，自引：0，他引：1

下载免费PDF全文

信息工程大学信息工程学院河南郑州《信息工程大学学报》2007,8(3):323-326

针对现代通信系统中压缩语音信号的特点,给出了编码域说话人识别的框架。在此框架下,研究了从GSM FR、G.729、G.723.1(6.3 k)3种语音编码器的码流中直接提取参数的方法。实验表明,在识别准确率和计算速度上,编码域说话人识别均优于传统的基于解码语音的说话人识别方法。相似文献

18.

基于MATLAB GUI的语音信号特征提取系统设计 总被引：1，自引：0，他引：1

王光艳赵晓群王霞《河北工业大学学报》2010,(4)

语音信号的典型时频特性和核心处理算法是语音识别、合成和说话人识别等系统中的关键问题.结合线性预测分析技术(LPC)和美尔倒谱参数(MFCC)的算法原理,基于MATLAB GUI技术,设计完成了语音信号典型特征提取系统的界面平台,可实现语音信号的装载、播放和波形显示,LPC和MFCC的计算结果显示和数据存储等功能.界面的人机交互性好,操作简单方便,可提高对算法或数据处理效果的直观认识,对语音信号分析和处理等各个研究领域具有重要的现实意义. 相似文献

19.

帧间差分相位谱帧长和帧移的最优设置方法

王金芳虢明聂新礼《吉林大学学报(工学版)》2013,(Z1):6-10

多数说话人识别算法涉及的短时傅立叶变换相位部分,因对其函数表达式的数学处理存在问题,往往被忽略。帧间差分相位谱的特征提取方法着眼于折中考虑相位突变检测能力和相位噪声两方面要求,但仅靠经验分析确定帧长和帧移缺乏理论依据,因此本文提出利用互信息准则对其进行最优设置。基于TIMIT语料库的说话人识别测试实验表明,这种最优帧长和帧移下的识别性能明显优于经验分析所得参数的结果。相似文献

20.

MFCC特征加权应力影响下的变异语音识别

张磊韩纪庆王承发《哈尔滨工业大学学报》2002,34(6):743-747

为了提高语音识别系统的顽健性，在对应力影响下语音数据分析的基础上，提出一种新的基于MF－CC系数加权的变异语音识别方法。它首先通过正常语音和应力影响下变异语音的差异求得一个变异影响因子，然后对该因子的倒数进行规正作为MFCC特征不同维的权值，从而减弱受变异影响较大的特征对识别性能的影响。对航空模拟飞行器中采集的特定话者小词表孤立词的实验表明，与传统的多重风格训练方法相比，该方法的识别率提高了10.9%；将其和倒谱平均减方法相结合，可进一步将识别率提高5.4%。相似文献