期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张庆芳赵鹤鸣《苏州大学学报(工科版)》2005,25(6):1-4

与文本无关的说话人识别方法是当前说话人识别技术的研究重点。基于矢量量化的说话人识别，因其运算过程简单等特点，在说话人识别领域有着广泛的应用。本文对矢量量化的码书形成算法进行了改进，并基于改进算法进行了与文本无关的说话人识别。经实验结果证明，本文的方法改善了码本的性能，提高了说话人识别的识别率。相似文献

2.

改进的EM算法在说话人识别中的应用

彭培福李树有姬永刚李鹏《辽宁工学院学报》2009,(3)

针对说话人识别的GMM模型中参数估计问题,提出了改进的EM算法,利用算法通过对说话人识别系统的实验数据的计算,验证了该算法能提高说话人识别系统的识别率。相似文献

3.

基于PNDM算法的说话人识别系统

高旭光霍春宝陈悦《辽宁工学院学报》2008,(5):284-286

矢量量化（VQ）是一种广泛应用于说话人识别系统的算法,基于对各说话人空间矢量内的相关性的研究,结合PNDM算法,利用Matlab软件对说话人识别系统进行研究。经实验结果证明,该方法有效增加了说话人间的区分性,提高说话人识别系统的识别率。相似文献

4.

基于多核SVM-GMM的短语音说话人识别

林琳陈虹陈建金焕梅《吉林大学学报(工学版)》2013,43(2):504-509

运用多个核函数的线性组合构造多核空间,在多核空间上设计了基于支持向量机的说话人分类器,实现短语音说话人识别。多核映射能够解决单核映射核函数及其参数选择的难题,增加说话人的可区分性,提高分类器的性能。算法中结合了高斯混合模型(GMM),并以GMM超向量作为说话人的最终特征参数进行仿真实验。实验表明,在短语音和两种噪声环境中,基于多核SVM-GMM的短语音说话人识别算法较SVM-GMM算法能得到更好的识别性能和鲁棒性。相似文献

5.

一种改进的高斯混合模型算法 总被引：4，自引：0，他引：4

下载免费PDF全文

许雯董林田家斌《信息工程大学学报》2005,6(2):65-67

建立声学模型是说话人识别技术的重要环节，一种好的建模方法对说话人识别系统的识别率具有极其重大的影响。本文介绍了一种改进的高斯混合模型算法——将聚类算法与传统高斯混合模型结合起来的建模方法，并对此种建模方法得出的识别效果与传统的高斯混合模型进行了比较。从对比结果可以看出，基于聚类的高斯混合模型的说话人识别相对于传统的高斯混合模型在识别率上有所提高。相似文献

6.

基于矢量量化改进算法的说话人识别

陆小珊田岚《山东工业大学学报》2004,34(3):60-62

给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法，该方法适于说话人集合适中(100人以内)情况，具有训练简单、存储数据量少、响应快等特点．为提高系统的识别率和可靠性，系统采用了方差修正的VQ改进算法，使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构．实验结果表明，改进后的方法对提高系统的识别率效果明显。相似文献

7.

基于粒子群优化-模糊聚类的说话人识别

薛丽萍尹俊勋纪震《深圳大学学报(理工版)》2008,25(2):178-183

基于粒子群优化(particle swarm optimization,PSO)提出一种说话人识别算法-三粒子模糊C均值聚类算法.利用3个子群体,每个子群体由规模较小的3个粒子构成,寻求最佳说话人模型.在每次迭代中每个子群体按先后顺序执行PSO算法中的速度更新、位置更新操作和标准FCM算法,对说话人的训练语音数据进行粒子群优化-模糊的软聚类分析,得到聚类中心的最优解,作为该说话人的语音模型.此算法可避免粒子陷入局部最优聚类中心,较准确地记录和估计每个聚类中心的最佳移动方向和历史路径,从而使聚类中心向全局最优解靠近.实验表明,本算法始终稳定地取得优于LBG算法、FCM算法和FRLVQ-FVQ算法的说话人识别性能,对初始聚类中心依赖度低,可有效降低误识率. 相似文献

8.

基于GMM的说话人识别系统研究

崔桂香丁晓明《北京电子科技学院学报》2004,12(4):1-5

说话人识别技术(声纹识别技术)以其独特优势在信息安全领域的应用逐渐增大.本文概括叙述了说话人识别的基本概念;介绍了在模拟噪声环境下,采用新特征提取算法的基于GMM的说话人识别系统的设计原理以及实现.测试结果表明,说话人辨认识别率达到96%以上. 相似文献

9.

基于信道补偿的说话人识别算法

《吉林大学学报(工学版)》2016,(3)

现有说话人识别算法普遍受信道因素的干扰,为了提高算法的准确率,在特征级利用特征弯折算法对语音特征参数进行处理,在模型级利用因子分析技术对说话人混合高斯模型(GMM)进行信道处理。对端点进行检测后,利用特征弯折算法对语音特征参数梅尔倒谱系数(MFCC)进行处理,去除线性信道和背景噪声的影响,并建立说话人GMM。然后利用因子分析技术拟合说话人特征空间与信道空间的差异,去除信道因子的影响。最后提取高斯超向量并通过支持向量机(SVM)得到识别结果。实验结果证明了信道补偿算法与GMM-SVM相结合能获得更好的识别率,并能保证算法的鲁棒性。相似文献

10.

基于正交高斯混合模型的说话人识别研究 总被引：5，自引：0，他引：5

下载免费PDF全文

侯风雷张昆帆王炳锡《信息工程大学学报》2002,3(2):43-45

本文介绍了正交高斯混合模型（OGMM）及其在说话人识别中的具体应用。传统的高斯混合模型（GMM）常常假定协方差矩阵为对角线矩阵，但需大量的混合成来表征分布情况，这将会导致训练量的增加。OGMM的主要思想是传统的GMM之前先将特征矢量变换到由协方差矩阵的本征向量决定的空间中去，这样得到的对角线协方差矩阵可以更准确地反映分布的情况。基于OGMM的说话人识别实验表明该算法在说话人识别方面比传统的GMM算法有更好的效果并具有良好的应用前景。相似文献

11.

基于深度学习的开放场景下声纹识别系统的设计与实现

下载免费PDF全文

郭新罗程方邓爱文《南京信息工程大学学报》2021,13(5):526-532

针对现实应用场景中短时语音和混叠有噪声情况下声纹识别准确性低的问题,本文设计了一种改进的基于深度学习的声纹识别算法,提高了声纹识别模型在短时语音和带噪环境下的鲁棒性,并将该模型部署到了嵌入式设备中.本文主要对声纹识别算法的编码层和损失函数进行改进.对于编码层,本文使用了基于差分编码的NeXtVLAD技术,同时对帧级特征中的静态声纹特征和动态声纹特征进行建模.对于损失函数,本文将基于小样本学习框架的余弦-原型损失函数cosine-Prototypical与附加间隔分类损失函数AM-Softmax进行融合来训练声纹识别模型,使得模型在特征空间中的同类特征尽可能集聚,异类特征尽可能分离.此外,本文还将声纹识别算法部署在Raspberry Pi平台上,实现了能快速推理的声纹识别系统.实验结果表明:这种改进的声纹识别系统在多种开放场景下,能够实时、准确地完成声纹识别任务,可以达到实际应用的要求. 相似文献

12.

基于 CFCC-PCA 的说话人辨识方法

刘雪燕李明袁宝玲《成都电子机械高等专科学校学报》2015,(2):32-34

针对说话人训练和识别时间长、噪音环境下识别率低的问题,提出一种CFCC-PCA特征参数的说话人辨识方法。首先提取具有听觉特性的CFCC特征参数,然后对其进行PCA变换,找出具有分辨能力的参数,最后再用这些参数在云服务器中训练和识别说话人。实验表明：该方法可以提高说话人辨识的鲁棒性和识别率,云服务可提高系统实时性。相似文献

13.

基于改进Canny检测与Hough变换的仪表图像识别算法

下载免费PDF全文

姚洋彭道刚王志萍《上海电力学院学报》2020,36(2):183-189

针对发电厂中指针式仪表数量多、周围环境复杂、灰尘污染等因素导致获得的图像含有大量噪声从而影响仪表读数识别精度的问题,提出了一种改进Canny边缘检测算法,通过采用5×5邻域计算像素梯度幅值的方法,提高了边缘检测精度,并采用自适应双阈值选择法,有效避免了传统Canny算法易出现伪边缘、边缘信息多等现象,结合Hough变换技术提取仪表指针信息,提高仪表识别精度。经实验对比验证,该算法检测效果优于传统Canny算法,仪表读数识别精度达到95%。相似文献

14.

改进PSO-SVM在说话人识别中的应用

李明张勇李军权张亚芬《电子科技大学学报(自然科学版)》2007,36(6):1345-1349

为了加快粒子群优化算法的收敛速度,增强全局的搜索能力,通过对粒子群优化算法中惯性权重和全局最优值的分析,提出了一种根据迭代次数而自适应变化的惯性权重的粒子群优化方法。改进后的粒子群算法在防止陷入局部最优的能力方面有了明显的增强,同时,给出了应用粒子群优化算法训练支持向量机的方法,并将其应用于说话人识别。实验结果证实了在说话人识别中改进PSO-SVM方法比其他传统方法能获得更好的识别精度和识别速度。相似文献

15.

基于环境判别学习的高噪声命令语音识别系统

吕成国韩纪庆王承发张磊《哈尔滨工业大学学报》2003,35(2):134-137

介绍了一种环境特征判别学习的Robust语音识别方法，该方法基于最小分类错误准则利用梯度下降法迭代地学习环境特征，实现了高噪声背景下命令语音识别系统。在不同级别背景噪声下，分别进行了有关信噪比、基本精度、抗噪能力以及系统对环境改变的适应性等实验。实验结果表明，系统在较高噪声背景下，有很好的识别效果，基本可满足应用领域的需要。相似文献

16.

开放场景下短时语音说话人识别系统的优化设计

下载免费PDF全文

郭新邓爱文罗程方邓飞其《南京信息工程大学学报》2023,15(5):585-591

为适应开放场景下说话人识别短时语音的应用需要，本文对说话人识别模型进行优化，提升了模型的准确率和鲁棒性.为了实现对重要频率特征的筛选，提出基于重加权的特征增强层及网络，起到增强特征表达的作用.将人脸识别领域的误分类样本损失函数首次引入到说话人识别领域，提高对困难样本的挖掘能力.提出基于误分类样本挖掘的分类损失与基于小样本学习框架的余弦角度原型损失的组合损失函数，解决了分类损失函数与说话人识别实际评测需求不匹配和度量函数对采样策略依赖性强的问题.实验结果显示，与基准模型相比，性能指标等误率（EER）降低12.45％，最小检测代价函数（minDCF）降低14.09％，取得现有说话人识别领域的优异效果. 相似文献

17.

基于GMM-UBM的说话人确认系统的研究

霍春宝张彩娟赵红敏《辽宁工学院学报》2012,(2):98-101

在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数λ,使似然概率最大。文中通过对GMM的研究提出一种改进的模糊C均值算法（FCM）并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降,本文采用能覆盖话者语音的高斯混合模型．通用背景模型（GMM－UBM）作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。相似文献

18.

多讲话者汉语单字识别

陈锡先王立健《北京邮电大学学报》1989,12(2):1

本文详细介绍了隐 Markov 模型(HMM)的基本概念和计算概率的前、后向算法,并采用 HMM 作了多讲话者(三人)小词汇量汉语单字识别实验。正确识别率为98%。相似文献