首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
提出一种将减法聚类与改进的模糊C-均值聚类相结合并用于说话人识别的方法.该方法将从语 音信号中提取的Mel 频率倒谱系数及其差分作为特征参数;用减法聚类算法初始化聚类中心,再用改进的模 糊C-均值聚类算法进行修正,形成码本.识别时,对每一个待识别语音进行模糊聚类识别.仿真结果表明,该 方法比改进的模糊C-均值聚类算法识别率高,具有较好的鲁棒性,且计算比较简单.  相似文献   

2.
为了提高说话人识别系统的识别效率,提出一种基于说话人模型聚类的说话人识别方法,通过近似KL距离将相似的说话人模型聚类,为每类确定类中心和类代表,构成分级说话人识别模型。测试时先通过计算测试矢量与类中心或类代表之间的距离选择类,再通过计算测试矢量与选中类中的说话人模型之间对数似然度确定目标说话人,这样可以大大减少计算量。实验结果显示,在相同条件下,基于说话人模型聚类的说话人识别的识别速度要比传统的GMM的识别速度快4倍,但是识别正确率只降低了0.95%。因此,与传统GMM相比,基于说话人模型聚类的说话人识别能在保证识别正确率的同时大大提高识别速度。  相似文献   

3.
语音识别中的一种说话人聚类算法   总被引:1,自引:1,他引:1  
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR 距离作为距离测度的时候,该算法对句子的聚类正确率达85169 %;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。  相似文献   

4.
针对存在情感差异性语音情况下说话人识别系统性能急剧下降以及缺乏充足情感语音训练说话人模型的问题,提出一种基于基频的情感语音聚类的说话人识别方法,能有效利用系统可获取的少量情感语音.该方法通过对男女说话人设定不同的基频阈值,根据阈值,对倒谱特征进行聚类,为每个说话人建立不同基频区间的模型.在特征匹配时,选用最大似然度的基频区间模型的得分作为该说话人的得分.在中文情感语音库上的测试结果表明,与传统的基于中性训练语音的高斯混合模型说话人识别方法和结构化训练方法相比,该方法具有更高的识别率.  相似文献   

5.
为了充分提取语音中的个人特征信息,类比矢量量化,提出了一种基于K-均值奇异值分解(K-SVD)的说话人识别方法。利用K-SVD训练得到的字典可较好地保存语音信号中的个人特征信息。利用这一特性,通过K-SVD从训练数据中提取包含说话人个人特征信息的字典,利用该字典实现说话人识别。相对于传统方法,该方法能够更好地利用语音的稀疏性保存语音中的个人特征信息并减小重构误差。实验仿真结果表明,与基于矢量量化的说话人识别方法相比,该方法在多说话人的情况下具有更好的识别率,具有更高的实用价值。  相似文献   

6.
提出了一种改进的时延神经网络(Time Delay Neural Network,TDNN)的说话人识别方法以提高说话人识别准确率。首先通过TDNN网络训练音频的特征获取部分说话人的特征表达,然后由加入的量化和计数算子(Quantization and Counting Operators,QCO)同时处理,QCO能够充分利用音频的低层纹理特征,得到特征的细节信息。实验结果表明,改进的时延神经网络在相对较少的数据量中即可由网络训练获取更多信息的特征表达,在小数量训练集网络中体现出明显优势。当数据量进一步增多时效果更为明显,训练加入了纹理统计方法的结构提取的细节特征使说话人识别表现更好。  相似文献   

7.
针对目前广泛应用于说话人识别领域的MFCC特征参数包含较少说话人特征信息的问题和SVM分类器选择核函数时受到Mercer准则限制的问题,提出了一种将混沌粒子群算法(CPSO)与核匹配追踪算法(KMP)相结合的说话人识别方法.首先通过CPSO聚类算法将MFCC特征参数进行变换处理,得到精简的MFCC特征参数(SMFCC),然后利用KMP算法对核函数的形式没有任何限制的特性和良好的分类识别性能,对约简后的SMFCC特征参数进行分类训练和识别.仿真实验结果表明,基于CPSO-KMP说话人识别方法相比主流的GMM-UBM方法,在EER性能上相对提高了31%.  相似文献   

8.
基于说话人聚类和支持向量的说话人确认研究   总被引:2,自引:0,他引:2  
侯风雷 《计算机应用》2002,22(10):33-35
说话人确认系统需要用目标说话人和背景模型说话人的语音数据对模型进行训练。背景模型说话人可随机选或选取与目标说话人相近的说话人,采用说话人聚类的方法可以有效地解决说话人背景模型的选取问题。支持向量机用作说话人确认模型来训练目标说话人和背景说话人的语音数据,实验表明该方法地与文本无关的说话人确认问题是有效的。  相似文献   

9.
目前,说话人识别系统对于干净语音已经达到较高的性能,但在噪声环境中,系统的性能急剧下降.一种基于子带处理的以相位自相关(PAC)系数及其能量作为特征的说话人识别方法,即宽带语音信号经Mel滤波器组后变为多个子带信号,对各个子带数据经DCT变换后提取PAC系数作为特征参数,然后对每个子带分别建立HMM模型进行识别,最后在识别概率层中将HMM得出的结果相结合之后得到最终的识别结果.实验表明,该方法在不同信噪比噪声和无噪声情况下的识别性能都有很大提高.  相似文献   

10.
张燕  唐振民  李燕萍 《计算机工程》2009,35(10):188-189
证实普通话可以分解为辅音音素和单元音音素通过过度音的连接,提出一种单字音特征提取方法。该方法在传统的帧特征提取基础上,对相关帧进行二次处理,得到单字语音中的多个代表帧,将代表帧进行拼接作为单字的特征矢量。这种特征提取方法能更好地表现说话人单字发音中相邻语音帧之间的连续性。仿真实验表明该方法在说话人识别系统的应用中达到较高的识别率,使识别时间进一步缩短。  相似文献   

11.
说话人识别综述   总被引:1,自引:0,他引:1  
在分析说话人识别原理的基础上,分别从说话人识别的特征提取、说话人模型等方面进行了综述,并讨论了说话人识别的优点和不足,展望了其应用研究的前景。  相似文献   

12.
一种新型的模糊C均值聚类初始化方法   总被引:10,自引:0,他引:10  
刘笛  朱学峰  苏彩红 《计算机仿真》2004,21(11):148-151
模糊C均值聚类(FCM)是一种广泛采用的动态聚类方法,其聚类效果往往受初始聚类中心的影响。受自适应免疫系统对入侵机体的抗原产生免疫记忆的机理启示,提出了一种新的产生初始聚类中心的方法。算法中,待分析的数据被视为入侵性抗原,产生的记忆细胞作为聚类分析的初始中心。克隆选择用来产生抗原的记忆细胞群体,免疫网络理论则用来抑制该群体规模的快速增长。实验结果表明免疫记忆机理用于FCM初始中心的选择是可行的,不仅提高了FCM算法的收敛速度,而且可以通过改变阈值的大小自动决定类别数。  相似文献   

13.
相对于硬聚类算法,软聚类算法可以更好地表示具有不精确边界的类簇。粗糙集和模糊集均是用于描述不确定数据的有效的数学工具,二者互为补充。研究人员已经将粗糙集和模糊集的概念相结合,并应用到聚类算法中,提出了粗糙模糊可能性C均值聚类算法。而文中通过引入阴影集,有效地解决了粗糙模糊可能性C均值聚类算法中的阈值选择问题。  相似文献   

14.
针对用模糊C-均值聚类算法选择初始聚类中心敏感及模糊加权指数m对模糊C-均值聚类算法的聚类性能影响较大等问题,利用粒子群优化算法的全局寻优能力强及收敛速度较快的特点,结合模糊C-均值算法提出一种新的模糊聚类算法;采用了一种简单有效的粒子编码方法,将初始聚类中心和模糊加权指数m同时进行粒子群优化搜索,在得到最优适应度的同时,m也收敛到一个稳定的最优解,从而有效地解决了上述问题。算法在人工合成数据集和多个UCI数据集上都取得了较好的效果。  相似文献   

15.
说话人识别的本质就是模式分类。传统分类器算法中参数模型方法的主要缺点是预先假定的概率分布函数形式不一定符合待分类的数据。非参数模型方法,如PNN分类器,可以有效地克服参数模型的缺点,但其巨大的内存开销与低的分类速度使得PNN作为大量和高维的数据样本分类几乎不可行。FCM虽具有良好的模糊聚类能力,但无法直接给出概率分类结果。该文提出的FCM-PNN分类器,在FCM聚类的基础上,以贝叶斯置信度为基础,利用PNN进行概率分类。它结合了FCM聚类和PNN概率分类的优势,同时克服了传统参数模型分类和FCM聚类的局限性。实验结果证实了FCM-PNN分类器具有分类精度高、速度快及揭示细节的能力。  相似文献   

16.
论文针对说话人识别中语音能量变化和噪声对提取有效语音数据的影响,在传统时域语音切分算法犤1,3犦的基础上,提出了三种孤立词的精确切分算法和一种连续语音的非精确切分算法。实验表明,新算法较好地克服了语音能量变化对切分的影响,在原始语音具有较高信噪比(≥10dB)的情况下,能够切除某些短时噪声和白噪声犤2犦。  相似文献   

17.
说话人识别由于其独特的方便性、经济性和准确性等优势,已成为人们日常生活与工作中重要的身份认证方式。然而在实际应用场景下,对说话人识别系统的准确性、鲁棒性、迁移性、实时性等提出了巨大的挑战。近年来深度学习在特征表达和模式分类方面表现优异,为说话人识别技术的进一步发展提供了新方向。相较于传统说话人识别技术(如GMM-UBM、GMM-SVM、JFA、i-vector等),聚焦于深度学习框架下的说话人识别方法,按照深度学习在说话人识别中的作用方式,将目前的研究分为基于深度学习的特征表达、基于深度学习的后端建模、端到端联合优化三种类别,并分析和总结了其典型算法的特点及网络结构,对其具体性能进行了对比分析。最后总结了深度学习在说话人识别中的应用特点及优势,进一步分析了目前说话人识别研究面临的问题及挑战,并展望了深度学习框架下说话人识别研究的前景,以期推动说话人识别技术的进一步发展。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号