首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
说话人识别是根据人的声音来识别人身份的一种生物认证技术。文章采用VC平台利用VQ和HMM技术实现了说话人身份认证功能。并用遗传算法改进了Baum-Welch算法,通过实验验证了改进的HMM算法识别的效率有所提高。  相似文献   

2.
给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法,该方法适于说话人集合适中(100人以内)情况,具有训练简单、存储数据量少、响应快等特点.为提高系统的识别率和可靠性,系统采用了方差修正的VQ改进算法,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构.实验结果表明,改进后的方法对提高系统的识别率效果明显。  相似文献   

3.
基于编码比特流的说话人识别   总被引:1,自引:0,他引:1       下载免费PDF全文
针对现代通信系统中压缩语音信号的特点,给出了编码域说话人识别的框架。在此框架下,研究了从GSM FR、G.729、G.723.1(6.3 k)3种语音编码器的码流中直接提取参数的方法。实验表明,在识别准确率和计算速度上,编码域说话人识别均优于传统的基于解码语音的说话人识别方法。  相似文献   

4.
基于矢量量化改进算法的说话人识别   总被引:2,自引:0,他引:2  
给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法 ,该方法适于说话人集合适中(10 0人以内 )情况 ,具有训练简单、存储数据量少、响应快等特点 .为提高系统的识别率和可靠性 ,系统采用了方差修正的VQ改进算法 ,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构 .实验结果表明 ,改进后的方法对提高系统的识别率效果明显  相似文献   

5.
一种利用说话人识别技术的广播音响自动音量控制系统,通过识别出说话人的变更或语音的突变,从而给出在不同情况下音量的不同调节速度,有利地改善了伴音大小不一的现象。实验表明,系统在反应速度和控制质量上得到了较好的兼顾。  相似文献   

6.
基于正交高斯混合模型的说话人识别研究   总被引:5,自引:0,他引:5       下载免费PDF全文
本文介绍了正交高斯混合模型(OGMM)及其在说话人识别中的具体应用。传统的高斯混合模型(GMM)常常假定协方差矩阵为对角线矩阵,但需大量的混合成来表征分布情况,这将会导致训练量的增加。OGMM的主要思想是传统的GMM之前先将特征矢量变换到由协方差矩阵的本征向量决定的空间中去,这样得到的对角线协方差矩阵可以更准确地反映分布的情况。基于OGMM的说话人识别实验表明该算法在说话人识别方面比传统的GMM算法有更好的效果并具有良好的应用前景。  相似文献   

7.
应用聚类有效性分析来生成可变电码本,实验数据表明,此算法能够根据每个说话人的语音特征自动生成大小合适的电码本,并且能够保持性能的条件下有效减小电码本的大小。  相似文献   

8.
针对说话人识别的GMM模型中参数估计问题,提出了改进的EM算法,利用算法通过对说话人识别系统的实验数据的计算,验证了该算法能提高说话人识别系统的识别率。  相似文献   

9.
一种利用说话人识别技术的广播音响自动音量控制系统,通过识别出说话人的变更或语音的突变,从而给出在不同情况下音量的不同调节速度,有利地改善了伴音大小不一的现象。实验表明,系统在反应速度和控制质量上得到了较好的兼顾。  相似文献   

10.
基于小波变换说话人识别技术的研究   总被引:7,自引:0,他引:7  
提出了基于小波变换理论的说话人识别算法———小波基包法 .利用小波变换多分辨的特性 ,提取出真正地反映基音周期变化的基频包络 ,从声学语音学的角度去认识方言和口音 ,首次提出了汉语口音的参量表征 ,并应用到说话人识别当中 ,以实现从听觉的角度出发 ,进行说话人的先天特性与后天特性相结合的说话人识别 .结果表明 ,从基频包络中可以表现口音的一些表征 ,有助于认识说话人的特性 .  相似文献   

11.
基于欧洲电信标准化协会颁布的分布式语音识别和前端标准(ETSI-DSR-AFE).针对分布式说话人识别噪声鲁棒性较差的问题,提出一种新的前端处理方法.该方法以似然距离为测度,对语音进行无监督聚类,为减少计算量,采用分层增长(level-building)方法进行逐层分割,从而准确找出语音和静音的边界点.实验结果表明,用该方法改进ETSI-DSR-AFE标准后,信噪比在大于0 dB时,说话人辨认系统识别率相对改进了18.9%,相对原有的Mel频率倒谱系数(Mel-frequenly Ceptral coefficients,MFCC)系统识别率改进了60.7%.  相似文献   

12.
为解决脑电(electroencephalogram, EEG)情绪识别这一项具有挑战性的任务,提出一种基于双向长短时记忆网络(bidirectional long short-term memory, Bi-LSTM)的脑电情绪分类模型并探索大脑情绪机制,唤醒度准确率最高为76.78%,效价度准确率最高为77.28%,与其他模型比较,Bi-LSTM模型在脑电情绪识别上有出色的表现。通过Bi-LSTM模型对比不同频段、脑区和特征疏密度的准确率来探索大脑情绪机制,表明大脑中情绪相关性最高的频段、脑区和特征疏密度分别为α和β、顶叶区与额叶区、50和15。  相似文献   

13.
为了提高基于高斯混合模型-通用背景模型(GMM UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了459%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM UBM系统的运行效率.  相似文献   

14.
一种基于模型距离的改进的说话人识别技术   总被引:1,自引:0,他引:1  
提出了一种测量高斯混合模型距离的方法。基于此方法提出一种改进的说话人识别系统:首先从语音中提取几种参数;再分别训练高斯混合模型;然后选择使说话人辨认系统模型平均距离较大的那种特征参数的高斯混合模型,作为该说话人的训练模型;最后在识别时提取此种特征参数进行识别。本文仿真了两种不同模型平均距离的特征参数的正确识别率。实验结果表明:对说话人辨认系统来说,采用使模型平均距离较大的特征参数,所对应的识别性能较好。  相似文献   

15.
人的声音虽然具有个性特征,但随着电子信息技术的迅猛发展,人的语音也可以被模仿.当模仿者模仿说话人声音相似度极高时,当前说话人身份确认系统就有可能会被非法欺骗.研究了一种双模态信息融合的说话人识别方法,能把声纹信息和人脸信息融合在一起,通过动态贝叶斯网络(DBN)方法来刻画两类特征之间的相关性,并根据DBN模型作出最后的说话人识别结果.实验表明,基于双模态信息融合的说话人识别方法比传统单独的声纹识别和人脸识别有较高的正确识别率.  相似文献   

16.
说话人识别算法的研究   总被引:2,自引:0,他引:2  
针对说话人识别问题,基于概率神经网络PNN,实验比较MFCC,ΔMFCC+MFCC分别与PNN相结合时的识别率。仿真结果表明,在文本有关情况下,当说话人说话内容为0~9的发音时,ΔMFCC+MFCC优于MFCC,使用PNN算法的识别率能够满足说话人识别的实际要求。  相似文献   

17.
基于关联度修正欧氏距离的说话人识别技术   总被引:1,自引:0,他引:1  
从语音的生理基础和大量试验结果出发,作者选择从发元音[a:]、[e:]、[u:]的语音信号中,提取线性预测系数LPC和倒谱系数ISC作为人的特征;文中在给出定帧数特征提取和利用“核心”方法对参考模板进行训练的基础上,提出了一种基于关联度修正欧氏距离和新的模式匹配算法。在微型计算机(386)上实现了用于50人的说话人识别系统。识别率可达到98%,识别时间不大于3s。  相似文献   

18.
To solve the similar handwritten character recognition problem, a novel scheme is proposed to make better use of the feature's discriminative information. Different from the methods for extracting the extra feature for the similar characters, the Modified Quadratic Discriminant Function(MQDF) is first adopted to classify the feature, then the Support Vector Machine(SVM) is used to discriminate the similar characters without the extra feature. To collect the subset of similar characters, the confusion matrix is employed. A new structure for storing the dictionary of the SVM is also proposed for quickly searching. Experimental results on ETL9B show the superior performance of the proposed scheme to the methods for extracting the extra feature, which proves that the feature contains discriminative information for the similar characters and that the proposed scheme can utilize this information very effectively.  相似文献   

19.
矢量化(VQ)是一种及其重要的信号压缩方法,广泛应用于语音信号压缩等领域。说话人识别系统利用所建的VQ码本保存了说话人一定的声道特性,来进行说话人识别,完成这个识别系统有两个步骤:一是建立参考模型码本;二是进行模式匹配。  相似文献   

20.
介绍了说话人计算机识别系统的基本原理和研究现状,通过对多种可能方案的比较和选择,设计出了一个说话人识别系统,该系统用汉语的6个单韵母作为录入语音,使用了包括短时平均幅度、短时平均过零率、倒频域分析技术和线性预测分析技术等来完成语音的端点检测和语音个性化特征参数的提取,在Windows环境下用MATLAB完成了系统的开发,使系统短小精悍,并取得了较好的实测效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号