首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
声纹识别是一种能根据待识别语音的声纹特征识别说话人的技术. 本文阐述了声纹识别系统的原理知识,介绍了声纹识别系统的体系架构,本系统采取分层结构,核心业务分解为业务层和实现层,多个层的多个功能模块被设计成独立的服务,从而提升了声纹识别系统的识别准确率,最后给出了系统在实际生产环境下的产品设计方案.  相似文献   

2.
声纹识别按识别的方式分为与文本相关和与文本无关两类。针对声纹识别技术中与文本无关的声纹识别问题进行研究。为提高系统的识别率,提出并实现了多特征参数组合的识别算法。该算法以LPCC,MFCC组合作为特征参数并将其应用到声纹识别系统中,实验结果表明组合特征参数由于充分利用了语音信号的相关特性和人耳听觉感知特性,比单独使用一种参数具有更好的识别效果。  相似文献   

3.
针对现实应用场景中短时语音和混叠有噪声情况下声纹识别准确性低的问题,本文设计了一种改进的基于深度学习的声纹识别算法,提高了声纹识别模型在短时语音和带噪环境下的鲁棒性,并将该模型部署到了嵌入式设备中.本文主要对声纹识别算法的编码层和损失函数进行改进.对于编码层,本文使用了基于差分编码的NeXtVLAD技术,同时对帧级特征中的静态声纹特征和动态声纹特征进行建模.对于损失函数,本文将基于小样本学习框架的余弦-原型损失函数cosine-Prototypical与附加间隔分类损失函数AM-Softmax进行融合来训练声纹识别模型,使得模型在特征空间中的同类特征尽可能集聚,异类特征尽可能分离.此外,本文还将声纹识别算法部署在Raspberry Pi平台上,实现了能快速推理的声纹识别系统.实验结果表明:这种改进的声纹识别系统在多种开放场景下,能够实时、准确地完成声纹识别任务,可以达到实际应用的要求.  相似文献   

4.
语音情感识别作为一个新的研究热点,因其能解决教育中情感缺失的问题,而越来越受到研究者的重视.选取符合人类听觉系统感知的M el频率倒谱系数(MFCC)与各态历经型的连续隐马尔可夫模型(CHMM)进行语音情感特征的分析,并对大量的语音信号进行情感识别实验,识别正确率达到86.7%,为教育中的情感补偿提供了切实可行的依据.  相似文献   

5.
采用LabVIEW软件和声卡构建一个声纹识别系统.通过对音频信号的采集及处理,分析说话人的声音,提取出语音的频率时间序列作为特征值,建立模型库.识别时,由系统对现场输入的语音采样、提取特征值,并与注册样本模型进行匹配,根据其结果作出是否一致的判断.系统测试结果表明,用提取文本语音频率时间序列进行身份认证是一种能满足实际要求的可行方法.该方法可以区分不同的说话人,能有效地克服环境噪声带来的影响,并且在做说话人确认测试时达到较高的识别率.在采用麦克进行语音录入与匹配时,学习、识别时间短,声纹确认准确,声纹确认的漏识率小于1%.具有无区域限制,简单方便,成本低等特点,可以为声纹识别系统的应用提供一个安全可靠的技术支持.  相似文献   

6.
按照教育部制订的《高等学校英语专业英语教学大纲》( 2 0 0 0年 )中对语音教学的要求 ,参照克拉申的输入假设、情感过滤假设和斯温纳的输出假设 ,分析了目前语音教学的现状 ,探讨了合理、适当地将影视语料导入语音教学的方法 ,以提高语音教学的效果。  相似文献   

7.
论述了声纹识别技术的基本原理,采用DSP及其他可编程芯片设计出声纹识别系统的硬件部分,阐述了其结构及工作原理。基于隐马尔可夫模型为算法,以线性预测倒谱系数和Mel频域倒谱系数为特征矢量进行了系统仿真。结果表明,在结合使用两种倒谱系数及差分时,系统具有较高的识别率。  相似文献   

8.
语音识别和控制环境中,非语音信号(噪音)很容易与语音信号相混淆,一部分噪音被机器误认为语音,导致系统性能恶化.针对这一问题,以说话人识别理论为基础,提出了一种采用矢量量化来对音频信号类型(噪音或语音)进行确认的方法,以便于后期对非语音信号的噪音进行鉴别并且予以消除,提高语音信号处理系统的工作效率.在此基础之上,在MATLAB平台上设计了一个基于此方法的语音与非语音识别的仿真系统.测试结果表明,系统实现了语音与非语音识别的基本功能,达到较好的工作效果.  相似文献   

9.
设计了一种软硬结合的多模态情感识别系统,使用语音和面部表情两个模态,通过梅尔频率倒谱系数与卷积神经网络对情感进行识别和分类,同时将语音情感识别迁移到神经网络计算棒以降低环境负载. 在模态融合时,采用决策层融合的方式来提高识别准确率. 实验结果表明,系统拥有较高的识别准确率,且能够在性能较差的运行环境中保持运行速度.  相似文献   

10.
基于多特征序贯判决的电话语音声纹鉴别方法研究   总被引:2,自引:2,他引:2  
提出一种基于倒谱特征矢量量化结合音调特征序贯判决的电话语音声纹识别方法 .文中分析了长时LPC倒谱特征和音调特征的特性 ;根据LPC倒谱各维分量对说话人识别贡献不同 ,改进了失真测度 ;用矢量量化方法建立每个说话人语音模型 ,构成一种分类准确、存储数据少、响应速度快的不依赖文本的声纹鉴别系统 ;构造一种简化的音调测度 ,将声道和声源特征结合 ,采用序贯判决策略 ,提高了系统的顽健性 .实验表明 ,在 60位说话人集合中 ,用大约 10秒的话音做识别 ,正确率达 95%以上  相似文献   

11.
该文建设性地提出基于分布式组件技术(DCOM)构建多层网络化机器人远程控制系统,利用分布式组件技术实现了机器人的远程控制和网络共享。通过对语音识别技术的研究,在引进IBM ViaVoice语音识别的基础上,使语音识别技术与机器人控制系统有机结合实现机器人语音识别与控制。结合DCOM和IBM ViaVoice两者技术可以实现语音远程控制,使声音通过网络加以延伸,使控制者离开机器人嘈杂的操作环境,对远距离的机器人进行语音控制,使语音识别率得到很大的提高。  相似文献   

12.
在说话人识别中,美尔倒谱系数MFCC(Mel-Frequency Cepstral Coefficients)是一种常用的特征.但是这种通用的特征在耳语音的说话人识别上并不太理想.MFCC的三角滤波器组在Mel尺度上是均匀分布的,但是耳语音不同于正常音的发声,通过改变这种均匀分布的格局来改善耳语音说话人识别率,将全频域分成不同频段,分别调整各频段内滤波器的疏密程度,再将各频段的滤波器组合成新的滤波器组.修正后的滤波器模型在文本无关的耳语音说话人识别中相比原模型识别效果有所提高.  相似文献   

13.
14.
人工耳蜗是帮助深度耳聋患者恢复听力的一种装置.利用电子耳蜗电刺激的简化模型,采用滤波特性更佳的新型全相位数字滤波器对人工耳蜗连续相间采样(continuous interleaved sampler,CIS)语音信号处理方案进行仿真及声音合成,来模拟耳蜗植入者所听到的声音,并与传统的巴特沃夫滤波器仿真方案结果相比较.仿真实验结果表明:采用全相位滤波器得到的合成语音更为清晰,噪音有所减弱,优于巴特沃夫滤波器设计所得到的结果.  相似文献   

15.
人工耳蜗是帮助深度耳聋患者恢复听力的一种装置.利用电子耳蜗电刺激的简化模型,采用滤波特性更佳的新型全相位数字滤波器对人工耳蜗连续相间采样(continuous interleaved sampler,CIS)语音信号处理方案进行仿真及声音合成,来模拟耳蜗植入者所听到的声音,并与传统的巴特沃夫滤波器仿真方案结果相比较.仿真实验结果表明:采用全相位滤波器得到的合成语音更为清晰,噪音有所减弱,优于巴特沃夫滤波器设计所得到的结果.  相似文献   

16.
介绍了一种基于VQ的小词汇量特定人快速语音识别方法,并对该方法中的关键参数进行了比较性研究. 这一方法尤其适用于汉语特定人小词汇量语音识别. 与典型的HMM和NN识别算法相比,该方法复杂度低、系统资源消耗少而识别率高,在对汉语11个数字的大规模识别测试中误识率仅为3.86%. 因此,该方法适合于在手机、PDA等资源有限的系统中实现语音数字拨号、人名拨号及查询等语音控制功能.  相似文献   

17.
机器人语音控制及其实现   总被引:2,自引:0,他引:2  
研究语音识别技术在机器人控制系统中的应用,采用了以LPC倒谱系数为特征矢量的模板匹配法来对有限的词汇量进行识别,将识别结果转换成命令并通过串口发送给机器人以控制其运动,实现了机器人的语音控制。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号