期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张舒王成强李想李慧《南京师范大学学报》2018,(4)

声纹识别是一种能根据待识别语音的声纹特征识别说话人的技术. 本文阐述了声纹识别系统的原理知识,介绍了声纹识别系统的体系架构,本系统采取分层结构,核心业务分解为业务层和实现层,多个层的多个功能模块被设计成独立的服务,从而提升了声纹识别系统的识别准确率,最后给出了系统在实际生产环境下的产品设计方案. 相似文献

2.

与文本无关的声纹识别系统的研究

霍春宝张彩娟赵红敏《辽宁工学院学报》2013,(1):12-14

声纹识别按识别的方式分为与文本相关和与文本无关两类。针对声纹识别技术中与文本无关的声纹识别问题进行研究。为提高系统的识别率,提出并实现了多特征参数组合的识别算法。该算法以LPCC,MFCC组合作为特征参数并将其应用到声纹识别系统中,实验结果表明组合特征参数由于充分利用了语音信号的相关特性和人耳听觉感知特性,比单独使用一种参数具有更好的识别效果。相似文献

3.

基于深度学习的开放场景下声纹识别系统的设计与实现

郭新罗程方邓爱文《南京信息工程大学学报》2021,13(5):526-532

针对现实应用场景中短时语音和混叠有噪声情况下声纹识别准确性低的问题,本文设计了一种改进的基于深度学习的声纹识别算法,提高了声纹识别模型在短时语音和带噪环境下的鲁棒性,并将该模型部署到了嵌入式设备中.本文主要对声纹识别算法的编码层和损失函数进行改进.对于编码层,本文使用了基于差分编码的NeXtVLAD技术,同时对帧级特征中的静态声纹特征和动态声纹特征进行建模.对于损失函数,本文将基于小样本学习框架的余弦-原型损失函数cosine-Prototypical与附加间隔分类损失函数AM-Softmax进行融合来训练声纹识别模型,使得模型在特征空间中的同类特征尽可能集聚,异类特征尽可能分离.此外,本文还将声纹识别算法部署在Raspberry Pi平台上,实现了能快速推理的声纹识别系统.实验结果表明:这种改进的声纹识别系统在多种开放场景下,能够实时、准确地完成声纹识别任务,可以达到实际应用的要求. 相似文献

4.

基于MFCC和CHMM技术的语音情感分析及其在教育中的应用研究 总被引：1，自引：0，他引：1

张永皋马青玉孙青《南京师范大学学报》2009,9(2):89-92

语音情感识别作为一个新的研究热点,因其能解决教育中情感缺失的问题,而越来越受到研究者的重视.选取符合人类听觉系统感知的M el频率倒谱系数（MFCC）与各态历经型的连续隐马尔可夫模型（CHMM）进行语音情感特征的分析,并对大量的语音信号进行情感识别实验,识别正确率达到86.7%,为教育中的情感补偿提供了切实可行的依据. 相似文献

5.

声纹识别在虚拟仪器平台的实现

王会清张涛周帆《武汉工程大学学报》2012,34(12):58-61

采用LabVIEW软件和声卡构建一个声纹识别系统.通过对音频信号的采集及处理,分析说话人的声音,提取出语音的频率时间序列作为特征值,建立模型库.识别时,由系统对现场输入的语音采样、提取特征值,并与注册样本模型进行匹配,根据其结果作出是否一致的判断.系统测试结果表明,用提取文本语音频率时间序列进行身份认证是一种能满足实际要求的可行方法.该方法可以区分不同的说话人,能有效地克服环境噪声带来的影响,并且在做说话人确认测试时达到较高的识别率.在采用麦克进行语音录入与匹配时,学习、识别时间短,声纹确认准确,声纹确认的漏识率小于1%.具有无区域限制,简单方便,成本低等特点,可以为声纹识别系统的应用提供一个安全可靠的技术支持. 相似文献

6.

利用影视语料提高语音教学效果的研究

程春梅《沈阳工程学院学报(自然科学版)》2004,6(2):69-71

按照教育部制订的《高等学校英语专业英语教学大纲》( 2 0 0 0年 )中对语音教学的要求 ,参照克拉申的输入假设、情感过滤假设和斯温纳的输出假设 ,分析了目前语音教学的现状 ,探讨了合理、适当地将影视语料导入语音教学的方法 ,以提高语音教学的效果。相似文献

7.

基于DSP的声纹识别技术的研究

李波《辽宁工学院学报》2010,(4):218-221

论述了声纹识别技术的基本原理,采用DSP及其他可编程芯片设计出声纹识别系统的硬件部分,阐述了其结构及工作原理。基于隐马尔可夫模型为算法,以线性预测倒谱系数和Mel频域倒谱系数为特征矢量进行了系统仿真。结果表明,在结合使用两种倒谱系数及差分时,系统具有较高的识别率。相似文献

8.

矢量量化的音频信号类型确认算法的研究

陈宝远姜海鹏史玲玲王正王晓亮《哈尔滨理工大学学报》2010,15(1):108-111

语音识别和控制环境中,非语音信号(噪音)很容易与语音信号相混淆,一部分噪音被机器误认为语音,导致系统性能恶化.针对这一问题,以说话人识别理论为基础,提出了一种采用矢量量化来对音频信号类型(噪音或语音)进行确认的方法,以便于后期对非语音信号的噪音进行鉴别并且予以消除,提高语音信号处理系统的工作效率.在此基础之上,在MATLAB平台上设计了一个基于此方法的语音与非语音识别的仿真系统.测试结果表明,系统实现了语音与非语音识别的基本功能,达到较好的工作效果. 相似文献

9.

一种基于决策层融合的多模态情感识别方法

下载免费PDF全文

韩天翊林荣恒《南京师范大学学报》2022,(2):035-40

设计了一种软硬结合的多模态情感识别系统,使用语音和面部表情两个模态,通过梅尔频率倒谱系数与卷积神经网络对情感进行识别和分类,同时将语音情感识别迁移到神经网络计算棒以降低环境负载. 在模态融合时,采用决策层融合的方式来提高识别准确率. 实验结果表明,系统拥有较高的识别准确率,且能够在性能较差的运行环境中保持运行速度. 相似文献

10.

基于多特征序贯判决的电话语音声纹鉴别方法研究 总被引：2，自引：2，他引：2

田岚白树忠郑丽娜《山东大学学报(工学版)》2003,33(6):648-651

提出一种基于倒谱特征矢量量化结合音调特征序贯判决的电话语音声纹识别方法 .文中分析了长时LPC倒谱特征和音调特征的特性 ;根据LPC倒谱各维分量对说话人识别贡献不同 ,改进了失真测度 ;用矢量量化方法建立每个说话人语音模型 ,构成一种分类准确、存储数据少、响应速度快的不依赖文本的声纹鉴别系统 ;构造一种简化的音调测度 ,将声道和声源特征结合 ,采用序贯判决策略 ,提高了系统的顽健性 .实验表明 ,在 60位说话人集合中 ,用大约 10秒的话音做识别 ,正确率达 95%以上相似文献

11.

实现机器人语音远程控制的研究

席旭刚罗志增杨广映《杭州电子科技大学学报》2004,24(4):86-90

该文建设性地提出基于分布式组件技术(DCOM)构建多层网络化机器人远程控制系统，利用分布式组件技术实现了机器人的远程控制和网络共享。通过对语音识别技术的研究，在引进IBM ViaVoice语音识别的基础上，使语音识别技术与机器人控制系统有机结合实现机器人语音识别与控制。结合DCOM和IBM ViaVoice两者技术可以实现语音远程控制，使声音通过网络加以延伸，使控制者离开机器人嘈杂的操作环境，对远距离的机器人进行语音控制，使语音识别率得到很大的提高。相似文献

12.

基于修正MFCC的耳语说话人识别方法

丁国梁《苏州大学学报(工科版)》2009,29(4)

在说话人识别中,美尔倒谱系数MFCC(Mel-Frequency Cepstral Coefficients)是一种常用的特征.但是这种通用的特征在耳语音的说话人识别上并不太理想.MFCC的三角滤波器组在Mel尺度上是均匀分布的,但是耳语音不同于正常音的发声,通过改变这种均匀分布的格局来改善耳语音说话人识别率,将全频域分成不同频段,分别调整各频段内滤波器的疏密程度,再将各频段的滤波器组合成新的滤波器组.修正后的滤波器模型在文本无关的耳语音说话人识别中相比原模型识别效果有所提高. 相似文献

13.

Emotional speech feature extraction and optimization of phase space reconstruction

SUN Ying SONG Chunxiao 《西安电子科技大学学报(自然科学版)》2017,44(6):162-168

相似文献

14.

基于全相位滤波器的改进人工耳蜗CIS言语处理方案

庞智敏田岚侯正信《山东工业大学学报》2007,37(1):35-38,73

人工耳蜗是帮助深度耳聋患者恢复听力的一种装置.利用电子耳蜗电刺激的简化模型,采用滤波特性更佳的新型全相位数字滤波器对人工耳蜗连续相间采样（continuous interleaved sampler,CIS）语音信号处理方案进行仿真及声音合成,来模拟耳蜗植入者所听到的声音,并与传统的巴特沃夫滤波器仿真方案结果相比较.仿真实验结果表明：采用全相位滤波器得到的合成语音更为清晰,噪音有所减弱,优于巴特沃夫滤波器设计所得到的结果. 相似文献

15.

基于全相位滤波器的改进人工耳蜗CIS言语处理方案

庞智敏田岚侯正信《山东大学学报(工学版)》2007,37(1):35-38

人工耳蜗是帮助深度耳聋患者恢复听力的一种装置.利用电子耳蜗电刺激的简化模型,采用滤波特性更佳的新型全相位数字滤波器对人工耳蜗连续相间采样(continuous interleaved sampler,CIS)语音信号处理方案进行仿真及声音合成,来模拟耳蜗植入者所听到的声音,并与传统的巴特沃夫滤波器仿真方案结果相比较.仿真实验结果表明：采用全相位滤波器得到的合成语音更为清晰,噪音有所减弱,优于巴特沃夫滤波器设计所得到的结果. 相似文献

16.

基于VQ的高效汉语语音识别方法的比较性研究

谢湘赵军辉匡镜明《北京理工大学学报(英文版)》2002,11(3):266-270

介绍了一种基于VQ的小词汇量特定人快速语音识别方法,并对该方法中的关键参数进行了比较性研究. 这一方法尤其适用于汉语特定人小词汇量语音识别. 与典型的HMM和NN识别算法相比,该方法复杂度低、系统资源消耗少而识别率高,在对汉语11个数字的大规模识别测试中误识率仅为3.86%. 因此,该方法适合于在手机、PDA等资源有限的系统中实现语音数字拨号、人名拨号及查询等语音控制功能. 相似文献

17.

机器人语音控制及其实现 总被引：2，自引：0，他引：2

罗志增赵敬斌《杭州电子科技大学学报》2004,24(1):30-34

研究语音识别技术在机器人控制系统中的应用，采用了以LPC倒谱系数为特征矢量的模板匹配法来对有限的词汇量进行识别，将识别结果转换成命令并通过串口发送给机器人以控制其运动，实现了机器人的语音控制。相似文献