首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
二次特征提取及其在说话人识别中的应用   总被引:9,自引:0,他引:9  
传统的特征提取方法在处理小范围的说话人识别时尚可为之,但是在较大用户群的情况下,由于特征覆盖范围不够导致性能下降。鉴于此,本文提出了一种新的二次特征提取方法,它通过综合运用加权、微分、组合、筛选等方法,进一步挖掘说话人语音背后的隐性个性差异。在采用138人的YOHO数据库上进行的说话人识别测试中,其性能优于传统的特征提取方法。  相似文献   

2.
说话人识别的几种方法   总被引:5,自引:1,他引:4  
宁飞  陈频 《电声技术》2001,(12):9-14
以说话人识别的几个关键问题为纲,说明了国内外现有的识别方法和结果,以及存在的问题和难点,并提出了一些新想法。  相似文献   

3.
说话人识别中语音特征参数的研究   总被引:2,自引:0,他引:2  
陈杰  张玲华 《信息技术》2006,30(11):88-90
一般的说话人识别系统包括特征提取和识别模型两部分,其中特征参数的选择对系统的识别性能有关键性的影响,现就特征提取展开研究,介绍了各种常用的语音特征参数及目前主流的两种参数的提取过程,并论述了小波分析应用于语音特征参数提取中的优势。  相似文献   

4.
训练环境和测试环境的不匹配是造成实际情况下语音识别性能下降的主要原因。在深入研究语音识别的噪声环境和Mel域倒谱系数(MFCC)流程的基础上,基于累计分布函数匹配思想,给出了3种通过减小训练环境和测试环境的不匹配度来提高系统在不同环境下适应性的鲁棒性特征提取方法,分析了它们的理论基础、基本算法,并在Aurora2.0数据库上进行了实现,验证了方法的有效性,为实际应用中如何选择语音识别系统提供了参考。  相似文献   

5.
当前基于预训练说话人编码器的语音克隆方法可以为训练过程中见到的说话人合成较高音色相似性的语音,但对于训练中未看到的说话人,语音克隆的语音在音色上仍然与真实说话人音色存在明显差别。针对此问题,本文提出了一种基于音色一致的说话人特征提取方法,该方法使用当前先进的说话人识别模型TitaNet作为说话人编码器的基本架构,并依据说话人音色在语音片段中保持不变的先验知识,引入一种音色一致性约束损失用于说话人编码器训练,以此提取更精确的说话人音色特征,增加说话人表征的鲁棒性和泛化性,最后将提取的特征应用端到端的语音合成模型VITS进行语音克隆。实验结果表明,本文提出的方法在2个公开的语音数据集上取得了相比基线系统更好的性能表现,提高了对未见说话人克隆语音的音色相似度。  相似文献   

6.
人类不同于动物最基本的特征就是语言。语言是人类特有的沟通方式。所以能否正确提取计算机中的语言信号特征是目前人类在计算机发展技术中面临的最严峻的挑战。文章主要针对语言信号的特征提取方法进行研究,并对相关的实验数据进行系统分析来完善并实现人和计算机间的语言转换。  相似文献   

7.
语音识别说话人自适应研究现状及发展趋势   总被引:12,自引:0,他引:12  
说话人自适应是提高非特定人语音识别系统识别性能的有效手段.本文介绍了说话人自适应研究的现状,包括自适应的不同方式和不同算法,并详细介绍了目前应用最为广泛的MLLR算法和MAP算法.本文还给出了对说话人自适应研究发展趋势的预测.  相似文献   

8.
通过对Bark频带和Mel频标之间关系的研究,得到一个BarkMel临界带表,在此基础上详细介绍了一种基于人耳听觉掩蔽特性的MFCC计算方法.实验表明,该方法可使掩蔽特性在MFCC参数提取中达到最优化,提高识别率,具有一定的鲁棒性.  相似文献   

9.
语音作为传递信息的一种常用手段,在人们的日常生活中有着非常重要的地位。随着科学的发展,语音识别愈来愈受到人们的重视。本文提出一种基于流形学习的特征提取方法———邻域保持嵌入( NPE)算法用于语音识别领域。流形学习是近几十年发展起来的降维方法,在图像识别领域已有应用,但在语音识别领域的应用非常之少。实验结果表明该算法可取得较好的识别率,同时所提取的特征稳定,计算速度快。  相似文献   

10.
基于声音信号的特征提取方法的研究   总被引:9,自引:0,他引:9  
主要介绍了利用MATLAB语言对声音文件的采集、调入和一些基本处理方法,对预处理过程及特征参数的选取做了详细的说明,并着重介绍了线性预测系数(LPC)及其倒谱系数(LPCC)和梅尔频率倒谱系数(MFCC),且对它们进行了比较。  相似文献   

11.
徐洁  杨鼎才 《无线电工程》2005,35(12):50-52
线性判别分析在语音的特征提取中有着广泛的应用,并取得了较好的效果,但是传统的 线性判别分析是基于所有类具有相同的协方差矩阵的这一假设,在实际系统中这一假设并不一定能满 足,且在多类状况下 LDA 不总是最优。在对类内散度矩阵和类间散度矩阵分别进行加重的基础上,提 出的加重线性判别分析有效地解决了以上2个问题。实验结果表明,利用该方法提取语音特征,大大提 高了语音识别系统的识别率。  相似文献   

12.
基于改进语音特征提取方法的语音识别   总被引:1,自引:1,他引:0  
在分析语音特征提取方法基础上提出一种改进组合算法,并采用HMM声学模型和Viterbi算法进行模式训练和识别.实验结果表明,该算法在噪声环境中具有较好的鲁棒性,能有效提高噪声环境下中文连续语音识别的正确率,增强语音识别整体性能,因此在噪声环境下的语音识别系统中具有一定的实用价值.  相似文献   

13.
季伟  王力 《通信技术》2013,(12):15-18
语音识别系统中,语音的特征提取是语音识别的关键技术之一。通过对语音的系统研究,提出一种全新的基于流形学习的特征提取方法。流形算法是近些年才发展起来的非线性降维方法,在人脸识别领域已取得较好效果,但在语音识别领域一直处于空白。现提出的基于流形学习LPP算法的语音特征提取方案,是一次重大的尝试,可以为以后深入研究语音识别技术提供较好参考。仿真实验结果表明,该算法与传统特征提取LPCC、MFCC算法相比,可以取得较好的识别率。  相似文献   

14.
南兆营 《电声技术》2020,(10):39-43
微信语音在沟通交流中的作用越来越重要,但现阶段人们对微信语音的研究还不够深入,尤其是语音同一认定问题。因此,以实验的方式验证微信语音经过网络传输后声学特征产生的变化,结合现场同步录音的语音,判断是否满足语音同一认定的条件。  相似文献   

15.
汉语大词汇量连续语音识别系统研究进展   总被引:34,自引:3,他引:34  
刘加 《电子学报》2000,28(1):85-91
本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发展动向进行了讨论.  相似文献   

16.
17.
18.
语音不仅包含所需要的文本内容,也包含所要表达的情感信息。情感识别是人机情感交互的关键。该研究从语音情感语料库、情感特征提取和情感识别的应用等方面对情感语音识别进行了综述,目的是让机器感知人类的情感状态,提高机器的人性化水平。  相似文献   

19.
新型多模态人性化语音交互系统   总被引:1,自引:1,他引:0  
韩超  刘加 《电声技术》2009,33(8):78-80,85
面向服务机器人的语音交互需求,研究了一种新型的多模态人性化语音交互系统。该系统采用了连续语音流的关键词检测技术、说话人识别技术、基于传声器阵列语音定位技术和对话管理技术,能进行和谐的人机语音交互。多模态人性化语音交互系统通过这些技术综合利用使系统能知道“谁”在什么“时候”什么“地点”发出什么“指令”。基于人性化语音交互系统,机器人根据语音知道特定服务对象的需求,提供特定服务。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号