共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
3.
说话人识别中语音特征参数的研究 总被引:2,自引:0,他引:2
一般的说话人识别系统包括特征提取和识别模型两部分,其中特征参数的选择对系统的识别性能有关键性的影响,现就特征提取展开研究,介绍了各种常用的语音特征参数及目前主流的两种参数的提取过程,并论述了小波分析应用于语音特征参数提取中的优势。 相似文献
4.
5.
当前基于预训练说话人编码器的语音克隆方法可以为训练过程中见到的说话人合成较高音色相似性的语音,但对于训练中未看到的说话人,语音克隆的语音在音色上仍然与真实说话人音色存在明显差别。针对此问题,本文提出了一种基于音色一致的说话人特征提取方法,该方法使用当前先进的说话人识别模型TitaNet作为说话人编码器的基本架构,并依据说话人音色在语音片段中保持不变的先验知识,引入一种音色一致性约束损失用于说话人编码器训练,以此提取更精确的说话人音色特征,增加说话人表征的鲁棒性和泛化性,最后将提取的特征应用端到端的语音合成模型VITS进行语音克隆。实验结果表明,本文提出的方法在2个公开的语音数据集上取得了相比基线系统更好的性能表现,提高了对未见说话人克隆语音的音色相似度。 相似文献
6.
7.
8.
9.
语音作为传递信息的一种常用手段,在人们的日常生活中有着非常重要的地位。随着科学的发展,语音识别愈来愈受到人们的重视。本文提出一种基于流形学习的特征提取方法———邻域保持嵌入( NPE)算法用于语音识别领域。流形学习是近几十年发展起来的降维方法,在图像识别领域已有应用,但在语音识别领域的应用非常之少。实验结果表明该算法可取得较好的识别率,同时所提取的特征稳定,计算速度快。 相似文献
10.
11.
线性判别分析在语音的特征提取中有着广泛的应用,并取得了较好的效果,但是传统的 线性判别分析是基于所有类具有相同的协方差矩阵的这一假设,在实际系统中这一假设并不一定能满 足,且在多类状况下 LDA 不总是最优。在对类内散度矩阵和类间散度矩阵分别进行加重的基础上,提 出的加重线性判别分析有效地解决了以上2个问题。实验结果表明,利用该方法提取语音特征,大大提 高了语音识别系统的识别率。 相似文献
12.
基于改进语音特征提取方法的语音识别 总被引:1,自引:1,他引:0
在分析语音特征提取方法基础上提出一种改进组合算法,并采用HMM声学模型和Viterbi算法进行模式训练和识别.实验结果表明,该算法在噪声环境中具有较好的鲁棒性,能有效提高噪声环境下中文连续语音识别的正确率,增强语音识别整体性能,因此在噪声环境下的语音识别系统中具有一定的实用价值. 相似文献
13.
语音识别系统中,语音的特征提取是语音识别的关键技术之一。通过对语音的系统研究,提出一种全新的基于流形学习的特征提取方法。流形算法是近些年才发展起来的非线性降维方法,在人脸识别领域已取得较好效果,但在语音识别领域一直处于空白。现提出的基于流形学习LPP算法的语音特征提取方案,是一次重大的尝试,可以为以后深入研究语音识别技术提供较好参考。仿真实验结果表明,该算法与传统特征提取LPCC、MFCC算法相比,可以取得较好的识别率。 相似文献
14.
微信语音在沟通交流中的作用越来越重要,但现阶段人们对微信语音的研究还不够深入,尤其是语音同一认定问题。因此,以实验的方式验证微信语音经过网络传输后声学特征产生的变化,结合现场同步录音的语音,判断是否满足语音同一认定的条件。 相似文献
15.
汉语大词汇量连续语音识别系统研究进展 总被引:34,自引:3,他引:34
本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发展动向进行了讨论. 相似文献
16.
17.
18.
19.
新型多模态人性化语音交互系统 总被引:1,自引:1,他引:0
面向服务机器人的语音交互需求,研究了一种新型的多模态人性化语音交互系统。该系统采用了连续语音流的关键词检测技术、说话人识别技术、基于传声器阵列语音定位技术和对话管理技术,能进行和谐的人机语音交互。多模态人性化语音交互系统通过这些技术综合利用使系统能知道“谁”在什么“时候”什么“地点”发出什么“指令”。基于人性化语音交互系统,机器人根据语音知道特定服务对象的需求,提供特定服务。 相似文献
20.