首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
汉语语音转换技术的目的是在保持语义信息不变的前提下将汉语语音中源说话人的语音特征转换为目标说话人的语音特征.提出的适用于汉语说话人高自然度语音转换算法主要分为三个部分:前两部分用VQ模型实现了语音的谱包络及其激励的转换,第三部分采用BP算法实现语音的韵律转换规则建模.算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音转换并得到高自然度合成语音.实验表明本文提出的转换方法是一种有效的汉语语音转换算法.  相似文献   

2.
利用小波变换多分辨率分析的特点对汉语语音信号进行分析,成功地提取了一个反映声母和韵母之间过渡段信息的特征参数-过渡帧,利用该参数进行声/韵切分。通过对289个音节的实验,结果表明,小波变换能较好地捕促声韵母间的过渡信息。  相似文献   

3.
提出了一种基于改进的语音融合特征和GMM模型相结合的跨语种说话人确认方法.首先,采用Teager能量算子提取语音中的浊音段,消除与说话人声道特征无关的静音段和清音段.其次,提取基音周期参数,并与16维的MFCC参数融合形成本文的语音融合特征.最后,将本文方法与文献[9]的方法分别进行了单语种和跨语种的说话人确认对比实验,实验结果表明本文方法识别准确率和平均判别时间均优于文献[9]的方法,证明本文提出的方法有效,可用于跨语种的说话人确认应用领域.  相似文献   

4.
针对说话人训练和识别时间长、噪音环境下识别率低的问题,提出一种CFCC-PCA特征参数的说话人辨识方法。首先提取具有听觉特性的CFCC特征参数,然后对其进行PCA变换,找出具有分辨能力的参数,最后再用这些参数在云服务器中训练和识别说话人。实验表明:该方法可以提高说话人辨识的鲁棒性和识别率,云服务可提高系统实时性。  相似文献   

5.
论文讨论了如何选取声学特征来表征不同发音者的语音个人特性。重点介绍了说话人辨识系统的设计与实现方法。并给出了实验结果。  相似文献   

6.
针对说话人确认中的复杂信道环境干扰问题,提出一种基于深度神经网络的信道自适应方法。该方法首先在不同信道类型下训练得到音素信息相关的深度神经网络模型(Deep Neural Networks, DNNs),将说话人语音的声学特征参数在这些DNNs上进行自适应,得到各信道类型下的深瓶颈特征(Deep Bottleneck Feature, DBF)。然后将这些参数进行拼接并通过PCA降维,最后采用目前最有效的基于身份认证矢量(identity vector,i-vector)的建模技术对降维后的DBF进行建模,得到目标说话人模型和测试语音段的i-vector矢量用于最终说话人确认打分判决。在NIST SRE2010核心评测数据库上的实验结果表明,利用提出的方法能有效消除信道干扰对说话人确认的影响,在很大程度上提升了基于i-vector的说话人确认基线系统的性能。  相似文献   

7.
将小波变换和神经网络结合起来应用于说话人身份识别.通过小波变换提取语音信号的基音周期序列不仅体现了人发声时的生理特点,同时还包含了个人说话习惯等后天形成的特征.所以它能有效地反映说话人的语音特点.应用人工神经网络对基音周期序列进行识别分类以确定说话人身份.实验证明应用人工神经网络进行特征识别直接输出代表说话人身份的二进制编码,可以省去与库中所有数据进行匹配的繁琐操作,同时又能保证较高的正确率.  相似文献   

8.
为了进一步提高汉语语音合成的自然度,通过对汉语语音合成技术的分析与对比,确定了以汉语音节作为拼接的合成基元,采用韵律匹配代价和韵律拼接代价的方法,进行合成基元的优化选取,实现了汉语语音合成的韵律建模及其韵律控制.采用直接拼接、过渡拼接和拟拼接,实现合成基元之间的拼接与平滑过渡.实验结果表明了汉语语音合成及其韵律控制方法的有效性.  相似文献   

9.
对音高特征在说话人识别中的可分性问题进行了分析和实验研究.首先利用基音周期均值和方差的统计特性,绘制出话者音高特征空间分布图,从中看出音高特征在区分说话人个性方面的可行性,可在少量话者集合或初级识别中加以利用.实验表明,利用音高特征进行说话人识别具有明显的效果,在大量话者辨认时,利用它进行粗判可以有效减少后级识别范围,对提高系统响应效率有应用价值.  相似文献   

10.
特征提取是说话人识别系统中的一项关键技术,讨论了在说话人识别中语音特征的提取,详细介绍了求取MEL倒谱系数MFCC和线性预测倒谱系数LPCC的具体步骤和算法,并对MFCC和LPCC语音特征参数做出了理论分析和实验数据比较,通过实验论证了对于低频语音,采用MFCC参数的说话人识别在屏蔽噪音和抗噪声能力都优于采用LPCC参数的说话人识别.  相似文献   

11.
一种小波包变换的声纹参数提取方法研究   总被引:1,自引:0,他引:1  
在声纹识别系统中,对声纹参数的提取很重要。传统的MFCC参数忽略了语音信号的动态特性,因此提出了一种基于小波包变换的声纹参数提取方法。为了更突出说话人的声纹特征,克服说话内容不同对提取声纹参数的影响,在分帧阶段采用帧长为2560点,增长有效语音段。再结合基于矢量量化(VQ)系统进行说话人识别实验,并通过比较常用的db3、db4、db6、coif3小波函数选取最优基。实验证明,相对于常用的256点帧长,帧长为2560点的识别率较高且提高了运算速率。coif3小波函数为声纹参数提取的最优基。新的WPT参数的识别率优于传统的MFCC参数。  相似文献   

12.
对音高特征在说话人识别中的可分性问题进行了分析和实验研究,首先利用基音周期均值和方差的统计特性,绘制出话者音高特征空间分布图,从中看出音高特征在区分说话人个性方面的可行性,可在少量话者集合或初级识别中加以利用,实验表明,利用音高特征进行说话人识别具有明显的效果,在大量话者辨认时,利用它进行粗判可以有效减少后级识别范围,对提高系统响应效率有应用价值。  相似文献   

13.
现有说话人识别算法普遍受信道因素的干扰,为了提高算法的准确率,在特征级利用特征弯折算法对语音特征参数进行处理,在模型级利用因子分析技术对说话人混合高斯模型(GMM)进行信道处理。对端点进行检测后,利用特征弯折算法对语音特征参数梅尔倒谱系数(MFCC)进行处理,去除线性信道和背景噪声的影响,并建立说话人GMM。然后利用因子分析技术拟合说话人特征空间与信道空间的差异,去除信道因子的影响。最后提取高斯超向量并通过支持向量机(SVM)得到识别结果。实验结果证明了信道补偿算法与GMM-SVM相结合能获得更好的识别率,并能保证算法的鲁棒性。  相似文献   

14.
在MATLAB环境下实现基于矢量量化的说话人识别系统.在实时录音的情况下,利用该识别系统,对不同人的1-7 s的语音进行辨识,准确率可达到98%.识别时间根据使用人数的不同,测试语音长度的不同辨识时间从1-20 s,实现与文本无关的自动说话人确认的实时识别.  相似文献   

15.
基于EMD和概率神经网络的说话人识别   总被引:1,自引:0,他引:1  
基于EMD和概率神经网络的说话人识别方法,主要针对语音信号具有强时变特性问题,通过自适应性的经验模态分解(EMD)方法,对不同说话人的语音信号进行分解后,得到反映信号特征的本征模态函数(IMF),然后计算IMF的能量并进行归一化得到能量特征向量,利用具有简单高效的模式识别功能的概率神经网络(PNN),对不同说话人的语音能量特征向量识别,从而达到说话人识别的目的.实验结果表明,在噪声污染不大的情况下,该方法能够准确快速地识别说话人身份,具有较高的识别性能.  相似文献   

16.
通过采用动测试试验系统对秦沈客运专线一路桥过渡段路基速度动力特性进行现场试验研究,得到了行车速度对铁道无缝线路路桥过渡段路基动应力的在线路纵向上和深度方向上的影响特征;与此同时,定义了速度动力系数的概念,试验得出过渡段路基中速度动力系数都小于0.3,并预测了影响路基动力特性的临界速度的存在.研究结果对铁路客运专线过渡段结构的设计和施工有重要的指导意义.  相似文献   

17.
提出一种基于稀疏神经网络的说话人分割方法,利用稀疏的单隐层神经网络提取语音的超矢量特征中说话人因子特征,然后通过K均值聚类得到每帧语音的标号来分割不同说话人,在稀疏网络的训练过程中引入了dropout技术以克服过拟合问题.在TIMIT语音数据库构成的多说话人语音数据上的实验结果表明:通过增加稀疏网络中隐层节点的个数可以提高说话人分割的效果,与贝叶斯信息准则(Bayesian information criterion,BIC)方法和稀疏自编码网络方法相比,所提基于稀疏神经网络的说话人分割方法的性能有明显提高.  相似文献   

18.
人车路系统分析模型在差异沉降指标确定中的应用   总被引:1,自引:0,他引:1  
在对设置桥头搭板的路桥过渡段路面进行简化后,建立了车辆通过搭板时的人车路垂向振动系统分析模型;通过模态分析方法求解并计算了车辆下桥时的人车系统的位移响应,速度响应和加速度响应;利用所建的人车路系统分析模型对车辆经过路桥段时的振动特性进行了评价;并结合公路线形特点确定了路桥过渡段差异沉降指标与搭板坡差、桥面坡差、车速、载重、搭板长度等因素之间的关系,最终从功能性的角度提出路桥过渡段的搭板容许坡差应不超过0.4%.  相似文献   

19.
针对涵道式垂直起降固定翼无人机飞行过程中的悬停和过渡2个飞行状态,进行了纵向飞行稳定性研究。根据叶素动量理论结合实验数据,建立了基于特征截面计算的共轴双旋翼涵道气动力模型和推力涵道气动力模型,模型参数依照实验数据进行辨识;根据六自由度方程建立带推力涵道偏转的无人机飞行动力学模型;以建立的模型方法对案例无人机进行了悬停和过渡状态的纵向平衡求解和稳定性分析,并与悬停实验结果进行了比较。结果显示所建结合涵道动力模型的无人机飞行动力学模型能够准确地描述此类飞行器的纵向飞行稳定性。  相似文献   

20.
针对说话人识别的GMM模型中参数估计问题,提出了改进的EM算法,利用算法通过对说话人识别系统的实验数据的计算,验证了该算法能提高说话人识别系统的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号