排序方式: 共有11条查询结果,搜索用时 31 毫秒
1.
2.
线性预测HMM(Linear Prediction HMM,LPHMM)并没有象传统HMM那样引入状态输出独立同分布假设,但实用中识别性能并不佳.通过分析两种HMM的各自优劣,本文提出了一种新的语音识别的混合模型,将语音静态特性(基于传统HMM)和动态特性(基于LPHMM)分别描述又有机结合在一起,更为精确地刻划了真实的语音现象,同时又继承使系统的实现改动很小和较小的计算量.汉语大词汇量非特定人连续语音识别的实验表明,混合模型的识别性能显著好于LPHMM和传统HMM.理论上,本文还给出了LPHMM的一组闭式参数重估公式. 相似文献
3.
为了解决语音识别中深层神经网络的说话人与环境自适应问题,本文从语音信号中的说话人与环境因素的固有特点出发,提出了使用长时特征的自适应方案:首先基于高斯混合模型,建立说话人-环境联合补偿模型,对说话人与环境参数进行估计,将此参数作为长时特征;然后,将估计出来长时特征与短时特征一起送入深层神经网络,进行训练。Aurora4实验表明,这一方案可以有效地对说话人与环境因素进行分解,并提升自适应效果。 相似文献
4.
自适应技术在近年来得到越来越多的重视,其中应用广泛的包括MAP、MLLR,该技术利用少量特定人数据就可以调整码本,快速地提升识别性能,它要求原始的码本有很好的说话人无关性。本文介绍了结合MLLR自适应的说话人自适应训练(Speaker Adaptive Training,以下简称SAT)算法,这种方法将每个说话人码本视为说话人无关码本经过线性变换的结果,在此基础上训练的说话人无关码本更有效剔除了说话人相关信息,因此在说话人自适应中时能根据特定数据调整更好地逼近说话人特性,从而有更好的性能表现。 相似文献
5.
6.
提出一种通过兴奋解说检测进行体育比赛精彩片断提取的方法.该方法包括训练和检测两个阶段:在训练中,基于训练数据对兴奋语音和普通语音分别建立高斯混合模型GMM(Gaussian Mixture Model),构成初始的分类器;在集外检测中,首先使用最大后验方法MAP(Maximum A Posteriori),基于测试数据对初始模型进行无监督自适应,进而利用更新后模型构成分类器识别体育解说的兴奋部分,经进一步处理得到精彩片断.将该方法用于足球比赛视频,实验表明,该方法能够召回87%的进球.引入无监督自适应有效地减少了由于训练数据与测试数据失配造成的性能下降,提高了兴奋解说检测和精彩片段提取的性能. 相似文献
7.
尽管作为当前最为流行的语音识别模型,隐马尔可夫模型(HMM)由于采用了状态输出独立同分布假设,因此不能描述语音现象中固有的时间相关性。文章介绍了一个更为灵活的基于段长分布HMM(DDBHMM)的研究帧相关性的框架,并在此基础上提出了一个混合模型,采用一种将语音特征静态信息和动态变化信息分别描述又有机结合在一起的方式,以较小的计算代价更为合理地刻划了真实的语音现象。汉语大词汇量非特定人连续语音识别的实验表明,通过利用帧相关性识别系统的性能得到了明显改善。 相似文献
8.
9.
在基于神经网络的语音识别任务中,提出根据激励函数二阶导数优化网络预训练阶段中权值初始化的方法。利用激励函数的非线性区域和自变量呈高斯分布的特性,寻找权值分布的较优方差以提升训练速度。通过比较同一学习速率下不同初始化数值对收敛速度的影响,发现此种方法可以加快预训练阶段的速度,提升神经网络训练的效率。 相似文献
10.
语音检测是语音信号处理的前端,利用长时谱能量差异特征的语音检测无法区分突发噪声和语音,掺杂着突发噪声的语音信号会对语音处理系统带来不良影响。提出了一种基于长时谱能量差异特征和基音比例特征相结合的语音检测方法,该方法的优点是,在利用长时谱能量差异特征基础上引入基音比例特征,从而有效减少了将信号中突发噪声误判为语音的错误。实验显示,该算法能够在多种信噪比环境下取得很好的检测结果。 相似文献