排序方式: 共有7条查询结果,搜索用时 31 毫秒
1
1.
针对传统EM算法训练GMM不能充分利用训练数据所属高斯分量信息, 从而在一定程度上影响说话人识别性能的缺陷, 采用RPEM (竞争惩罚EM)算法训练GMM, 并引入批处理RPEM算法解决RPEM算法运算量大、收敛速度慢的问题, 同时针对RPEM和批处理RPEM算法训练时方差优化存在的问题进行了改进, 提出了改进的批处理RPEM算法。在Chains 说话人识别数据库上的实验表明, 改进的批处理RPEM算法取得了相对于传统EM、RPEM以及批处理RPEM算法更好的性能, 还极大地提高了训练效率, 减小了运算量, 说明了提出的改进批处理RPEM算法用于说话人识别时的有效性。 相似文献
2.
GMM与SVM的建模和识别性能具有较好的互补性,因此GMM-SVM在语种识别中得到广泛使用,以其为基础的GMM-MMI-SVM已成为语种识别的主流研究方法.但是SVM在判别时仅仅使用了训练样本中的一些特殊样本即支持向量,并没有使用全部样本,从而影响了系统识别性能的进一步提高.针对上述问题,提出一种基于核Fisher判别的分类算法-GMM-MMI-KFD.该算法的核心思想是用核Fisher准则(KFD)替代SVM分类准则,从语音片段中提取出特征向量序列,分别通过GMM-MMI分类器与GMM-KFD分类器进行判决打分.相对SVM,KFD更注重语音数据非线性分布的特点,并且将样本向高维空间H上投影后可以最大限度地增大类间距,减小类内距.实验数据表明,GMM-MMI-KFD方法在语种识别中具有更高的识别率. 相似文献
3.
连续语音识别中基于Dropout修正线性深度置信网络的声学模型 总被引:1,自引:0,他引:1
大词汇量连续语音识别系统中,为了增强现有声学模型的表征能力、防止模型过拟合,提出一种基于遗失策略(Dropout)修正线性深度置信网络的声学模型构建方法。该方法使用修正线性函数代替传统Logistic函数进行深度置信网络训练,修正线性函数更接近生物神经网络的工作方式,增强了模型的表征能力;同时引入Dropout策略对修正线性深度置信网络进行调整,避免节点之间的协同作用,防止网络出现过拟合。文章利用公开语音数据集进行了实验,实验结果证明了所提出的声学模型构建方法相对于传统方法的优越性。 相似文献
4.
一种适用于说话人识别的改进Mel滤波器 总被引:1,自引:0,他引:1
Mel倒谱系数(MFcc)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。 相似文献
5.
一种新的基于瓶颈深度信念网络的特征提取方法及其在语种识别中的应用 总被引:1,自引:0,他引:1
在语种识别中,传统的MFCC特征由于每帧信号上的信息量不足,很容易受到噪声污染,且抗噪能力较弱。同时,目前普遍使用的SDC特征提取方法在参数选择上需要人为设定,这增加了识别结果的不确定性。针对上述不足,将深度学习方法引入特征提取之中,提出了基于瓶颈深度信念网络的特征提取方法。最后在NIST2007数据库上对瓶颈层的大小、隐层数目以及瓶颈层位置进行了相关的对比实验,结果表明,提出的方法相对于传统的特征提取方法能够取得更高的识别率。 相似文献
6.
7.
利用无人机与遥控器间的无线电信号进行无人机检测和识别是当前的研究热点。但在该领域,仍存在两个关键问题有待解决:一是如何在存在众多第三方信号的复杂电磁环境下有效检测识别无人机信号,二是如何保证检测识别系统针对新型无人机的快速扩展能力。针对这两个问题,提出了一种高扩展性的无人机信号检测识别架构。首先,利用YOLO神经网络模型应对复杂电磁环境下信号检测难题。该模型设计和训练面向通用电磁信号检测。完成信号检测后,利用“信号特征提取+支持向量机”结构设计无人机信号识别算法。该步骤计算复杂度低,模型参数少,因此对新型无人机具备良好的可扩展性。 相似文献
1