首页 | 本学科首页   官方微博 | 高级检索  
     

基于SDC特征和GMM-UBM模型的自动语种识别*
引用本文:姜洪臣,郑榕,张树武,徐波. 基于SDC特征和GMM-UBM模型的自动语种识别*[J]. 中文信息学报, 2007, 21(1): 49-53
作者姓名:姜洪臣  郑榕  张树武  徐波
作者单位:中国科学院 自动化研究所,北京 100080
基金项目:国家自然科学基金;国家高技术研究发展计划(863计划)
摘    要:本文提出了一种基于SDC特征和GMM-UBM模型的自动语种识别方法。SDC特征由许多语音帧的一阶差分谱连接扩展而成,与传统的MFCC特征相比,包含了更多的时序特征信息。UBM模型反映了所有待识别语种的特征分布特性,借助贝叶斯自适应算法可以快速得到每个语种的模型。与传统的GMM方法相比,该方法的训练和识别的速度更快。该方法对OGI电话语音库中11个语种进行了测试,其10秒、30秒和45秒句子的最佳识别正确率分别为72.38%、82.62%和85.23%,识别速度约为0.03倍实时。

关 键 词:计算机应用  中文信息处理  SDC特征   GMM-UBM模型   贝叶斯自适应  自动语种识别  
文章编号:1003-0077(2007)01-0049-05
收稿时间:2005-12-30
修稿时间:2006-02-28

SDC Feature-based Language Identification Using GMM-UBM
JIANG Hong-chen,ZHENG Rong,ZHANG Shu-wu,XU Bo. SDC Feature-based Language Identification Using GMM-UBM[J]. Journal of Chinese Information Processing, 2007, 21(1): 49-53
Authors:JIANG Hong-chen  ZHENG Rong  ZHANG Shu-wu  XU Bo
Affiliation:Institute of Automation, Chinese Academy Sciences, Beijing 100080, China
Abstract:This paper presents an automatic language identification(LID) system which uses shifted delta cepstra(SDC) feature vectors and universal background model(UBM).SDC feature is created by stacking delta cepstra computed across multiple speech frames and is involved with much more temporal information than conventional MFCC feature.UBM represents the characteristic of all different languages and each language model is obtained by employing the Bayesian adaptation from this UBM.Compared with the conventional GMM method,the training and testing speed of this method is much faster.This system performance is evaluated on the OGI corpus.The best identification accuracy for 11-languages is 73.28% for 10-s utterances,82.62% for 30-s utterances and 85.23% for 45-s utterances.The processing speed is about 0.03 times real time.
Keywords:computer application  Chinese information processing  shifted delta cepstra  GMM-UBM model  Bayesian adaptation  automatic language identification  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号