首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
在针对电话语音的语种识别系统中,训练语音和测试语音之间存在不同说话人的个性差异带来的干扰,是影响系统识别性能的一个重要因素.基于此,本文首先对当前语种识别系统中消除此影响的方法进行研究,对比分析它们各自的优缺点,选择将锚模型方法引入语种识别系统中,该方法将语料映射至说话人无关的锚超矩阵进而消除说话人相关信息.针对锚超矩阵的选择存在语种混淆和信息冗余等问题,本文并提出一种结合支持向量机的锚模型训练算法,该方法下得到的锚超矩阵更具语种区分性,并去除了混淆信息的影响,增强了矩阵的紧致性.实验结果表明,新方法下的锚模型映射方法能有效提高基线系统的识别性能,并降低了语种识别系统训练和识别时的计算量.  相似文献   

2.
一种基于层次化支持向量机的语种识别方法   总被引:2,自引:0,他引:2  
基于广义线性区分性序列核的支持向量机方法在语种识别中了得到了广泛应用.本文此基础上,进一步提出了一种层次化的SVM方法,通过将训练语音切分成不同时长的语音段集合.利用长时语音段训练得到的模型对短时语音段集合进行数据选择.同时借鉴互训练的思想,采用互补的特征参数训练SVM模型,并对不同时长、特征的系统识别结果加以融合,有效提高了系统性能.在NIST 2003语种测试中30秒时长的测试结果表明,本文所提方法有效的提升了语种识别的性能,等错误率(EER)从6.3降到了4.5%.  相似文献   

3.
基于区分性Model Pushing的语种识别方法   总被引:1,自引:1,他引:0  
提出一种区分性Model Pushing方法,将SVM训练出的支持向量沿最优分类面的法线方向进行适当移动,增大不同语种间的区分性,然后将移动后的支持向量反向应用于GMM。该方法既保留了SVM的区分性信息,又利用了GMM在短时语音上的优势,同时增加了目标与非目标的区分度。实验结果表明,区分性Model Pushing能有效地提高识别性能。  相似文献   

4.
传统的GMM-TV(Gaussian Mixture Model-Total Variability,又称为i-vector)系统得益于它良好的识别效果以及优秀的识别效率,在语种识别LID(language identification)中得到广泛应用,然而载荷矩阵T的训练过程是无监督的,使得它的分类空间并没有得到最好的优化。已有的有监督TV(Supervised-TV,S-TV)算法,通过在均值超矢量上拼接一个带有标签信息的向量,使得T矩阵的训练过程变成一个有监督的过程,但是效果增长较弱,同时带来了载荷矩阵自由度问题。提出一种改进的有监督训练方法,在目标函数中引入正则化项来解决自由度的问题,同时大大提升它的分类效果。该方法在NIST LRE09的30s数据集实验中得到了很好的效果,等错误率EER(Equal Error Rate)从5.40%下降到4.96%,融合系统的EER达到了3.86%。  相似文献   

5.
支持向量机 (Support vector machine, SVM) 在语种识别中已经起到了重要的作用.近些年来,极限学习机 (Extreme learning machine, ELM) 在很多领域取得了成功的应用.相比于 SVM, ELM 最大的优点在于极易实现、训练速度快,而且通常可以取得与 SVM 相近甚至优于 SVM 的识别性能. 鉴于 ELM 这些优异的特点,本文将 ELM 引入到语种识别中,并针对 ELM 由于随机初始化模型参 数所带来的潜在问题,提出了流形正则化极限学习机 (Manifold regularized extreme learning machine, MRELM) 算法.实验结果表明,在高斯超矢量(Gaussian supervector, GSV)特征空间上,相对于 SVM 基线系统,该算法对30秒语音的识别性能有明显的提升. 同时该算法也可以成功地应用到 i-vector 特征空间中,取得与当前主流的打分算法相近的识别性能.  相似文献   

6.
首先从西北少数民族语语种的特征方面进行分析,找出不同语种之间的差异,提取语种语音特征参数,特征参数以矢量形式表现。然后利用训练矢量来训练one—against—one支持向量机模型,利用支持向量机模型对测试矢量集进行分类投票,获得投票数最多的语种被判定为未知语音的语种。  相似文献   

7.
新闻主题追踪是对主体所感兴趣的新闻主题的发展趋势进行动态追踪,其优势在于对所感兴趣的主题基于文本模型及理解的动态追踪,因此更多地涉及文本表示与语义理解。LS-SVM首先将文本利用LSI(隐含语义分析)进行分析,完成对文本基于语义的特征降维及文本表示;然后将隐含语义文本表示的结果输出给SVM进行主题追踪,从而实现从语义层次上的新闻主题追踪。实验结果表明,与传统的主题追踪相比较,该方法能够有效提高主题追踪的性能,减少追踪的错报率和漏报率。  相似文献   

8.
蔡军  李晓娟  张毅  罗元 《控制工程》2013,20(5):957-959
在支持向量机多分类方法基础上,提出了一种改进的有向无环图支持向量机( Directed Acyclic Graph Support Vector Machine,DAGSVM) 手势识别方法。首先根据Kinect 采集到 的场景深度信息将前景和背景分开,分割得到手,然后提取其特征向量,利用特征向量训练多 个SVM 两分类器,采用DAG 拓扑结构构成DAGSVM 多分类器,并对其结构排序进行改进。 实验证明,与其他支持向量机多分类方法相比,改进后的DAGSVM 分类器能够达到更高的识 别率,并将这个手势识别方法用于智能轮椅的控制上,收到了良好的效果。  相似文献   

9.
新闻主题追踪是对主体所感兴趣的新闻主题的发展趋势进行动态追踪,其优势在于对所感兴趣的主题基于文本模型及理解的动态追踪,因此更多地涉及文本表示与语义理解。LSSVM首先将文本利用LSI(隐含语义分析)进行分析,完成对文本基于语义的特征降维及文本表示;然后将隐含语义文本表示的结果输出给SVM进行主题追踪,从而实现从语义层次上的新闻主题追踪。实验结果表明,与传统的主题追踪相比较,该方法能够有效提高主题追踪的性能,减少追踪的错报率和漏报率。  相似文献   

10.
特征提取和分类是虹膜识别中的关键部分.由于小波分解后的低频子带包含了虹膜图像的主要信息,而Log-Gabor滤波能有效地提取出图像的纹理信息,将这两种方法结合是一个提取虹膜识别信息的有效途径.本文先对归一化的虹膜采用小波变换的方法细分图像,再用Log-Gabor滤波器对低频通道的子带图像进行更进一步的特征提取并量化,形成特征码本,最后采用支持向量机的分类器来进行分类.实验结果表明,分类器能很好地分离各类虹膜,识别率提高到了99.6%,等错率则降低为0.3%,比传统汉明距的分类方式有更优异的性能.  相似文献   

11.
基于支持向量机的人脸识别   总被引:4,自引:0,他引:4  
由于支持向量机(SVM)有着适合处理小样本问题、高维数及泛化性能强等多方面的优势,并且基于核函数主元分析的方法对于非线性问题的特征提取来说较为合理,因此提出了一种基于核函数主元分析(KPCA)与支持向量机(SVM)的人脸识别方法。在使用KPCA方法对人脸图像进行特征提取后,用SVM对特征向量进行分类识别。利用剑桥ORL的人脸数据库进行的实验结果验证了本算法的有效性。  相似文献   

12.
基于ICA和SVM的虹膜识别方法   总被引:1,自引:0,他引:1  
提出了一种基于独立分量分析和支持向量机的虹膜识别方法-ICA提取虹膜特征,SVM实现模式匹配.与Gabor小波的方法比较,在编码长度和编码时间方面有较明显地改进.实验结果表明,该算法能够有效地应用到身份鉴别系统中.  相似文献   

13.
提出一种基于改进LPP和ECOC-SVMS的离线签名识别方法。针对预处理后的签名图像,选择多种有效特征构建高维特征向量,引入一种改进的保局投影方法进行特征提取并同时实现高效降维;签名识别方面,使用基于Hadamard纠错编码方法的ECOC支持向量机多类分类方法,并引入近似概率对ECOC解码进行改进,以提升多类分类器的性能。实验结果表明此方法的可行性和有效性。  相似文献   

14.
一种改进的模糊支持向量机的人脸识别方法   总被引:2,自引:0,他引:2  
宋晓宁  束鑫 《微机发展》2005,15(3):23-25,28
文中在样本区域性分析的基础上,将模糊支持向量机(Fuzzy Support Vector Machine,FSVM)、三叉决策树以及最近邻分类相结合并应用于人脸识别。在ORL人脸库上的实验结果表明,用该分类器算法进行人脸识别比单独使用模糊支持向量机具有更快的速度和更高的精度。  相似文献   

15.
该文针对短语音(语段时长小于等于1s)和易混淆语音的语种识别进行研究。选取东方多语种识别竞赛数据集为实验数据集,对比了音素对数似然比特征、梅尔频率倒谱系数特征、深度瓶颈层特征(DBF)在短语音及易混淆语种识别中的性能,证明DBF在两种识别任务中均具有较好的性能。为提升识别准确率提出DBF-I-VECTOR语种识别改进系统,该系统分别将基线DBF-I-VECTOR系统的短语音识别等错误率最优结果从12.26%降低为10.55%,易混淆语音识别等错误率(EER)最优结果从5.53%降低为2.86%。在对比改进系统后端的余弦距离(CDS)、概率线性判别分析(PLDA)、支持向量机(SVM)、极端梯度提升(XGBoost)、随机森林(RF)分类性能时发现RF在短语音任务中分类效果最好,SVM在易混淆任务中分类效果最好。  相似文献   

16.
一种联合语种识别的新型大词汇量连续语音识别算法   总被引:1,自引:1,他引:0  
单煜翔  邓妍  刘加 《自动化学报》2012,38(3):366-374
提出了一种联合语种识别的新型大词汇量连续语音识别(Large vocabulary continuous speech recognition, LVCSR)算法,并构建了实时处理系统. 该算法能够充分利用语音解码过程中收集的音素识别假设,在识别语音内容的同时识别语种类别.该系统可以应用于多语种环境,不仅可以以更小的系统整体计算开销替代独立的语种识别模块,更能有效应对在同一段语音中混有非目标语种的情况,极大地减少由非目标语种引入的无意义识别错误,避免错误积累对后续识别过程的误导.为将语音内容识别和语种识别紧密整合在一个统一语音识别解码过程中,本文提出了三种不同的算法对解码产生的音素格结构进行调整(重构):一方面去除语音识别中由发音字典和语言模型引入的特定目标语种偏置,另一方面在音素格中包含更加丰富的音素识别假设.实验证明, 音素格重构算法可有效提高联合识别中语种识别的精度.在汉语为目标语种、汉英混杂的电话对话语音库上测试表明,本文提出的联合识别算法将集外语种引起的无意义识别错误减少了91.76%,纯汉字识别错误率为54.98%.  相似文献   

17.
用于手写数字识别的改进模糊支持向量机   总被引:1,自引:0,他引:1  
针对训练样本在训练过程中的不同作用和支持向量机在推广到多类问题时存在不可分区域,可构造两类模糊支持向量机,其分别克服了过学习问题和减少了不可分区域.构造两类问题和多类问题综合的改进模糊支持向量机并用于手写数字识别,训练时,其利用数据与其类中心的相对距离定义隶属函数,测试时,利用S.Abe定义的隶属函数判别其类别,实验结果表明,该学习机具有比传统支持向量机和模糊支持向量机更高的精度.  相似文献   

18.
李楠 《计算机与现代化》2012,(7):104-106,110
针对光照变化引起的人脸识别问题,提出一种区域光照人脸识别方法。首先采用区域划分技术将人脸图像分为4个区域,以区域范围内的灰度变化作为光照影响人脸显示的度量值,对受光照影响区域进行频域光照归一,再以区域为单位采用支持向量机进行识别,最后对识别结果进行融合。实验表明,该方法可以在光照变化条件下获得较好的人脸识别率。  相似文献   

19.
正交拉普拉斯语种识别方法   总被引:1,自引:2,他引:1  
杨绪魁  屈丹  张文林 《自动化学报》2014,40(8):1812-1818
提出了一种正交拉普拉斯语种识别方法,即在提取语音的i-vector后,采用正交局部保持投影进行子空间映射,将信号整体空间映射到语言信息加信道信息子空间,然后对映射后的矢量进行信道补偿处理,最后用支持向量机进行识别. 尽管i-vector最大限度地保留了语音的声学信息,但是并没有发现这些信息之间的内在结构. 利用正交局部保持投影在去除声学无关信息的基础上,进一步发现声学特征的内在结构,能够有效地提高特征的区分性. 在对NIST LRE 2003测试数据库实验后,发现新方法相较于基线系统来说,平均代价降低了28.91%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号