首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 828 毫秒
1.
基于GMM符号化和置信判别的汉语方言自动辨识研究   总被引:2,自引:0,他引:2  
近年来汉语方言自动辨识研究有了初步进展,但由于缺乏带有语音标注的方言音库,性能优越的并行音素识别-语言模型(PPRLM)方法尚未得到研究和运用.本文借助高斯混合模型(GMM)符号化器把PPRLM的思想方法引入到汉语方言辨识中,并通过融合置信判别使系统能够用于开集辨识.仿真实验表明,本文方法具有很高的稳定性和可靠性,综合性能较为优越.  相似文献   

2.
文章提出了一种融合声学、音素配位和韵律特征等多信息融合的汉语方言辨识系统,分析了将语言信息转化为这些特征的实验方法,在此基础上,根据汉语方言辨识的特点,提出了一种基于概率模型的多信息辨识机制,实验结果表明,韵律特征对于短时语音具有很好的辨识效果,而音位配列特征对于长时语音更加有效。对于汉语三种方言的辨识,融合这三种特征的辨识率达95%。  相似文献   

3.
基于SOM神经网络和支持向量机的方言辨识   总被引:2,自引:0,他引:2       下载免费PDF全文
建立了一个基于SOM神经网络和支持向量机(SVM)的汉语方言辨识系统。该系统以湖南方言作为研究对象,借助SOM神经网络对不同方言的MFCC特征参量进行聚类,并用SVM作为最终的决策辨识器。实验结果表明:该系统与传统系统相比实时性和辨识率较好,特别适用于信噪比低的情况。  相似文献   

4.
提出了一种新的方言码本模型辨识系统。该方法利用半监督的思想对方言语音数据进行矢量量化,形成具有监督信息的码本模型。有效解决了在汉语方言辨识中码本精度不高的问题,系统的识别率有了很大提高。实验结果表明带有监督信息的码本量化方法明显优于传统LBG矢量量化方法,对于汉语三种方言,辨识率可达94.23%,比传统码本辨识系统提高了近13%的正确辨识率。  相似文献   

5.
多用途汉语方言语音数据库的设计   总被引:1,自引:0,他引:1       下载免费PDF全文
建立了一个多用途汉语方言语音数据库,用于说话人信息处理、方言特征词识别、语音识别等领域的研究。以多通道的方式采集时长106小时的语音数据,包括七种主要的汉语方言区语音,对数据进行预处理。在此基础上提出了汉语方言数据库的设计标准以及实施方案,有助于推动汉语语音库特别是方言语音库的建立。  相似文献   

6.
基于动态时间规整和神经网络的方言辨识研究   总被引:3,自引:2,他引:1       下载免费PDF全文
汉语方言辨识技术的研究不仅有利于提高方言语音识别系统的识别效率,而且对于公安部门的刑事侦查等方面都具有非常重要的应用价值。以湖南方言作为研究对象,对不同方言特征的差异及方言辨识中特征参量的合适选取进行了深入研究。针对语音信号具有很强的随机性而神经网络的输入结构相对固定等特点,提出了基于动态时间规整和神经网络的方言辨识方法。实验结果表明,选取相同的特征参数时对不同类别或不同声调的方言的辩识率不同。  相似文献   

7.
提出了一种基于流形学习的特征提取方法,将流形学习有效地应用于汉语方言辨识。针对语音语谱特征空间维数较高的问题,利用局部线性嵌入(LLE)方法降维并与MFCC特征进行融合,融合结果作为新特征用于汉语方言辨识。仿真实验表明,LLE算法能够获取汉语方言的本征规律,融合后的特征能够有效地提高汉语方言辨识的正确识别率。  相似文献   

8.
高斯混合模型(GMM)是进行说话人无关的语言辨识的一种有效方法,高斯混合二元模型(GMBM)是GMM模型的二元时序扩展,该文在GMBM和GMM-UBM模型的基础上提出了一种基于GMBM-UBBM模型的语言辨识系统,并利用OGI-TS电话语音库对算法的性能进行了测试,然后给出了实验结果。实验结果表明,该算法也是进行语言辨识的一种有效方法,与传统的GMM-UBM算法相比,该算法最多可以获得4.378%的相对改善率。  相似文献   

9.
基于高斯混合模型的汉语方言辨识系统   总被引:1,自引:0,他引:1  
建立了一个基于高斯混合模型的汉语方言辨识系统,并给出了模型参数的估计方法,讨论了特征参数和高斯混合数对系统辨识的影响,实验结果表明,系统对同一省内的三种不同方言的辨识率平均可以达到84.17%。  相似文献   

10.
基于差分特征和高斯混合模型的湖南方言识别   总被引:1,自引:0,他引:1       下载免费PDF全文
语音的韵律是区分汉语方言的重要语音声学特征,而语音的差分特征是语音韵律的重要体现。采用差分特征ΔMFCC和ΔΔMFCC作为特征参数,用高斯混合模型(GMM)作为训练模型,通过计算测试样本的似然概率来识别方言的类型。用该方法对长沙方言、邵阳方言、衡阳方言和普通话进行了识别研究,并与采用MFCC作为特征参数的识别效果进行了比较。实验结果表明差分特征具有识别率高、抗噪声性能更好等优点。  相似文献   

11.
The shapes of speakers' vocal organs change under their different emotional states, which leads to the deviation of the emotional acoustic space of short-time features from the neutral acoustic space and thereby the degradation of the speaker recognition performance. Features deviating greatly from the neutral acoustic space are considered as mismatched features, and they negatively affect speaker recognition systems. Emotion variation produces different feature deformations for different phonemes, so it is reasonable to build a finer model to detect mismatched features under each phoneme. However, given the difficulty of phoneme recognition, three sorts of acoustic class recognition--phoneme classes, Gaussian mixture model (GMM) tokenizer, and probabilistic GMM tokenizer--are proposed to replace phoneme recognition. We propose feature pruning and feature regulation methods to process the mismatched features to improve speaker recognition performance. As for the feature regulation method, a strategy of maximizing the between-class distance and minimizing the within-class distance is adopted to train the transformation matrix to regulate the mismatched features. Experiments conducted on the Mandarin affective speech corpus (MASC) show that our feature pruning and feature regulation methods increase the identification rate (IR) by 3.64% and 6.77%, compared with the baseline GMM-UBM (universal background model) algorithm. Also, corresponding IR increases of 2.09% and 3.32% can be obtained with our methods when applied to the state-of-the-art algorithm i-vector.  相似文献   

12.
提出身份认证矢量(Identity vector,I-vector)结合韵律信息的汉语方言辨识方法。全差异空间替代本征音与本征信道空间,将高维超矢量映射为低维I-vector表示,并进行信道补偿与特征降维处理。汉语是有调语言,各方言在其韵律结构上具有明显差异,I-vector特征融合全局韵律信息,可有效增补各方言鉴别性。利用融合信息对闽、粤、吴等五种方言以及普通话进行辨识实验,等错率(Equal Error Rate,EER)达到8.01%,比高斯混合模型-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)降低56.2%,表明融合全局韵律信息的I-vector方法可有效提高汉语方言辨识正确率。  相似文献   

13.
Automatic Chinese text classification is an important and a well-known technology in the field of machine learning. The first step for solving Chinese text categorization problems is to tokenize the Chinese words from a sequence of non-segmented sentences. However, previous literatures often employ a Chinese word tokenizer that was trained with different sources and then perform the conventional text classification approaches. However, these taggers are not perfect and often provide incorrect word boundary information. In this paper, we propose an N-gram-based language model which takes word relations into account for Chinese text categorization without Chinese word tokenizer. To prevent from out-of-vocabulary, we also propose a novel smoothing approach based on logistic regression to improve accuracy. The experimental result shows that our approach outperforms traditional methods at least 11% on micro-average F-measure.  相似文献   

14.
一种纸币识别方法研究   总被引:1,自引:0,他引:1  
快速准确的纸币清分在银行业中具有非常重要的意义。清分系统包括纸币图像采集、图像预处理、特征提取及分类器设计等几个步骤,其中分类器设计是核心技术基础。论文提出了一种用于高速纸币清分的人民币识别方法,该方法基于整张纸币的特征提取,采用了基于结构风险最小化的高斯混合模型(GMM)设计识别分类器。实验结果表明,提出的方法取得了较高的识别率。  相似文献   

15.
汉语数字识别常用MFCC作为特征,针对0-9十个数字MFCC样本特征数据量大的问题,提出了用GMM模型对提取的特征参数MFCC的数据进行聚类来减少数据量,以GMM模型参数中的均值作为新的特征,采用动态规划算法进行汉语数字语音识别.仿真实验表明,进行GMM特征变换后的新特征数据为MFCC的30.9%,系统运行时间减少了2...  相似文献   

16.
方言研究领域中的语音研究、词汇研究及语法研究是方言研究的三个重要组成部分,如何识别方言词汇,是方言词汇研究首要的环节。目前,汉语方言词汇研究的语料收集与整理主要通过专家人工整理的形式进行,耗时耗力。 随着信息技术的发展,人们的交流广泛通过网络进行,而输入法数据包含海量的语料资源以及地域信息,可以帮助进行方言词汇语料的自动发现。然而,目前尚没有文献研究如何利用拼音输入法数据对方言词汇进行系统化分析,因此在本文中,我们探讨借助中文输入法的用户行为来自动发现各地域方言词汇的方法。特别的,我们归纳得到输入法数据中表征方言词汇的两类特征,并基于对特征的不同组合识别方言词汇。最后我们通过实验评价了两类特征的不同组合方法对方言词汇识别效果的影响。  相似文献   

17.
从线性预测(LP)残差信号中提出了一种新的特征提取方法,这种特征跟单个的说话人的声道密切相关。通过把HAAR小波变换运用于LP 残差而获得了一个新的特征(HOCOR)。为了进一步提高系统的鲁棒性和辨识率,在采用分级说话人辨识的基础上,将基音周期的高斯概率密度对GMM分类器的似然度进行加权,形成新的似然度进行说话人辨识。试验结果显示,所提出系统的鲁棒性和辨识率都有所提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号