首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 156 毫秒
1.
目前山西的语音识别系统多数为普通话识别,对于该地区方言识别的准确率并不理想.针对这一问题,采集山西地方方言语音和语料建立语音库,根据山西各地方言发音的特点,构建山西地方方言的语音识别系统,以山西声韵母为基元,提取Mel倒谱系数(MFCC)的特征参数,选择隐马尔可夫模型(Hidden Markov Model,HMM),实现山西当地方言的语音识别系统.实验结果显示,针对差别小的小区域方言识别,HMM的识别率有很好的稳定性.  相似文献   

2.
基于语音配列的汉语方言自动辨识   总被引:9,自引:1,他引:9  
本文首先讨论了汉语方言辨识的依据及特征选取的基本原则,并由此导出了区间差分倒谱特征。然后利用GMM符号发生器和N元语言模型及ANN建立了一个方言辨识系统,该系统与传统的语种识别系统相比,具有以下特点:第一,系统不需要标注好的语音库,从而降低了汉语方言语音库建设的劳动强度和要求;第二, GMM符号化器计算量远远低于音素辨识器,从而提高了方言辨识速度,便于今后实时处理。第三,具有更高的辨识效果和更好的容错性。汉语普通话和三种方言辨识实验结果表明,系统平均辨识率可以达到83.8%。  相似文献   

3.
基于差分特征和高斯混合模型的湖南方言识别   总被引:1,自引:0,他引:1       下载免费PDF全文
语音的韵律是区分汉语方言的重要语音声学特征,而语音的差分特征是语音韵律的重要体现。采用差分特征ΔMFCC和ΔΔMFCC作为特征参数,用高斯混合模型(GMM)作为训练模型,通过计算测试样本的似然概率来识别方言的类型。用该方法对长沙方言、邵阳方言、衡阳方言和普通话进行了识别研究,并与采用MFCC作为特征参数的识别效果进行了比较。实验结果表明差分特征具有识别率高、抗噪声性能更好等优点。  相似文献   

4.
方言的差异性在语音层面上反映在时间序列结构的不同。传统的语音建模方法只能建立稳定的时间序列结构,而方言语音是典型的动态时变时间序列结构。为了更好地提取方言时间序列结构,文中采用动态贝叶斯网路(DBN)进行建模分析,并对DBN的构建方法进行了研究,这种结构与常用于语音识别中的隐马尔可夫模型的不同之处在于它揭示多个时间片内的节点之间的影响。文中探索了不同结构和参数对识别效果的影响。文中的研究表明动态贝叶斯网络对汉语方言的识别比传统方法要好,识别率达到了98.9%。  相似文献   

5.
为了提高方言语音识别效果,提出一种基于深度学习的方言语音识别模型。首先结合CTC和Attention架构的互补特点,构建基于端到端的混合CTC/Attention语音识别模型;其次构建多样化的方言数据库作为训练和测试数据,然后在特征提取基础上,利用混合CTC/Attention语音模型对方言进行识别。结果表明,该模型无论是在识别准确率、错误率,还是在模型收敛性和整体识别结果上,基于混合CTC/Attention语音识别模型的识别效果更好。  相似文献   

6.
本文介绍了一个拥有2000个说话者的面向移动电话应用的粤语语音数据库,该语音库用于电话应用方面的语音识别研究。在简单介绍本语音数据库的开发背景后,着重介绍了该语音库的结构、内容、特点和注释规范。  相似文献   

7.
语音识别的顽健性与语音库的建立   总被引:1,自引:0,他引:1  
汉语语音识别在近十几年有很大进展,现今已有一些系统投入实际应用,并初步商品化。但是一些系统的顽健性较差,因而这方面的问题将成为今后语音识别研究的一项主要任务。为此我们建立了一个适用于语音识别顽健性研究的汉语语音库,并详细介绍了它的构成、特点和试验结果等。  相似文献   

8.
语音识别赋予了计算机能够识别出语音内容的功能,是人机交互技术领域的重要研究内容。随着计算机技术的发展,语音识别已经得到了成熟的发展。但是关于方言的语音识别还有很大的发展空间。中国是一个幅员辽阔、人口众多的国家,因此方言种类繁多,其中有3000多万人交流使用的重庆方言就是其中之一。采集了重庆方言的部分词语的文本文件和对应的语音文件建立语料库,根据重庆方言的发音特点,选取重庆方言的声韵母作为声学建模基元,选取隐马尔可夫模型(Hidden Markov Model, HMM)为声学模型设计了一个基于HMM的重庆方言语音识别系统。在训练过程利用语料库中训练集语料对声学模型进行训练,形成HMM模型库;在识别过程利用语料库中的测试集语料进行识别测试。实验结果表明,该系统能够实现重庆方言的语音识别,并且识别的正确率为100%。  相似文献   

9.
方言研究领域中的语音研究、词汇研究及语法研究是方言研究的三个重要组成部分,如何识别方言词汇,是方言词汇研究首要的环节。目前,汉语方言词汇研究的语料收集与整理主要通过专家人工整理的形式进行,耗时耗力。 随着信息技术的发展,人们的交流广泛通过网络进行,而输入法数据包含海量的语料资源以及地域信息,可以帮助进行方言词汇语料的自动发现。然而,目前尚没有文献研究如何利用拼音输入法数据对方言词汇进行系统化分析,因此在本文中,我们探讨借助中文输入法的用户行为来自动发现各地域方言词汇的方法。特别的,我们归纳得到输入法数据中表征方言词汇的两类特征,并基于对特征的不同组合识别方言词汇。最后我们通过实验评价了两类特征的不同组合方法对方言词汇识别效果的影响。  相似文献   

10.
目前,汉语识别已经取得了一定的研究成果.但由于中国的地域性差异,十里不同音,使得汉语识别系统在进行方言识别时识别率低、性能差.针对语音识别系统在对方言进行识别时的缺陷,构建了基于HTK的衡阳方言孤立词识别系统.该系统使用HTK3.4.1工具箱,以音素为基本识别单元,提取39维梅尔频率倒谱系数(MFCC)语音特征参数,构建隐马尔可夫模型(HMM),采用Viterbi算法进行模型训练和匹配,实现了衡阳方言孤立词语音识别.通过对比实验,比较了在不同因素模型下和不同高斯混合数下系统的性能.实验结果表明,将39维MFCC和5个高斯混合数与HMM模型结合实验时,系统的性能得到很大的改善.  相似文献   

11.
基于动态时间规整和神经网络的方言辨识研究   总被引:3,自引:2,他引:1       下载免费PDF全文
汉语方言辨识技术的研究不仅有利于提高方言语音识别系统的识别效率,而且对于公安部门的刑事侦查等方面都具有非常重要的应用价值。以湖南方言作为研究对象,对不同方言特征的差异及方言辨识中特征参量的合适选取进行了深入研究。针对语音信号具有很强的随机性而神经网络的输入结构相对固定等特点,提出了基于动态时间规整和神经网络的方言辨识方法。实验结果表明,选取相同的特征参数时对不同类别或不同声调的方言的辩识率不同。  相似文献   

12.
A primary challenge in the field of automatic speech recognition is to understand and create acoustic models to represent individual differences in their spoken language. Individual’s age, gender; their speaking styles influenced by their dialect may be few of the reasons for these differences. This work investigates the dialectal differences by measuring the analysis of variance of acoustic features such as, formant frequencies, pitch, pitch slope, duration and intensity for vowel sounds. This paper attempts to discuss methods to capture dialect specific knowledge through vocal tract and prosody information extracted from speech that can be utilized for automatic identification of dialects. Kernel based support vector machine is utilized for measuring the dialect discriminating ability of acoustic features. For the spectral feature shifted delta cepstral coefficients along with Mel frequency cepstral coefficients gives a recognition performance of 66.97 %. Combination of prosodic features performs better with a classification score of 74 %. The model is further evaluated for the combination of spectral and prosodic feature set and achieves a classification accuracy of 88.77 %. The proposed model is compared with the human perception of dialects. The overall work is based on four dialects of Hindi; one of the world’s major languages.  相似文献   

13.
一个面向语音识别的云南民族口音普通话语音数据库   总被引:2,自引:0,他引:2  
介绍了一个以语音识别为目的的云南民族口音普通话语音数据库。当前,语音识别技术要走向实用必须解决用户情况多样性带来的鲁棒性问题,通常把这个问题简要地归结为“男女老幼”和“南腔北调”。作为民族文化大省的云南,共有25个少数民族,广大少数民族同胞在说普通话时明显带有地方民族口音,云南民族口音普通话语音识别研究是用户情况多样性研究的重要内容,而为之建立云南民族口音普通话语音数据库是该研究的重要基础和先决条件。  相似文献   

14.
该文选取具有代表意义的藏语卫藏方言的拉萨话、安多方言的夏河话以及康方言的德格话进行语言调查;整理归纳藏语三大方言音系,包括单辅音、复辅音、单元音、复合元音和辅音韵尾,以及三大方言声调;依照SAMPA的规则建立适合于藏语三大方言的机读音标,并设计了SAMPA_ST的自动标注系统,实现文音转换功能,为语音的韵律特征分析和语音工程的研究提供依据。  相似文献   

15.
HMM算法框架在银行语音服务中的实现   总被引:2,自引:0,他引:2  
邵央  冯哲  李宗葛 《计算机工程》2000,26(11):126-128
语音识别尤其是电话语音识别技术得到了广泛的应用。介绍了用Dialogic卡采集电话语音,并且采用HMM算法框架实现语音识别器,构建一个实用的银行语音服务系统。最后给出了该系统的测试结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号