首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
结合维吾尔语的语音特征和语义信息,在大量电话语音语料库的基础上,以建立维吾尔语连续音素识别平台为目标,通过构建隐马尔科夫模型工具HTK(Hidden Markov Model Toolkit)工具实现了维吾尔语连续音素识别算法:首先根据具体技术指标完成了较大规模电话语音语料库的录制和标注工作;确定音素为基元,通过训练获得了每个音素的HMM(Hidden Markov Model)声学模型,随后对输入的语音进行识别,声学模型在不同的高斯混合数目下,得出了识别结果;统计了32个音素的识别率并对它进行分析,为了进一步提高识别率奠定了基础。  相似文献   

2.
基于最小合成单元的维吾尔音库设计   总被引:1,自引:1,他引:0  
为了实现容量小、可懂度和自然度较好的波形拼接式维吾尔语语音合成系统,结合维吾尔语的特点,完成了文本设计、录音、语音标注、以及音库建设过程。其中,把音节作为基本的合成单元建立了音节语音库;为了弥补音库中不存在音节的合成问题,又建立了音素作为合成单元的音素语音库。实验结果表明,以音节和音素为最小合成单元的波形拼接式维吾尔语语音合成系统除了音库容量相对少等特点之外,还具有良好的可懂度。  相似文献   

3.
本文基于谱包络参数对孤立音节频域分段的常用分段方法进行了较为系统的分析和比较,在此基础上提出了基于离散卡洛变换(KLT)的谱压缩分段法和以段内离散度最小,段间离散度最大为准则的聚类分段方法.实验表明,采用这两种方法后,对汉语孤立音节的分段效果均有相当程度的提高,从而为汉语语音的音素分段和特征提取提供了新的手段和方法。  相似文献   

4.
本文研究了一种结合"声学信息"和"音素配位学信息"进行语言辨识的新算法,首先在预处理中对语音进行自动分段,在特征层上引入带有长时信息的段级特征参数--段级移位差分倒谱,在模型层上利用高斯混合模型(Gaussi-an Mixture Model,GMM)将语音信号自动标识为符号序列,进而引入多元语言模型(Multi-gram Language Model,MLM)来对"音素配位学信息"进行建模,最后将"GMM得分"和"MLM得分"送入后端多分类支持向量机模型得到最终识别结果.相关实验表明,新系统不需手工标识的语料,识别速度快,对OGI标准语料库中的五种语言获得了开集正识率为78.84%的结果.  相似文献   

5.
给出了基于TMS320C6711 DSP和G.729A语音压缩标准的实时语音压缩和解压系统的设计方案,并给出了系统的软、硬件设计.在TMS320C6711高速平台上实现数字语音信号的实时输入、压缩、解压、输出,只需要移植应用程序,就可以实现其他语音功能的扩展.  相似文献   

6.
新型语音压缩编解码器AMBE2000   总被引:4,自引:0,他引:4  
AMBE2000是美国DVSI公司推出的一种具有专利技术的语音压缩/解压芯片。利用该芯片能进行全双工的压缩和解压 ,从而以极高的压缩率提供高品质的语音质量。文中介绍了它的主要特点、引脚功能、控制接口及应用电路  相似文献   

7.
徐凡  杨剑峰  颜为之  王明文 《信号处理》2021,37(10):1860-1871
方言语音识别是方言保护的核心环节。传统的方言语音识别模型缺乏考虑方言语音中特定方言音素的重要性,同时缺少多种语音特征提取及融合,导致方言语音识别性能不高。本文提出的端到端方言语音识别模型充分发挥了残差CNN(Convolutional Neural Networks)和Bi-LSTM(Bi-directional Long Short-Term Memory)分别在语音帧内和帧间特征提取的优势,并利用多头自注意力机制有效提取不同方言中特定方言音素信息构成语音发音底层特征,利用该方言发音底层特征进行方言语音识别。在基准赣方言和客家方言两种方言语音语料库上的实验结果表明本文提出的方言语音识别模型显著优于现有基准模型,通过对注意力机制的可视化进一步分析了模型取得性能提升的根本原因。   相似文献   

8.
用1/3音节作匹配基元研究汉语单字音识别[Ⅰ]   总被引:1,自引:0,他引:1  
本文通过对汉语语音特点的分析,结合数字信号处理的有关理论,提出了用1/3音节作匹配基元进行汉语单字音识别的方法。它是按汉语音节结构将单字音分成三个匹配基元进行识别的,然后再把结果相拼组成单字音。这种方法介于音素识别和音节识别之间。小字库(104个音节)实验表明:该方法基本上保持了音素识别法的运算量,存贮量低的优点:同时也保持了音节识别法的识别率较高的优势,是一种值得探索的方法。本文主要介绍该方法的原理及韵母识别部分的实验结果。  相似文献   

9.
本文介绍了一种以DSPTMS320F2812为核心的电力数据处理系统,采用静态哈夫曼编码对采集的电力数据文件进行压缩。给出静态哈夫曼编码的数据压缩方法以及主要的硬件构成框图。该系统耗电低,处理速度快,实时性强。  相似文献   

10.
汉语连续语音识别中不同基元声学模型的复合   总被引:1,自引:0,他引:1  
张辉  杜利民 《电子与信息学报》2006,28(11):2045-2049
该文研究由不同声学基元训练的声学模型的复合。在汉语连续语音识别中,流行的基元包括上下文相关的声韵母基元和音素基元。实验发现,有些汉语音节在声韵母模型下有更高的识别率,有些音节在音素模型下有更高的识别率。该文提出一种复合这两种声学模型的方法,一方面在识别过程中同时使用两种模型,另一方面在识别过程中避开造成低识别率的模型。实验表明,采用本文的方法后,音节错误率比音素模型和声韵母模型分别下降了9.60%和6.10%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号