首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
荣传振  岳振军  王渊  杨宇 《信号处理》2015,31(10):1301-1306
论文针对传统的统计语言模型所面临的数据稀疏和估计严苛性问题,提出基于模糊表示的n-元语法模型,并将其应用于唇语识别系统中,结合隐马尔科夫模型(Hidden Markov Model),建立了新的唇动识别模型—HFM(HMM and Fuzzy Language Model)。利用教育部语言文字应用研究所计算语言学研究室研制的语料库在线系统,制作了一个小型语料库,进行了句子识别实验。实验结果表明,HFM可使单音识别率最高提高6.5%,句子识别率最高提高22.7%,另外,采用语言模型对文字流进行解析,而不再是盲目文字匹配,单一视觉流的解析精确度达68.7%。   相似文献   

2.
以Xilinx公司Virtex-II Pro为开发平台,实现了一个基于隐马尔可夫模型(Hidden Markov Model,简称HMM)非特定人的孤立词语音识别系统.系统采用改进的基于语音对数域能量变化率的实时端点检测算法,仅对检测的有声段语音进行特征提取和解码,减少了要处理的语音帧数.实验表明系统在150词条的情况下识别率达到97.3%,识别时间为1.42倍实时.  相似文献   

3.
本文主要对提高英语语音语料库自动切分准确性方法进行探讨,通过语音参数的选择、HMM(Hidden Markov Model)模型的初始化的问题、单音模型的修正、静音的添加和其模型的建立来提高英语切分的准确性,在实际运用中取得了较好的效果。  相似文献   

4.
以波形拼接式维吾尔语音合成系统研发为背景,在已建立的维吾尔语最小发音单位音节和音素作为合成基元的语音库基础上,对语料库中的所有音节、音素进行无损压缩,选择了运算速度快,便于实现的哈夫曼压缩。在解压过程中只解压人们所需的语音单元,而不需要解压整个语料库。实验结果表明,通过哈夫曼压缩算法对语料库进行压缩和解压,减小了语料库的占用空间,同时解压后的语音不失真,解压速度快。  相似文献   

5.
提出一种基于隐马尔可夫模型(Hidden Markov model,HMM)和人工神经网络(Artificial Neural Network,ANN)混合模型的汉语大词表连续语音识别系统。在混合模型系统中,多种模型协同工作。ANN负责建模音素发音物理特性,HMM联合语言学模型识别待识语料。这样,混合模型系统能够结合HMM和ANN两种模型的优点:HMM对时间序列结构建模能力强;ANN的非线性预测能力强,建模能力强,鲁棒性,便于硬件实现。实验结果表明,HMM/ANN混合模型系统有效结合了两种模型的优点,提高了识别率。  相似文献   

6.
基于经典隐马尔可夫模型的汉语连续语音识别系统   总被引:1,自引:0,他引:1  
该文构造了基于经典隐马尔可夫模型(Hidden Markov Model,HMM)的汉语连续语音识别系统,定量地分析与评价了经典HMM的性能。  相似文献   

7.
本文研究了一种结合"声学信息"和"音素配位学信息"进行语言辨识的新算法,首先在预处理中对语音进行自动分段,在特征层上引入带有长时信息的段级特征参数--段级移位差分倒谱,在模型层上利用高斯混合模型(Gaussi-an Mixture Model,GMM)将语音信号自动标识为符号序列,进而引入多元语言模型(Multi-gram Language Model,MLM)来对"音素配位学信息"进行建模,最后将"GMM得分"和"MLM得分"送入后端多分类支持向量机模型得到最终识别结果.相关实验表明,新系统不需手工标识的语料,识别速度快,对OGI标准语料库中的五种语言获得了开集正识率为78.84%的结果.  相似文献   

8.
汉语连续语音识别中不同基元声学模型的复合   总被引:1,自引:0,他引:1  
张辉  杜利民 《电子与信息学报》2006,28(11):2045-2049
该文研究由不同声学基元训练的声学模型的复合。在汉语连续语音识别中,流行的基元包括上下文相关的声韵母基元和音素基元。实验发现,有些汉语音节在声韵母模型下有更高的识别率,有些音节在音素模型下有更高的识别率。该文提出一种复合这两种声学模型的方法,一方面在识别过程中同时使用两种模型,另一方面在识别过程中避开造成低识别率的模型。实验表明,采用本文的方法后,音节错误率比音素模型和声韵母模型分别下降了9.60%和6.10%。  相似文献   

9.
针对现有的基于表示学习的语音情感计算算法中存在着限制条件单一的问题,且没有证明它们的有效性,提出了一种采用原子表示模型的语音情感识别算法。通过引入一个新的条件,称为原子分类条件。在这种条件下,对正确识别新的测试情感样本有较好的效果。现有的基于表示的分类算法以单一的稀疏表示方法为主,而提出的算法可以结合稀疏表示模型和其他的表示模型。该算法能够放宽适用条件的范围,使得原子表示模型适应更多分类任务。采集并建立了维吾尔语语音情感数据库。在该情感数据库上,分析维吾尔语情感语音的基本声学特征。通过对情感特征空间进行原子表示的映射变换,可以有效表示情感特征空间。经实验结果证明所提出的方法优于传统的方法,在维吾尔语情感语音数据库上达到了64.17%识别率。   相似文献   

10.
李伟  李媛媛 《电声技术》2011,35(7):42-44
针对目前汉语连续语音识别中英文识别问题,采用中英文混合建模的方法建立中英文混合模型.在分析已有语音识别系统的基础上,根据发音学的一些先验知识,提出一种基于主元音及英文音素序列混合的声学模型,同时利用最大似然规则训练出的声学模型,通过最小音素错误准则对声学模型进行区分性训练,更新得到最终的声学模型.在测试集上的结果表明,...  相似文献   

11.
基于最小合成单元的维吾尔音库设计   总被引:1,自引:1,他引:0  
为了实现容量小、可懂度和自然度较好的波形拼接式维吾尔语语音合成系统,结合维吾尔语的特点,完成了文本设计、录音、语音标注、以及音库建设过程。其中,把音节作为基本的合成单元建立了音节语音库;为了弥补音库中不存在音节的合成问题,又建立了音素作为合成单元的音素语音库。实验结果表明,以音节和音素为最小合成单元的波形拼接式维吾尔语语音合成系统除了音库容量相对少等特点之外,还具有良好的可懂度。  相似文献   

12.
维吾尔语属阿尔泰语系突厥语族,其共振峰频率参数是语音识别和语音合成的重要依据。首次运用实验语音学的基本理论和方法,在“维吾尔语语音声学参数数据库”的办公环境语料条件下,对维吾尔语四音节元音和谐词进行了统计分析,给出了维吾尔语元音共振峰频率参数和分布规律,并通过四音节元音和谐词实验结果,用实验数据验证了其共振峰频率分布的口耳之学规律。为参数式或波形拼接式语音合成系统中调整合成前的元音和谐问题提供了重要的参考依据。  相似文献   

13.
根据语音合成与识别等语音应用研究的需求,从文本分析模块入手,从"维吾尔语语音声学参数库"中选择了包含边音/l/的单音节、双音节、三音节以及多音节词[0](即四音节以及四音节以上的词),提取它的声学参数并进行统计分析,探讨了边音的声学特性,分别研究了边音在单音节及多音节词中时的以及边音出现在词中位置(词首、词中、词末)时的共振峰、音强和时长分布模式,得出了一系列结论,其目的是为了提高语音合成的自然度即更好地为自然语言处理服务。本项研究结果维吾尔语语言乃至整个阿尔泰语系语言的韵律研究具有较高的参考价值。  相似文献   

14.
The authors describe an architecture and search organization for continuous speech recognition. The recognition module is part of the Siemens-Philips-Ipo project on continuous speech recognition and understanding (SPICOS) system for the understanding of database queries spoken in natural language. The goal of this project is a man-machine dialogue system that is able to understand fluently spoken German sentences and thus to provide voice access to a database. The recognition strategy is based on Bayes decision rule and attempts to find the best interpretation of the input speech data in terms of knowledge sources such as a language model, pronunciation lexicon, and inventory of subword units. The implementation of the search has been tested on a continuous speech database comprising up to 4000 words for each of several speakers. The efficiency and robustness of the search organization have been checked and evaluated along many dimensions, such as different speakers, phoneme models, and language models  相似文献   

15.
维、汉、英是特点完全不同的文字。该文依据多层次语言判断和适当干预的多语言字符识别系统设计原则首次实现了维、汉、英混排文本识别系统。识别系统首先根据维、汉、英文字的各自特点实现字符块语言属性的初步判断,然后针对每种文字设计不同的字符切割算法。字符识别可信度用来判断字符语言属性和字符切分结果是否正确。实验结果表明,各种维、汉、英混排文本识别率达到96.4%以上。  相似文献   

16.
通过分析维吾尔文字母自身的书写特点,为了进一步提高识别率,在原先的外围轮廓特征基础上,再提取了附加笔划形状特征、字母上下左右密度比例特征、笔画数特征以及主体部分和附加部分的位置关系特征,进行了诸多特征有效组合下的字母识别实验。其中,最高识别率达到了75.7%,比原先在单个特征下的识别率提高了近10个百分点。这表明,不同特征的有效组合是可行的,而且具有继续研究的潜力。  相似文献   

17.
维吾尔语是黏着语,词汇量较多,容易出现未登录词问题并且属于低资源语言,导致维吾尔语的端到端语音识别模型性能较低。针对上述问题,该文提出了基于多任务学习的端到端维吾尔语语音识别模型,在编码器层使用Conformer并与链接时序分类(CTC)相连接,通过BPE-dropout方法形成鲁棒性更强的子词,以子词和字作为建模单元,同时进行多任务训练和解码。实验结果分析发现,子词作为建模单元能有效解决未登录词问题,多任务学习模型能在低资源环境下较充分利用数据,学习到丰富的时序语音特征信息,进一步提升模型的识别性能。在公开的维吾尔语语音数据集THUYG-20上与基线相比把子词错误率和字错误率分别降低7.3%和3.8%。   相似文献   

18.
命名实体识别在自然语言处理实践中具有高度重要的作用,而且也是信息提取等各种自然语言方式的基础工具.本文采用条件随机场模型(Conditional Random Fields,CRF)对维吾尔语音乐实体识别进行初步的探讨.首先维吾尔语网站上收集数据,进行一系列预处理后得到纯文本,然后制定语料标注规则对实体进行人工标注,再利用上下文、关键字、词典等一系列特征进行训练,制定一个适合的模板来进行音乐实体的识别.实验结果证明,此方法在维吾尔语音乐领域不仅可行、而且有效.  相似文献   

19.
为了更好地为口语语言处理服务,首次从实验语音学的角度出发,对维吾尔语中的长元音进行了声学分析。实验结果表明维吾尔语中的长元音虽然在一定条件下读音比一般元音长一些,但并未形成长短对立,因此没有音位意义,它只是起到保持词语节律性的要素;维吾尔语中的长元音有时候具有区别词义的作用,但这种情况不多。对维吾尔语中的这种元音长读现象进行声学分析便于定论维吾尔语是否存在长元音。  相似文献   

20.
基于GMM-UBM模型的语言辨识研究   总被引:3,自引:0,他引:3  
屈丹  王炳锡  魏鑫 《信号处理》2003,19(1):85-88
与说话人识别、连续语音识别相比,自动语言辨识是一个相对较新的研究,而且是一项较难的课题。本文给出了一种基于GMM-UBM模型的语言辨识系统,并利用OGI-TS电话语音库对算法的性能进行了测试,然后给出了实验结果。实验结果表明,该算法也是进行语言辨识的一种有效方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号