期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李立永张连海《信息工程大学学报》2013,14(6):692-699

针对当前主流的基于统计模型的语音识别系统没有使用语音产生知识的问题,通过模拟人类的语音感知理解过程提出了一种“自下而上”的基于区分性特征的音素识别方法.该方法首先根据不同音素的发音特点检测得到音素的边界信息;然后利用分类器完成语音的区分性特征检测,并根据区分性特征与音素的对应关系建立映射表;最后利用音素的边界信息得到语音段的特征序列,通过对语音段的特征序列模糊搜索匹配实现音素识别.实验结果表明,相比于传统的基于隐马尔科夫模型的音素识别方法,该方法在识别速度、鲁棒性及可扩展性等方面具有明显优势. 相似文献

2.

便于语音识别的汉语音素发音口形定型化处理

黄中伟刘明辉徐明冯杉杉高建伟《深圳大学学报(理工版)》2007,24(4):404-405

分析汉语普通话发音的29个基本音素,对m,n,l等3个音素的发音进行改造,形成了由16个定口型音和13个动口型音组成的音素体系,有助于减轻非母语系者学习中文及智障人士语音识别的学习负担. 相似文献

3.

基于数据融合的唇形特征识别

吴涛王蒙军杨珉李刚《河北工业大学学报》2009,38(3)

特征融合技术综合了参与融合的多类特征的有效鉴别信息,使得合成的新特征向量具有更强的分类能力.将提取到的唇形区域的几何特征向量和由离散余弦变换描述子表述的唇形轮廓特征向量进行特征融合,形成新的特征向量,应用隐马尔可夫模型进行特征向量的学习和识别,从而综合利用两类特征的鉴别信息,提高唇形识别的效果.实验研究了45°视角下的唇形识别,基于独立汉字发音的实验结果表明,综合两类特征所形成的新特征向量比单纯采用任何一种特征向量都能够提高唇形识别的效果. 相似文献

4.

基于HMM的声调语音模型研究

下载免费PDF全文

易雪蓉黄巍胡迪蒋怡《武汉工程大学学报》2018,40(6):691-695

针对声韵母相同但声调不同的近音字识别问题和声韵母及声调都相同的同音字识别问题,提出在语音模型和语言模型中分别引入声调和字转移概率,以提高近音字和同音字的识别率。首先将声调划分为5种表现形式添加到汉语音节的最后一个音素中构成新音素,使用高斯混合隐马尔科夫模型建模新音素。然后通过统计方法计算特定语境下的字间转移概率。最后使用HTK工具包实现了带声调的语音模型和有字转移概率的语言模型。实验结果证明添加声调可以提高近音字的识别率,使用特定语境下字间转移概率可以提高同音字的识别率。相似文献

5.

保留过渡段信息的MPLPC汉语语音合成方法研究

谭志强《哈尔滨工业大学学报》1994,26(4):66-70

在已研制的ＭＰＬＰＣ规则合成系统的分析与改进的基础上，提出了采用保留语音相邻音素间过渡段信息为合成单元，对稳态音素进行帧压缩，用ＭＰＬＰＣ和音调调制，按规则合成较高质量的汉语单音节语音方法。相似文献

6.

英语辅音音素学习对策

刘卫红《中原工学院学报》2000,(Z1)

从汉语出发 ,比较英汉两种辅音音素的发音部位及发音动作 ,从而使学习者找到英语辅音正确的发音位置及动作 ,以提高英语语音的学习质量 . 相似文献

7.

英语元音音素学习对策

邢爱云郑寄民《河南纺织高等专科学校学报》1999,(3):38-41

本从汉语出发,比较英汉两种元音语音音素的发音部位、发音动作,从而使学习找到正确的发音位置、动作,以提高英语语音的学习质量。相似文献

8.

基于数据融合的唇形特征识别

吴涛王蒙军杨珉李刚《湖北工业大学学报》2009,38(3):68-71

特征融合技术综合了参与融合的多类特征的有效鉴别信息,使得合成的新特征向量具有更强的分类能力．将提取到的唇形区域的几何特征向量和由离散余弦变换描述子表述的唇形轮廓特征向量进行特征融合,形成新的特征向量,应用隐马尔可夫模型进行特征向量的学习和识别,从而综合利用两类特征的鉴别信息,提高唇形识别的效果．实验研究了45°视角下的唇形识别,基于独立汉字发音的实验结果表明,综合两类特征所形成的新特征向量比单纯采用任何一种特征向量都能够提高唇形识别的效果．相似文献

9.

基于汉语声母韵母发音模型的语音识别

鲍欣张英芳等《西北工业大学学报》1992,10(2):174-180

每个汉字的发音都是由声母、韵母两部分构成的，声母部分发音时音短，信号变化剧烈；而韵母部分发音时间长、信号相对比较平稳。传统的孤立字识别方案是以线性预测系数作为语音模型系数，用动态时间弯折算法进行模式匹配，但它不完全适用于汉语的单音节识别。本文中利用语音信号相邻帧间LPC距离的变化进行声母、韵母分割，并根据声母、韵母的不同特性分别建立模式，提高了声母部分在整个音节模式中的比重，同时大幅度降低了模式的数据量，实验结果表明，汉语单音节的识别速度较传统的PLC/DTW算法提高一倍以上，识别正确率达到95%。相似文献

10.

基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究 总被引：1，自引：0，他引：1

吕国云蒋冬梅张艳宁赵荣椿 Hichem Sahli 《西北工业大学学报》2008,26(2):173-178

提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states Dynamic Bayesian Network, SM-DBN)模型,以实现大词汇量连续语音识别和音素切分.该模型在Bil m es等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Network, Phone-sh ared,SS-DBN-P)模型(识别基元为词)基础上,增加了一个隐含的状态节点层,每个词由它的对应音素组成,而音素采用固定个数的状态描述,状态和观测向量直接连接.它的识别基元为音素,描述了音素的动态发音变化过程.大词汇量语音识别的实验结果表明:在纯净语音环境下 ,SM-DBN模型的识别率比HMM和SS-DBN-P模型的识别率分别提高了13.01%和35.2%,而音频流的音素切分正确率则分别提高了10%和44%. 相似文献