首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
维吾尔语音节语音识别与识别基元的研究   总被引:1,自引:0,他引:1  
王昆仑 《计算机科学》2003,30(7):182-184
1 引言现代维吾尔语(以下简称维语)是维吾尔族人民的主要交际工具,是我国新疆维吾尔自治区的法定工作用语之一,也是新疆其它少数民族共同的交际用语之一。维语属阿尔泰语系,突厥语族。维语语音有元音8个、辅音24个。由辅音和元音构成维语语音音节,每个音节必须且只能有一个元音,单元音可构成音节。维语句子由词构成。句子中有意群重音和句重音。部分音节在语流中产生语流音变现象,常见的有同化、弱化、脱落以及元音和谐等现象。  相似文献   

2.
维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK(HMMToolKit)工具实现了基于隐马尔可夫模型(HMM)的维吾尔语连续语音识别系统。在声学层,选取三音子作为基本的识别单元,建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在语言层,使用了适合于维吾尔语语音特征的基于统计的二元文法语言模型。最后,利用该系统进行了维吾尔语连续语音识别实验。  相似文献   

3.
为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个语音库上进行实验,采用一种非监督的词切分方法对维吾尔语单词进行词切分,生成子字。实验结果表明,基于子字单元的维吾尔语语音识别可以获得更好的识别结果。  相似文献   

4.
基于快速神经网络算法的非特定人语音识别   总被引:4,自引:0,他引:4       下载免费PDF全文
提出一种用于语音识别的改进的快速神经网络算法 ,即动态不等步长的误差分段学习算法。将步长看作误差和网络节点输出的函数 ,对各权值按不同步长进行动态调整 ,并将其应用于一个基于前馈神经网络模型的非特定人语音识别系统。实验表明 ,该算法比传统 BP算法在训练速度上可提高十几倍 ,训练出的语音识别网络系统具有较高的识别率  相似文献   

5.
本文介绍了一种基于TMS320C6711 DSP的非特定人、孤立词语音识别系统。本文首先介绍了语音识别技术的基本原理,然后对不同的识别算法在多种嵌入式系统平台上进行性能分析和比较,可得到本语音识别系统具有较高的识别率、实时性和鲁棒性。  相似文献   

6.
维吾尔语广播新闻连续语音敏感词检索系统   总被引:1,自引:0,他引:1  
首先介绍语音信号来源于新疆人民广播电台维吾尔语新闻的敏感词语音语料库的建设。然后用该语料库进行基于HMM的模型训练。模型训练中详细介绍识别基元端点检测、特征提取、矢量量化、码本构建、HMM模型训练过程和结果。最后用该语料库和HMM训练模型对维吾尔语广播新闻连续语音信号进行敏感词检索,并对检索结果进行分析。  相似文献   

7.
基于HTK的维吾尔语连续语音声学建模   总被引:2,自引:1,他引:2  
维吾尔语属于阿勒泰语系突厥语族,是黏着性语言。本文根据维吾尔语的特点,分析设计了维吾尔语语音识别系统的总体结构,讨论了维吾尔语最佳识别基元的选择方法,提出建立基于决策树聚类的上下文相关模型,并采用混合高斯分布(GMD)拟合观测概率分布,优化维吾尔语连续语音中HMM模型系统以提高识别性能。最后给出实验对比,得出结论,为今后维吾尔语连续语音识别研究提供依据。  相似文献   

8.
田岚  董春阳 《控制与决策》1997,12(2):142-145
运用Walsh变换对语音信号进行分析,得到了语音信号的Walsh域特征——2D自由度功率谱特征。利用此特征采用神经元网络法对汉语数字音0~9进行不定人语音识别,结果表明,该特征不仅能给出足够的识别信息,而且由于Walsh变换只有加/减运算,因而在识别速度方面比常用的频域特征有明显提高。  相似文献   

9.
鉴于维吾尔语丰富的形态变化产生大量单词引起的集外词(out of vocabulary,OOV)问题,为了定量研究OOV对维吾尔语语音识别的影响,采用控制语料库测试集OOV的算法及最佳文本挑选算法对不同OOV的测试集进行实验,算法通过Python语言实现.应用该算法进行电话语音库的文本转写,构建了维吾尔语的电话语音库.实验结果表明,该控制测试集OOV的方法能够有效地提高维吾尔语语音识别率.  相似文献   

10.
近年来大词汇量连续语音识别技术得到了迅速的发展,国内外研究机构加大了对汉语和英语语音识别技术的研究,然而,维吾尔语语音识别技术的研究工作最近才起步。建立了面向大词汇量的维吾尔语语音语料库,研究了维吾尔语声学模型和语言模型建模技术、解码技术,进行了面向大词汇量的维吾尔语连续语音识别实验。对维吾尔语大词汇量连续语音识别技术进一步发展中存在的问题进行了讨论。  相似文献   

11.
讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设计电话语音监控系统并通过维吾尔语研讨了系统性能。为了便于比较,同时也讨论了量化距离(VQ)、加权量化距离(WVQ)及基线系统的识别。在50个目标人训练集,每人发话时间为20秒时,对10秒测试语音提案方法识别率对比于VQ和WVQ法分别提高了20.2%及16.7%。  相似文献   

12.
识别率和对环境的适应能力是一个语音识别系统的两个重要性能,常见的提高语音识别率的方法大多通过改进声音模型来获得较高的识别率,这往往造成声音模型的复杂化以及模型训练的困难。另外,在说话人和麦克风位置不固定等情况下,这些方法识别效果往往很差。文中提出了一种用多话筒分别识别一个语音,并用数据融合技术对识别结果进行处理的语音识别方法。初步的实验结果表明该方法不仅可以提高系统对环境的适应能力,而且在单个声音  相似文献   

13.
用于拟人机器人的嵌入式语音交互系统研究   总被引:3,自引:0,他引:3  
陈斌  郭大勇  施克仁 《机器人》2003,25(5):452-455
本文介绍了一种用于拟人机器人的嵌入式语音交互系统.系统采用高质量的语音 采集模块及语音输出模块,以高性能数字信号处理器(DSP)TMS320VC5402为硬件核心.HMM语音识别引擎以LPC倒谱及其差分分量作为语音特征表达,改进的Baum Welch重估算法完成了多观察值序列下的语音模板训练.同时进行了语音特征不同表达形式对识别结果影响的对比实验.系统外围控制程序完成识别结果提示以及与上位机的通讯.系统在词汇量为200的非特定人、孤立词识别上取得了很好的效果.  相似文献   

14.
语音识别中基于SFCM模糊聚类的矢量量化方法   总被引:3,自引:1,他引:3  
模糊聚类分析算法用隶属度确定样本所属类别,因其良好的效果而被广泛用于语音识别领域。文中提出了一种模糊聚类分析算法SFCM,并将其用于语音特征的矢量量化,最终形成码本尺寸为128的码本,用SFCM算法得到的码本分布合理,没有空类。采用此码本的误音识别实验表明了这种量化方法对语音识别的有效性。  相似文献   

15.
基于MFCCs滤波的电话语音识别的通道补偿方法   总被引:4,自引:0,他引:4  
韩纪庆  高文 《计算机学报》1998,21(12):1125-1130
本文提出一种基于MFCCs滤波的通道补偿方法RMFCC。它具有性能良好和运算简单的优点,在不失精度的前题下减少了计算代价。RMFCC的性能也优于CMS和二级CMS。通过讨论发现许多抑制通道噪声的方法从本质上说都是采用滤波的方法,我们也证实了抑制非常低的调制频率是进行顽健的电话语音识别的有效途径。  相似文献   

16.
维吾尔语的手语合成有助于改善维吾尔族聋哑人与听力正常人进行自然交流,也可以应用于计算机辅助维吾尔哑语教学、维文电视节目播放等方面。维文手语库是维吾尔语手语合成的基础。通过分析维吾尔手语的特点,采用关键帧插值技术来控制VRML虚拟人的手势动作,利用Visual C++和OpenGL环境实现了一个维吾尔文的手势编辑系统,通过手势运动数据驱动虚拟人来实时显示当前的手势状态。通过该系统,收集了常用的维吾尔语词汇及32个维吾尔字母的手势运动数据。  相似文献   

17.
汉语连续语音识别系统与知识导引的搜索策略研究   总被引:1,自引:0,他引:1  
从整体上介绍了汉语连续语音识别系统的基本原理,并重点对声学和语言两个层面的建模与搜索策略进行了分析.在对传统帧同步搜索算法进行研究的基础上,提出了基于统计知识的帧同步搜索算法SKB-FSS.它包含了三个主要的功能层次:基于归并的音节切分自动机产生确定的搜索边界点,由统计得到的差分状态驻留信息控制搜索过程中的状态转移,利用词搜索树控制音节候选的扩展规模并根据动态前向预测的方法进行合理而及时的路径剪枝.实验结果验证了该搜索策略的有效性.  相似文献   

18.
语音识别的顽健性与语音库的建立   总被引:1,自引:0,他引:1  
汉语语音识别在近十几年有很大进展,现今已有一些系统投入实际应用,并初步商品化。但是一些系统的顽健性较差,因而这方面的问题将成为今后语音识别研究的一项主要任务。为此我们建立了一个适用于语音识别顽健性研究的汉语语音库,并详细介绍了它的构成、特点和试验结果等。  相似文献   

19.
本文对神经网络语音识别中的语音特征提取、网络结构以及学习算法进行了初步的研究,提出了一种用于时特征矢量量化的简化和改进的自组织神经网络模型VQNN。VQNN中引入了动态规划法估计语音样本矢量的码本类中心初值并确定网络的初始权矩阵,可构造出256个量化等级的码本矢量。该方法具有较强的鲁棒性且矢量量化过程简单迅速。对28个地名的语音量化识别实验结果表明了这种量化方法对时识别的有性。  相似文献   

20.
VQ/HMM二级音节识别的研究   总被引:1,自引:0,他引:1  
HMM技术在语音识别是得到较为成功的应用,然而VQ/HMM对在词表的识别速度及识别率仍不理想,文中根据系统实现中的实时性和识别率的要求,提出了初始码本均匀法,对参加训练的各音先对其求平均,然后用各音的平均值组成初始矢量的空间,并采用码本快速迭代法以及标号直方图法与HMM识别相结合的二级识别方法,提高了系统的识别率和识别速度,此方法简单,易于实时化。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号