首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
维吾尔语元音的声频特性分析和识别   总被引:2,自引:0,他引:2  
维吾尔语属阿尔泰语系突厥语族,由于其构词法的特点,八个元音的声频特性在语音识别中,尤其是识别基元选取中有重要作用,其共振峰频率参数也是语音识别和语音合成的重要依据。运用实验语音学的基本理论和方法,在维吾尔语综合语音数据库的办公环境语料条件下,对维吾尔语八个元音进行了声频特性统计分析,给出了维吾尔语元音共振峰频率参数和分布规律,并通过八个元音的语音识别实验结果,验证了其共振峰频率分布规律的正确性。实验证明:维吾尔语在排除元音和谐情况下,其声频特性具有很强的可区分性,对于实现语音信息的传送接受正确性很高。  相似文献   

2.
维吾尔语三音节词韵律特征声学分析   总被引:3,自引:0,他引:3  
本文从文本分析模块入手,利用“维吾尔语语音声学参数库”,选择了以开音节和闭音节结尾的333个三音节词的韵律参数,包括元音时长、音高和音强进行了统计分析,归纳了其元音时长、音高和音强分布模式,探讨了维吾尔语三音节词的韵律节奏模式与三音节词重音之间的关系问题,其目的是为了提高语音合成的自然度即更好的为自然语言处理服务。本项研究对维吾尔语语言乃至整个阿尔泰语系语言的韵律研究具有较高的参考价值。  相似文献   

3.
维吾尔语双音节词韵律特征声学分析   总被引:3,自引:0,他引:3  
该文从文本分析模块入手,利用“维吾尔语语音声学参数库”,选择了以开音节和闭音节结尾的969个双音节词的韵律参数,包括元音时长、音高和音强进行了统计分析,归纳了其元音时长、音高和音强分布模式,探讨了维吾尔语双音节词的韵律节奏模式与双音节词重音之间的关系问题,其目的是为了提高语音合成的自然度。我们相信本项研究对维吾尔语语言乃至整个阿尔泰语系语言的韵律研究具有较高的参考价值。  相似文献   

4.
汉语连续语音识别之音素声学模型的改进   总被引:2,自引:1,他引:1  
研究基于主元音音素基元的声学模型的改进。由于汉语语音特点,主元音模型得到了广泛的应用。通过分析主元音音素模型,发现该模型存在词组音节序列字界线有歧义,从而提出主元音的改进方法以明确音节序列中字的分界,减小基元规模,提高语音系统识别率。为了描述连续语意中的协同发音现象,还针对改进后的主元音基元,设计了相应的有调问题集,利用决策树的参数共享策略建立了上下文相关的音素模型。实验结果表明,改进后的有调音素集合在削减了原有基元个数的基础上,字误识率(CER)有0.4%-0.6%的明显改善。  相似文献   

5.
维吾尔语词首音节元音声学分析   总被引:1,自引:0,他引:1  
该文利用“维吾尔语语音声学参数数据库”,统计分析和归纳了维吾尔语词首音节元音的共振峰模式及其分布格局。声学元音图有多种画法,该文采用JOOS型声学元音图。这种元音图的特点是以F1为纵坐标,以F2为横坐标。这样绘制成的声学元音图与元音舌位图有很好的对应性。维语标准音词首音节中有[y, i, e, O, u, o, ;, A]等8个元音。舌位前后的分布特点是[u, o, A]为后元音,[y, i, e, O, ;]为前元音;开口度(舌位高低)分布特点是[y, i, u]为高元音,[e, O, o]为次高元音,[;]为次低元音, [A]为低元音.  相似文献   

6.
维吾尔语词切分方法初探   总被引:11,自引:9,他引:11  
维语词的词干-词附加成分切分、音节切分的规律对维吾尔语自然语言处理方面提供更多方便。本文提出了以“词=词根+附加成分”结构。维语附加成分种类繁多,连接形式各式各样,在句子中起着非常重要的作用,同时有相当的规律性。本文提出了维语中可能出现的基本语音规律的处理方法,如:语音同化、音节切分、语音和谐规律处理。本文对维文词的词法和语音法结构进行了归纳,提出了维语词切分的一些规律和实现方法。以新疆高校学报为语料来测试,对规则词准确率达到95%。  相似文献   

7.
维吾尔语双音节词元音格局研究   总被引:1,自引:0,他引:1  
从高自然度语音合成与高精度语音识别技术研究的实际应用需求出发,采用实验语音学的方法研究了维吾尔语双音节词中的元音格局。为此,从"维吾尔语语音声学参数库"中选取了包括维吾尔语元音的双音节词,并分别对词首音节和词尾音节中的元音共振峰频率值进行统计分析,利用Joos方法比较详细地归纳出了维吾尔语词首和词尾音节元音格局以及它们之间的区别,绘制出了维吾尔语双音节词元音的共振峰模式。首次用实际实验数据验证了维吾尔语元音舌位特点符合传统"口耳之学"结论。研究结果对维吾尔语语言乃至整个阿尔泰语系语言的语音研究及应用开发具有较高的参考价值。  相似文献   

8.
以维吾尔语为例研究自然语料缺乏的民族语言连续语音识别方法。采用HTK通过人工标注的少量语料生成种子模型,引导大语音数据构建声学模型,利用palmkit工具生成统计语言模型,以Julius工具实现连续语音识别。实验用64个维语母语者自由发话的6 400个 短句语音建立单音素声学模型,由100 MB文本、6万词词典生成基于词类的3-gram语言模型,测试结果表明,该方法的识别率为 72.5%,比单用HTK提高4.2个百分点。  相似文献   

9.
与说话人识别、连续语音识别相比,自动语言辨识是一个相对较新的研究,而且是一项较难的课题。与音素配位学相比较韵律是语言辨识的更有希望的一个语言辨识特征。论文介绍了一种基于伪音节结构CnV的自动语言辨识方法,该系统提取了辅音、元音构成的伪音节结构的MFCC和!MFCC特征参数,使用了与语言无关的GMM算法模型化该特征。经过对OGI-TS数据库中的英语、法语、汉语测试表明,元音、辅音特征信息在语言辨识中起到一定作用,伪音节结构模型也是语言辨识的有效模型之一。  相似文献   

10.
提出了基于互相关函数的检测元音的端点检测算法。在语音识别系统中产生错误识别的原因之一是端点检测有误差,在高信噪比情况下,准确地确定语音的端点并不困难,然而在低信噪比情况下,一些常规的端点检测方法,例如基于能量的端点检测方法就不能有效地工作。本文利用互相关函数检测元音的端点,然后根据元音和辅音的能量比一般相对稳定的特点确定出实际语音端点。实验结果表明,本方法可以在不同信噪比下提高端点检测的准确率。  相似文献   

11.
探讨了如何根据维吾尔语的语言、语音特征,对维语文语转换系统的文本进行分析和研究。通过对维吾尔语的音节、词等语音要素的了解,分析音节的组成结构(基本满足规则:Usyl=C+V+C+C)和词语结构。在此基础上总结出了音节划分规则、词根词缀的划分规则以及重音、停顿和语调变化规则,为进一步实现维吾尔语语音合成系统打下坚实的基础。  相似文献   

12.
针对当前关键词识别少资源或零资源场景下的要求, 提出一种基于音频自动分割技术和深度神经网络的关键词识别算法. 首先采用一种基于度量距离的改进型语音分割算法, 将连续语音流分割成孤立音节, 再将音节细分成和音素状态联系的短时音频片段, 分割后的音频片段具有段间特征差异大, 段内特征方差小的特点. 接着利用一种改进的矢量量化方法对音频片段的状态特征进行编码, 实现了关键词集内词的高精度量化编码和集外词的低精度量化编码. 最后以音节为识别单位, 采用压缩的状态转移矩阵作为音节的整体特征, 送入深度神经网络进行语音识别. 仿真结果表明, 该算法能从自然语音流中较为准确地识别出多个特定关键词, 算法易于理解、训练简便, 且具有较好的鲁棒性.  相似文献   

13.
该文介绍了在语音识别语言层搜索中为了实时化的需要所做的改进。文章应用词典树技术提高了从拼音到词的查找速度,并且使词典更易动态改动;同时采用多阶段搜索的框架,并在第一阶段搜索中采用一元剪枝和“2.5元”剪枝技术,极大提高了搜索速度。实验表明,在识别率没有受到影响的情况下,识别速度提高了近一倍。  相似文献   

14.
现代维吾尔语语音识别研究尚处于超始阶段,在此介绍了基于中心距离连续概率模型(CDCPM)的维吾尔语非特定人语音识别。CDCPM用中心距离正态(CDN)分布描述模型特征空间,去掉了HMM的状态转移概率矩阵A,对HMM进行了简化和改进。在维吾尔语综合语音库上进行的实验表明:恰当地估计模型状态数和模型混合密度数,当模型数为525个,模型状态数为16,混合密度数为24,维吾尔语非特定人语音识别首选正识率达到97.90%(集内)和94.76%(集外),取得了较好的识别效果。同时,指出了进一步开展维吾尔语语音识别研究的几个问题。  相似文献   

15.
音节是维吾尔语的最小发音单元,所以大部分维吾尔语语音合成系统以音节作为基本的合成单元,但维吾尔语中音节数量很大,语料库很难保证覆盖所有的音节样本,这会导致合成语音不稳定和不连续。为解决合成语音不稳定的情况,提出了结合单音素和三音素两个不同基元的单元挑选算法。通过在单元挑选模块中加入韵律参数相匹配的方法选出最佳韵律匹配的单元并解决了合成语音不连续的情况。实验结果表明,提出的方法有效地解决了合成语音不稳定和不连续的现象,从而提高了合成语音的自然度。  相似文献   

16.
汉语连续语音识别中经典HMM的实验评测   总被引:2,自引:1,他引:1  
定量地分析与评价经典隐马尔可夫模型(Hidden Markov Model,HMM)的性能,是汉语连续语音识别研究中尚未解决并且亟需解决的问题。文章构造了基于经典HMM模型的汉语连续语音识别系统。针对语音单元和输出概率这两个自由度上的各种组合,研究了经典HMM模型的复杂度、稳健性、精确性与训练集合的数据量、训练时间、解码效率等特性之间的关系;并且通过实验分析了多候选的构造和剪枝的意义。该文构造的系统与具有国内最高水平的 THEESP系统的识别率相当,所得实验结果和结论为汉语语音识别的深入研究提供了必要的参考和依据。  相似文献   

17.
基于模糊聚类神经网络的语音识别方法   总被引:8,自引:0,他引:8  
刘宇红  刘桥  任强 《计算机学报》2006,29(10):1894-1900
提出了一种基于模糊神经网络的语音识别方法.该方法以模糊系统模型为基础,利用改进的模糊聚类辨识算法,构成一种新型的模糊聚类神经网络(FCNN),并将其作为概率密度函数的估计器,对每个状态的输出进行预测.它不仅能有效地在语音识别中引入帧间相关信息,而且能克服状态输出概率密度函数为混合高斯分布的束缚.通过对非特定人汉语孤立词和连续音节的语音识别实验,证实了该方法的有效性.  相似文献   

18.
秦春香  黄浩 《计算机工程》2012,38(23):177-180
采用传统谱特征作为输入进行语音识别通常会受到声学环境差异的影响。为此,提出汉语和维语音素和音位的对应规则,并将这种规则应用于基于发音特征的语音识别系统。训练神经网络多层感知器,获取语音信号各类发音特征的后验概率,将其与美尔频率倒谱系数(MFCC)拼接后送入隐马尔科夫模型进行声学模型训练。将不同发音特征分别与传统MFCC特征进行组合并给出测试结果。实验结果表明,当汉语声带状况和送气发音特征与传统MFCC组合时,以及维语的发音方式和声带状况特征与MFCC组合之后,系统误识率较低。  相似文献   

19.
在2006年年底中央电视台曾经曝光了浙江工商行政管理局披露的4款不合格笔记本电脑,富士通的一款型号为LBP7120的机型便名列其中,然而就在315来临之际,本刊却收到多名读者爆料,反映这款笔记本目前在广州各大IT卖场并未受到任何管束,仍旧有大量产品在进行销售。对此我们也感到非常纳闷,为何一款被曝质量不合格的笔记本仍能在市场上大量销售,而且如此明目张胆呢?为了了解其中的真实情况,本刊记者特别对此展开了深入调查。[编者按]  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号