期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

冯丽娟吾守尔·斯拉木《现代计算机》2010,(1):4-7

维吾尔语连续语音识别技术研究主要阐述维吾尔语连续语音的识别技术．主要包括声学模型和语言模趋。在声学模型中,主要介绍基于隐马尔可夫模型（Hidden Markov Model,HMM）的维吾尔语筵续语音识别声学建模。在语言模型中,主要对比基于文法和基于统计这两种方法的优劣。相似文献

2.

基于HMM的维吾尔语连续语音识别系统

那斯尔江·吐尔逊吾守尔·斯拉《计算机应用》2009,29(7):2009-2011

维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK（HMMToolKit）工具实现了基于隐马尔可夫模型（HMM）的维吾尔语连续语音识别系统。在声学层,选取三音子作为基本的识别单元,建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在语言层,使用了适合于维吾尔语语音特征的基于统计的二元文法语言模型。最后,利用该系统进行了维吾尔语连续语音识别实验。相似文献

3.

语音识别中广义模型及其算法收敛性分析

张杰余志刚黄志同《计算机工程与应用》2000,36(2):60-62

语音识别中,动态时间规整（ＤｙｎａｍｉｃＴｉｍｅＷａｒｐｉｎｇ,简称ＤＴＷ）和隐马尔可夫模型（ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌ,简称ＨＭＭ）是最有效的两种识别算法,并且ＤＴＷ和ＨＭＭ在本质上是一致的~［１］。根据ＤＴＷ和ＨＭＭ的本质联系和各自所对应的声学模型,在前期工作中建立了一种广义声学模型 ~［２］［３］（ＧｅｎｅｒａｌＭｏｄｅｌ,简称ＧＭ）,并指出ＤＴＷ和ＨＭＭ只是ＧＭ的特例,且ＤＴＷ和ＨＭＭ都可以转化为ＧＭ。并在此基础上,首次将Ｆｉｓｈｅｒ算法~［４］引进ＧＭ的学习算法,确保了ＧＭ状态分割的收敛性,并且这种分割在最小离差意义上是全局精确最优的。最后,从大数定理的角度出发,对ＧＭ算法的收敛性进行了分析, 从理论上论证了该算法的依概率收敛性,并为实际应用中ＧＭ算法的有效性提供了理论依据。相似文献

4.

基于人机交互增强算法的便携语言翻译机系统研究

王馨悦周小天《自动化与仪器仪表》2023,(4):220-224

为了实现基于人机交互增强算法的便携语言翻译机系统,提出了一种基于傅里叶门控卷积神经网络的语音增强模型与一种基于FSMN+Transformer语音识别模型用于便携语言翻译机。首先,对便携语言翻译机系统进行了整体设计;然后,对系统的关键部分即语音增强模型和语音识别模型分别进行了设计,其中,语音增强模型选择傅里叶门控卷积神经网络优化算法来构建;语音识别模型中,选择矢量型FSMN作为声学模型的基础结构,并引入门控单元和残差网络对其进行优化,同时选择添加交互算法的Transformer算法构建语言模型,共同构成基于FSMN+Transformer的语音识别模型;最后,分别对语音增强模型、语音识别模型以及便携语言翻译机系统进行实验验证。结果表明：基于傅里叶门控卷积神经网络的语音增强模型更具优越性,FSMN+Transformer的语音识别模型的正确率最高,基于提出的语音增强与语音识别模型的便携语言翻译机系统对原始语音的翻译准确率都达到了99%以上。相似文献

5.

汉语语音听写机技术的研究与实现 总被引：3，自引：0，他引：3

郑方牟晓隆徐明星武健宋战江《软件学报》1999,10(4):436-444

文章从声学基元和词法树两个方面对连续语音识别和汉语语音听写机中声学层面的搜索策略进行了分析,提出了基于统计知识的帧同步搜索算法和基于词法约束的词搜索树结构,构成了声学层面的双层搜索网络.算法中利用了统计知识,包括声学层面的差分状态驻留信息和特征变化量信息等.实验结果表明,基于知识的搜索策略使连续语音识别的性能提高了36.6%.文章还介绍了N-Gram统计语言模型的修正退化频度估计算法和搜索算法原理.通过对多年研究成果的分析,实现了一个汉语语音听写机的引擎,并在PC机上构建了两个系统：非特定人汉语语音听写机相似文献

6.

语音识别中动态时间规整和隐马尔可夫统一模型 总被引：1，自引：0，他引：1

张焱张杰《数据采集与处理》1997,12(3):218-222

对于目前在语音识别中广泛使用的两种技术即动态时间规整（ＤＴＷ）技术和隐马尔可夫模型（ＨＭＭ）的本质联系，提出了二者的统一模型（ＤＨＵＭ，ＤＴＷａｎｄＨＭＭＵｎｉ－ｆｉｅｄＭｏｄｅｌ），并分别给出ＤＴＷ和ＨＭ向ＤＨＵＭ的转换关系。文中还提出了用ＤＨＵＭ解决更接近语音实际情况的高阶ＨＭＭ作语音识别时所面临的运算量过大的问题。中等词表的识别实验结果表明，建立在ＤＨＵＭ之上的识别器的识别性能不低于相似文献

7.

马尔可夫随机场在语音识别中的应用

傅国康赵荣椿刘志强《数据采集与处理》1999,14(4):433-437

为适应语音识别的需要,作者克服了传统隐马尔可夫模型（ＨＭＭ）只考虑当前观测符号之前状态的缺点,吸收其采用“隐含”层的处理方式,将其纳入马尔可夫随机场（ＭＲＦ）的框架,建立了一个基于ＭＲＦ的语音识别模型,并较详细地阐明了这个系统的训练和识别算法,重新定义了松弛标注算法中相应的支持函数。典型实验表明,ＭＲＦ模型较传统的ＨＭＭ有较高的识别率。在优化初始参数的条件下,两种模型的识别在同样的时间范围内。在训练脱机的情况下,ＭＲＦ模型有其明显的优势。相似文献

8.

基于动态时间规整和隐马尔可夫统一模型的无端点检测的汉语识别算法

张杰张焱黄志同《数据采集与处理》1998,(3)

根据汉语语音的特点，提出了一种无端点检测的语音识别算法。在识别过程中，该算法无需确定语音信号起止点位置，而是从寂静段开始，直接按帧提取特征（帧长２０ｍｓ，帧间重叠５０％），特征向量由１５阶倒谱系数和帧平均能量组成。在动态时间规整（ＤＴＷ）和隐马尔可夫（ＨＭＭ）统一模型（ＤＨＵＭ）中，引进寂静段自环，并用ＤＨＵＭ实现了该算法。对９９个相似汉语单字的识别实验表明：无端点检测的识别器正识率为９４．９５％，正识率下降很少，但不作端点检测却降低了算法的复杂程度。该算法中，若特征向量采用一种听觉模型特征，识别器具有更好的鲁棒性，识别率会略有提高。相似文献

9.

用于语音识别拒识的隐马尔可夫模型状态及状态驻留相关的声学置信量度 总被引：1，自引：0，他引：1

田斌田红心刘丹亭易克初《计算机研究与发展》1999,36(11):1398-1401

随着语音识别系统继续从实验室转向实际应用,语音拒识就变得愈来愈重要．为解决语音识别系统对识别候选的接受／拒识判决问题,文中提出了基于隐马尔可夫模型（ＨＭＭ）的语音识别系统中状态和状态驻留相关的声学置信量度准则．给定状态下特征矢量的平均观测先验概率和给定特征矢量状态的后验概率均比较容易设定统一的拒识门限,且不需专门的训练．而状态驻留分布相关法则是基于驻留分布概率和置信区间理论,不仅可设定一个拒识门限,同时可给出语音识别候选的状态驻留可信度．实验表明上述拒识准则能很好地拒识误识别候选和词表外语音（ＯＯＶ或非关键词）,从而在较低拒识率的情况下有效地提高系统的识别率相似文献

10.

基于HMM与RBF的混合语音识别新方法 总被引：5，自引：0，他引：5

何振亚顾明亮王太君史笑兴《数据采集与处理》1999,14(2):153-156

提出了一种隐马尔可夫模型（ＨＭＭ）和径向基函数神经网络（ＲＢＦ）相结合的语音识别新方法。该方法首先利用ＨＭＭ生成最佳语音状态序列,然后用函数逼近技术产生对最佳状态序列进行时间规正,最后通过ＲＢＦ神经网络进行分类识别。理论和实验结果表明,该系统比ＨＭＭ具有更好的识别效果,特别对提高易混淆词的识别性能尤为显著。相似文献