首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
置信度判决是现代语音识别系统中重要的后处理模块,能够基于语音识别结果及相关信息有效地实现识别错误检测和集外词拒识等功能。本文主要针对受限命令词语音识别系统中的置信度提出两种改进方案,分别是基于高斯混合模型的音素相关置信度得分规整,以及传统置信度特征和时长特征的融合。在中英文测试集上的实验结果表明,上述两种改进方案相对于置信度基线系统的性能都能够获得显著的性能提升,且在性能提升上具有可叠加性。  相似文献   

2.
置信度的原理及其在语音识别中的应用   总被引:5,自引:2,他引:5  
由于置信度模型可以有效地判断观测数据与语音模型之间的匹配程度,因此可以用来对语音识别结果进行假设检验,定位识别结果中的错误,从而提高系统的识别率和稳健笥,讨论了语音识别中置信度的基本原理,、在值方法、模型性能评价方法、比较全面地介绍了置信度在语音识别中的各种,实验结果表明,置信度在语音识别的搜索的剪枝过程、说话人自适应以及拒识和验证方法面都有显的作用。  相似文献   

3.
语音识别系统的确信度判决用于对未登录词(Out-of-Vocabulary,OOV)的拒识.本文提出了一种有效的确信度判决的方法.在本方法中包含了两种模型:填充模型和噪声模型.填充模型能对无关语音进行拒识;噪声模型则用于强化对噪声的拒识,联合使用两种模型起到了较好的拒识效果.这两种模型中使用的声学模型单元均利用基本识别器已有的模型单元,无须额外的训练数据和单独训练.本文设计了一遍识别过程,识别和确信度判决在一次过程中完成,使系统的运算量增加极小.实验结果表明该方法能有效地处理OOV问题.  相似文献   

4.
维吾尔语音节语音识别与识别基元的研究   总被引:1,自引:0,他引:1  
王昆仑 《计算机科学》2003,30(7):182-184
1 引言现代维吾尔语(以下简称维语)是维吾尔族人民的主要交际工具,是我国新疆维吾尔自治区的法定工作用语之一,也是新疆其它少数民族共同的交际用语之一。维语属阿尔泰语系,突厥语族。维语语音有元音8个、辅音24个。由辅音和元音构成维语语音音节,每个音节必须且只能有一个元音,单元音可构成音节。维语句子由词构成。句子中有意群重音和句重音。部分音节在语流中产生语流音变现象,常见的有同化、弱化、脱落以及元音和谐等现象。  相似文献   

5.
本文提出一种基于词格信息的置信度计算方法,估计自适应语音识别结果的可靠性,将不可靠的语音从自适应训练集中去掉,从而减小无监督自适应与有监督自适应间的性能差异,提高无监督自适应的性能。  相似文献   

6.
一种基于置信度的边缘检测方法   总被引:1,自引:0,他引:1  
应龙  宋海娜  粟毅 《计算机仿真》2005,22(10):195-198
该文针对传统的边缘检测方法不能同时利用像素梯度的相位信息和幅度信息的缺点,提出一种基于边缘置信度的边缘检测算法.首先,由中心象素的梯度方向确定标准模板,然后将归一化的数据矢量和标准模板的相关系数的绝对值定义为边缘置信度.在确定像素局部极值点的时候利用了非极大抑制的方法;在确定边缘点的时候用了磁滞阈值处理.在两种处理过程中,将归一化的梯度幅度和边缘置信度都作为判别依据,既增加了对弱边缘的检测能力,同时,还能很好的抑制噪声的影响.  相似文献   

7.
VQ/HMM二级音节识别的研究   总被引:1,自引:0,他引:1  
HMM技术在语音识别是得到较为成功的应用,然而VQ/HMM对在词表的识别速度及识别率仍不理想,文中根据系统实现中的实时性和识别率的要求,提出了初始码本均匀法,对参加训练的各音先对其求平均,然后用各音的平均值组成初始矢量的空间,并采用码本快速迭代法以及标号直方图法与HMM识别相结合的二级识别方法,提高了系统的识别率和识别速度,此方法简单,易于实时化。  相似文献   

8.
语音拒识技术是实现一个实用语音识别系统的关键。提出了一种新颖的基于置信度的非特定人语音识别拒识算法,该算法同时考虑了备选假设模型和多候选的信息,适用于拒识不正确的识别结果和词表外(OOV)语音。在一个非特定人英语命令词识别系统中做了一些相关的实验来评估这个算法的性能。实验结果表明,该算法可以有效地去除识别不可靠的语音,提高语音识别的整体性能。  相似文献   

9.
wordlattice是与词图(wordgraph)结构类似但是结构没有词图致密的在小任务语音识别的情况下较为常见的一种中间输出结构,给出了在wordlattice结构上的语音识别置信度估计的一种算法。以lattice结构中的连接弧作为计算单元,给出了利用前后向算法高效计算lattice中每个弧的词后验概率及以其为基础计算每个词的置信度的算法。  相似文献   

10.
11.
In this paper,an approach of keyword confidence estimation is developed that ewll combines acoustic layer scores and syllable-based statistical language model(LM)scores.An a posterioir(AP)confidence measure and its forward-backward calculating algorithm are deduced.A zero false alarm(ZFA) assumption is proposed for evaluating relative confidence measures by word spotting task.In a word spotting experiment with a vocabulary of 240 keywords,the keyword accuracy under the AP measure is above 94%,which well approaches its theoretical upper limit.In addition,a syllable lattice Hidden Markov Model(SLHMM) is formulated and a unified view of confidence estimation.word spotting,optimal path search,and N-best syllable re-scoring is presented ,The proposed AP measure can be easily applied to various speech recognition systems as well.  相似文献   

12.
为提高现有小波去噪法的处理效果,准确有效判断出连续语音中各个音节的起止点,提出了基于分形理论的算法。该算法首先利用分形维与小波变换相结合的动态阈值算法进行语音去噪,从而提取出尽可能纯净的语音信号;在此基础上,计算分形维轨线,根据其均值对音节分割点进行判定。实验结果表明,该算法较好地实现了语音去噪和音节分割,鲁棒性较好,使得系统在低信噪比情况下仍保持较高准确率,在语音识别方面有较好应用前景。  相似文献   

13.
置信度判别嵌入式隐马尔可夫模型人脸识别   总被引:2,自引:0,他引:2  
为了提高人脸识别率,提出了一种优化置信度的判别嵌入式隐马尔可夫(EHMM)人脸识别方法。提出的方法基于假设检验,通过最小化检验错误率得到优化置信度判别式训练准则。在优化置信度判别式训练准则的前提下,通过参数估计求解判别式转换矩阵,提取出具有判别性、低维度的图像特征,确保观察样本能正确地分配到其对应的模型状态,以提高所训练出的EHMM模型的正确识别率。理论分析证明了优化置信度判别式训练准则的有效性,详细的实验及与现有方法的比较结果表明,提出的识别方法具有更好的识别性能。  相似文献   

14.
针对目前生活中涌现的海量语音数据,人们对语音检索技术准确度的要求越来越高。主要研究了汉语连续语音检索任务中,基于转换音节网格的研究方法。针对语音检索系统中置信度计算的问题,提出了一种基于音节间互信息的置信度计算方法,并将其用于网格结构的语音检索系统中。该方法能够有效地利用上下文之间的互信息量,从而更准确、合理地描述汉语语言模型。实验结果表明,用提出的方法建立转换音节网格来进行语音检索,其检出率(FOM)比后验概率法和N-best法有较大幅度的提高。得到的汉语语音检索系统其FOM最高可以达到83.7%。  相似文献   

15.
提出上下文音节为拼接单元,生成自然语音的一种维吾尔语语音合成方法。上下文音节有效地整合了邻近音节内外的音联现象,可以避免大部分协同发音影响。采用基于时域平滑技术对合成语音进行平滑处理,减少在拼接点处的语音失真和突变,从而提高了合成语音的自然度。  相似文献   

16.
A log-index weighted cepstral distance measure is proposed and tested in speacker-independent and speaker-dependent isolated word recognition systems using statistic techniques.The weights for the cepstral coefficients of this measure equal the logarithm of the corresponding indices.The experimental results show that this kind of measure works better than any other weighted Euclidean cepstral distance measures on three speech databases.The error rate obtained using this measure is about 1.8 percent for three databases on average,which is a 25% reduction from that obtained using other measures,and a 40% reduction from that obtained using Log Likelihood Ratio(LLR)measure.The experimental results also show that this kind of distance measure woks well in both speaker-dependent and speaker-independent speech recognition systems.  相似文献   

17.
孙成立 《计算机应用研究》2010,27(10):3841-3843
介绍了一种基于分而治之的语音识别错误纠正方案,首先利用混淆网络把连续语音识别问题转换为顺序的、独立的分类子任务。每个分类子任务可看做是孤立词识别问题,通过训练专门的支持向量机来区分混淆网络的识别候选。提出了一种快速的基于码本转换的语音向量对齐方法,解决了变长语音向量无法直接作为支持向量机输入的问题。通过一个普通话音节识别任务的实验结果表明,该方案能有效提高系统的正确率。  相似文献   

18.
语音识别的精度不够高始终是限制其广泛应用的瓶颈。针对具体应用中关键词汇和短语有限的特点,提出了音节相似度的概念,通过计算语音识别结果与应用域关键短语集合的音节相似度,找出最匹配结果,可有效提高语音识别应用的成功率。提出音节相似度的概念,给出利用音节相似度设计开发校园网语音浏览系统的过程。  相似文献   

19.
Uninterrupted wide range operations are salient features of the process industries. Characteristics including nonlinearity, time-delay, and inertia, of industrial control loops are always significantly changed with the working conditions. To qualify the nonlinear degree, a nonlinearity measure based on the minimum variance lower bound ratio is presented in this paper. This measure belongs to the data-driven class, and can be applied to Hammerstein structure, Wiener structure and Wiener–Hammerstein structure, whether the controller is linear or nonlinear. The effectiveness and consistency of this measure are illustrated through five simulation tests. An industrial case in the fossil fuel power generation process is studied to confirm the practicability of the proposed measure.  相似文献   

20.
The need of suitable measures to find the distance between two probability distributions arises as they play an eminent role in problems based on discrimination and inferences. In this communication, we have introduced one such divergence measure based on well-known Shannon entropy and established its existence. In addition to this, a new dissimilarity measure for intuitionistic fuzzy sets corresponding to proposed divergence measure is also introduced and validated. Some major properties of the proposed dissimilarity measure are also discussed. Further, a new multiple attribute decision-making (MADM) method based on the proposed dissimilarity measure is introduced by using the concept of TOPSIS and is thoroughly explained with the help of an illustrated example on supplier selection problem. Finally, the application of proposed dissimilarity measure is given in pattern recognition and the performance is compared with some existing divergence measures in the literature.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号