共查询到20条相似文献,搜索用时 78 毫秒
1.
本文提出一种基于词格信息的置信度计算方法,估计自适应语音识别结果的可靠性,将不可靠的语音从自适应训练集中去掉,从而减小无监督自适应与有监督自适应间的性能差异,提高无监督自适应的性能。 相似文献
2.
wordlattice是与词图(wordgraph)结构类似但是结构没有词图致密的在小任务语音识别的情况下较为常见的一种中间输出结构,给出了在wordlattice结构上的语音识别置信度估计的一种算法。以lattice结构中的连接弧作为计算单元,给出了利用前后向算法高效计算lattice中每个弧的词后验概率及以其为基础计算每个词的置信度的算法。 相似文献
3.
4.
文本倾向识别的置信度估计 总被引:1,自引:0,他引:1
由于置信度模型可以有效地判断观测数据与文本倾向模板之间的匹配程度,因此可以用在文本倾向识别中,有效地定位识别结果,从而提高系统的识别率和稳健性。该文讨论了文本倾向识别中的置信度的基本原理,介绍了假设检验和区间估计在文本倾向识别中的应用。 相似文献
5.
智能神经网络系统组成原理在语音识别中的应用 总被引:1,自引:1,他引:0
在语音识别实验中,应用智能神经网络系统组成原理,研究了以简单、功能单一的网络为基础,构造复杂、功能完善的智能神经网络系统的方法,同时,通过加入规则,提高了网络的知识能力,实验表明,智能神经网络系统组成原理将面向对象、符号逻辑融于神经网络中,提供了构造功能完备的智能系统的途径。 相似文献
6.
文章提出了一种抗噪声的语音特征。首先让语音信号的功率谱通过一组带通滤波器,再计算各滤波器输出的差分值。理论分析和实验一致证明,以此作为语音信号的特征,可以大幅度提高语音识别系统在噪声环境中的性能。 相似文献
7.
局域网并行处理在语音识别中的应用 总被引:1,自引:0,他引:1
在语音识别中,不论是训练语音识别系统,还是使用系统识别语音,都需要进行大量的数据处理,这使得语音识别的研究和实现都变的非常困难。本文提出一种基于局域网的分布式计算机系统的快速并行数据处理方法来实现语音识别的模型训练和语音的识别,不仅加 了训练和识别的速度,节约了大量的时间,而且降低了语音识别任务对硬件的要求,取得了满意的效果。 相似文献
8.
针对传统轮机模拟器的操作者身兼多职、人机交互复杂的问题,将语音识别技术应用于轮机模拟器。收集并制作轮机领域的语料库,提取语音信号的MFCC特征,基于Kaldi平台完成声学模型建立,使用SRILM工具建立语言模型并对比多元语言模型性能差异,针对语料稀疏问题使用Kneser-Ney平滑算法进行处理,建立用于操作轮机模拟器的语音交互系统。通过测试表明,能够实现使用语音操作轮机模拟器。 相似文献
9.
10.
11.
语音识别的顽健性与语音库的建立 总被引:1,自引:0,他引:1
方棣棠 《计算机应用与软件》1994,11(1):26-29
汉语语音识别在近十几年有很大进展,现今已有一些系统投入实际应用,并初步商品化。但是一些系统的顽健性较差,因而这方面的问题将成为今后语音识别研究的一项主要任务。为此我们建立了一个适用于语音识别顽健性研究的汉语语音库,并详细介绍了它的构成、特点和试验结果等。 相似文献
12.
本文介绍了在连续语音识别和语音机器翻译方面所进行的工作。我们已在中等词汇量范围、限定说话主题的条件下,实现了特定人的连续话句的识别。并实现了一个英汉语音翻译实验演示系统。 相似文献
13.
用于语音识别拒识的隐马尔可夫模型状态及状态驻留相关的声学置信量度 总被引:1,自引:0,他引:1
随着语音识别系统继续从实验室转向实际应用,语音拒识就变得愈来愈重要.为解决语音识别系统对识别候选的接受/拒识判决问题,文中提出了基于隐马尔可夫模型(HMM)的语音识别系统中状态和状态驻留相关的声学置信量度准则.给定状态下特征矢量的平均观测先验概率和给定特征矢量状态的后验概率均比较容易设定统一的拒识门限,且不需专门的训练.而状态驻留分布相关法则是基于驻留分布概率和置信区间理论,不仅可设定一个拒识门限,同时可给出语音识别候选的状态驻留可信度.实验表明上述拒识准则能很好地拒识误识别候选和词表外语音(OOV或非关键词),从而在较低拒识率的情况下有效地提高系统的识别率 相似文献
14.
本文介绍了以一种比较两个句子的新的有效算法为基础而编制的连续语音识别系统性能评估软件,它通过比较连续语音识别系统输出的若干句子和相应的标准句子,得到系统性能的定量数据。该软件的可靠性得到大量实验验证。 相似文献
15.
语音识别系统的确信度判决用于对未登录词(Out-of-Vocabulary,OOV)的拒识.本文提出了一种有效的确信度判决的方法.在本方法中包含了两种模型:填充模型和噪声模型.填充模型能对无关语音进行拒识;噪声模型则用于强化对噪声的拒识,联合使用两种模型起到了较好的拒识效果.这两种模型中使用的声学模型单元均利用基本识别器已有的模型单元,无须额外的训练数据和单独训练.本文设计了一遍识别过程,识别和确信度判决在一次过程中完成,使系统的运算量增加极小.实验结果表明该方法能有效地处理OOV问题. 相似文献
16.
17.
为实现文本/语音驱动的说话人头部动画,本文提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network, DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能,音素DBN模型和HMM的音素识别结果被影射成视素序列。在评价准则上,提出绝对视素切分正确性和基于图像与嘴唇几何特征两种相对视素切分正确性的评价标准。实验表明,DBN模型识别性能优于HMM,而基于视素的DBN模型能为说话人头部动画提供最好的口形。 相似文献
18.
This paper considers two measures of entropy for the Theory of Evidence and studies their properties. The first measure is based on the measures of entropy and specificity as defined by Yager. The other one may easily be applied to more general classes of fuzzy measures. 相似文献
19.
Palm PC 语音识别算法及实现 总被引:4,自引:0,他引:4
掌上型计算机(palm PC)是一种新型、灵巧的个人数字助理(PDA),由于其没有软健盘或手写体识别作为主要的输入手段,如果在该平台上提供类似于语音导航、声音拔号等功能,将大大改善人机交互界面,针对掌上型计算机这种应用需求,结合其运算速度慢、内存少等特点,讨论了最新设计的一个掌上型计算机语音识别核心算法及实现,包括基于时域能量的端点检测算法、基于神经网络的多可信度综合判决处理集外词、特征选择及定点 相似文献
20.
识别率和对环境的适应能力是一个语音识别系统的两个重要性能,常见的提高语音识别率的方法大多通过改进声音模型来获得较高的识别率,这往往造成声音模型的复杂化以及模型训练的困难。另外,在说话人和麦克风位置不固定等情况下,这些方法识别效果往往很差。文中提出了一种用多话筒分别识别一个语音,并用数据融合技术对识别结果进行处理的语音识别方法。初步的实验结果表明该方法不仅可以提高系统对环境的适应能力,而且在单个声音 相似文献