期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

鄢志杰胡郁王仁华《中文信息学报》2008,22(2):99-105

本文提出了一种基于区分性准则的模型结构优化方法,用以调整HMM自动语音识别系统中声学模型各状态混合高斯核成分数量的分配。通过优化选定的准则,声学模型可以在使用相同参数数量的情况下得到更好的识别性能,也可以在保持相当性能的前提下降低所需要的模型参数。相对于传统的基于似然度及复杂度惩罚的模型结构优化准则来讲,基于区分性准则的优化方法能够更直接地提高模型的区分度和鉴别力,从而得到更好的识别效果。在一个面向嵌入式系统的中文连续数字串识别任务上的实验结果证明,基于最大互信息量准则的模型结构优化能够得到比传统的、基于模型似然度及复杂度的方法更好的识别效果。相似文献

2.

基于MCE准则的语音识别特征线性判别分析

陈斌张连海牛铜屈丹李弼程《自动化学报》2014,40(6):1208-1215

提出了一种基于最小分类错误（Minimum classification error,MCE）准则的线性判别分析方法（Linear discriminant analysis,LDA）,并将其应用到连续语音识别中的特征变换.该方法采用非参数核密度估计方法进行数据概率分布估计;根据得到的概率分布,在最小分类错误准则下,采用基于梯度下降的线性搜索算法求解判别分析变换矩阵.利用判别分析变换矩阵对相邻帧梅尔滤波器组输出拼接的超矢量变换降维,得到时频特征.实验结果表明,与传统的MFCC特征相比,经过本文判别分析提取的时频特征其识别准确率提高了1.41%,相比于HLDA（Heteroscedastic LDA）和近似成对经验正确率准则（Approximate pairwise empirical accuracy criterion,aPEAC）判别分析方法,识别准确率分别提高了1.14%和0.83%. 相似文献

3.

一种针对区分性训练的受限线性搜索优化方法 总被引：1，自引：0，他引：1

刘聪胡郁戴礼荣王仁华《模式识别与人工智能》2010,23(4):450-455

提出一种称为“受限线性搜索”的优化方法,并用于语音识别中混合高斯的连续密度隐马尔科夫(CDHMM)模型的区分性训练。该方法可用于优化基于最大互信息(MMI)准则的区分性训练目标函数。在该方法中,首先把隐马尔科夫模型(HMM)的区分性训练问题看成一个受限的优化问题,并利用模型间的KL度量作为优化过程中的一个限制。再基于线性搜索的思想,指出通过限制更新前后模型间的KL度量,可将HMM的参数表示成一种简单的二次形式。该方法可用于优化混合高斯CDHMM模型中的任何参数,包括均值、协方差矩阵、高斯权重等。将该方法分别用于中英文两个标准语音识别任务上,包括英文TIDIGITS数据库和中文863数据库。实验结果表明,该方法相对传统的扩展Baum-Welch方法在识别性能和收敛特性上都取得一致提升。相似文献

4.

一种文本相似度及其在语音识别中的应用 总被引：5，自引：1，他引：5

李红莲何伟袁保宗《中文信息学报》2003,17(1):60-64

随着语音识别研究的深入,提高通用识别引擎的精度变得越来越困难。但对具体的语音识别任务,结合相应的背景,采取相应的措施,有可能达到很理想的识别精度。在已知语音输入为某有限集元素之一的情形,利用文本在发音上的相似度可以大大提高识别的精度。本文对原有文本相似度的定义进行了改进与完善,并就其在语音识别任务中的作用进行了深入的研究。相似文献

5.

一种新的基于主题的语言模型自适应方法

任纪生王作英《中文信息学报》2006,20(4):84-89

基于主题的语言模型自适应方法应尽可能提高语言模型权重系数的更新速度并降低语言模型的调用量以满足语音识别实时性要求。本文采用基于聚类的方法实现连续相邻二元词对的量化表示并以此刻画语音识别预测历史和各个文本主题中心,依据语音识别历史矢量和各个文本主题中心矢量的相似度更新语言模型权重系数并摒弃全局语言模型。同传统的基于EM算法的自适应方法相比,实验表明该方法明显提高了语音识别性能和实时性,识别错误率相对下降5.1% ,说明该方法可比较准确地判断测试内容所属文本主题。相似文献

6.

语音识别中的一种说话人聚类算法 总被引：1，自引：1，他引：1

肖述才欧智坚王作英《中文信息学报》2005,19(4):85-89

本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR 距离作为距离测度的时候,该算法对句子的聚类正确率达85169 %;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。相似文献

7.

一种新的基于DCT变换的线性判别分析

黄国宏刘刚《计算机技术与发展》2008,18(6):97-100

对于高维复杂模式识别问题,传统的线性判别分析通常首先采用PCA变换来降低模式的维数,然后再求取最优判别矢量集.然而PCA变换是以判别信息的损失为代价的,故无法保证所提取的特征是最优的.DCT变换具有"能量聚集特性"和变换的保距特性,文中正是基于此特性,提出一种新的基于DCT变换的线性判别分析方法,同时,也给出了一种在该模型下的最优判别矢量集的直接求解方法.实验表明,文中算法具有计算速度快、识别率高的优点. 相似文献

8.

嵌入式语音识别系统的研究和实现 总被引：9，自引：1，他引：9

方敏浦剑涛李成荣台宪青《中文信息学报》2004,18(6):74-79

本文首先给出了一种适合于在嵌入式平台上实现的可变命令集的非特定人语音识别系统,同传统的基于PC的非特定人语音识别系统相比,该系统具备内存消耗小,运算速度快的优点。然后给出了该语音识别系统在多种嵌入式平台上的实现和评估结果,论证了非特定人语音识别系统在嵌入式平台上实现的可行性及其对硬件的最低配置要求,在技术层次上分析了目前实现高性能语音识别SOC的主要问题和困难,并指出了今后相关的研究方向。相似文献

9.

基于字形拓扑结构的甲骨文输入编码研究 总被引：4，自引：2，他引：2

顾绍通马小虎杨亦鸣《中文信息学报》2008,22(4):123-128

分析了甲骨文字形的拓扑结构特征,考虑了甲骨文字形、读音等因素,制作了甲骨文输入法的字形码表和拼音码表,设计了一种简便、有效的甲骨文输入编码方案,开发了甲骨文输入法程序,利用该程序可以通过两种途径来输入甲骨文字形,即拆分取码方法和现代汉字拼音方法,从而解决了从通用甲骨文字库中调出所需字形的问题。相似文献

10.

一种中文文档的非受限无词典抽词方法 总被引：20，自引：2，他引：18

金翔宇孙正兴张福炎《中文信息学报》2001,15(6):34-40

本文提出了一种非受限无词典抽词模型,该模型通过自增长算法获取中文文档中的汉字结合模式,并引入支持度、置信度等概念来筛选词条。实验表明:在无需词典支持和利用语料库学习的前提下,该算法能够快速、准确地抽取中文文档中的中、高频词条。适于对词条频度敏感,而又对计算速度要求很高的中文信息处理应用,例如实时文档自动分类系统。相似文献

11.

基于小波分析的大词汇汉语连续语音识别系统鲁棒性的研究 总被引：6，自引：0，他引：6

颜龙刘刚郭军《中文信息学报》2006,20(2):62-67

本文提出一种基于小波分析的大词汇汉语连续语音识别的方法,即采用一维小波变换将原始语音信号进行五层小波分解,然后对各层小波系数进行重构,得到五层语音信号,分别对各层语音信号进行训练,得到各层的声学模型,然后结合语言模型对各层声学模型的性能进行测试。通过对纯净语音和带噪语音的各层重构语音数据进行测试。结果表明对于含有高斯白噪声的带噪语音,该方法能使系统性能有所提高,但对于粉红噪声,该方法效果不明显。对于含有真实环境噪声的带噪语音,该方法能获得比基线系统更好的性能。相似文献

12.

分级语音识别研究

徐明星杨大利吴文虎《中文信息学报》2004,18(6):80-85

分级识别的策略在模式识别领域中提出相当长的时间了。尽管人类可以训练地使用这个策略进行识别,但对语音识别而言,缺少一个有效的系统化的方法来实现它。本文给出了我们最近在这方面做的一些研究工作,使用了子空间划分原理来实现一个分级识别器,并用树型结构来组织多个识别器。实验结果表明,该方法与传统方法相比,误识率降低10%。我们将在未来的研究工作中,测试全部汉语音节,并将该方法扩展到连续语音识别。相似文献

13.

>倒谱形状规整在噪声鲁棒性语音识别中的应用

杜俊戴礼荣王仁华《中文信息学报》2010,24(2):104-110

该文提出了一种新的用于鲁棒性语音识别的特征规整方法。我们观察到在噪声环境下语音特征分布的形状相比于干净环境变化很大,因此提出了一种称为倒谱形状规整的新方法,它是利用引入一个指数因子来达到对倒谱分布形状进行规整的目的。这种方法被证明在噪声环境下非常有效,特别是在低信噪比情况下。实验结果表明此新方法在aurora2和aurora3两个标准数据库上比经典的均值方差规整算法在词错误率方面分别有38%和25%的相对降低,并且倒谱形状规整也好于其它传统方法,比如直方图均衡和高阶倒谱矩规整方法。相似文献

14.

改进的线性判别分析及人脸识别 总被引：1，自引：0，他引：1

马平靳敬永孙玉胜《计算机与数字工程》2009,37(1):135-137

为有效解决传统LDA（线性鉴别分析）的小样本规模问题,提出一种改进的LDA算法。首先对样本进行无损降维;然后在Fisher准则基础上,用散度矩阵差代替散度矩阵的比值,避免对类内矩阵求逆的同时也降低了计算复杂度,实现有效的特征抽取;最后实现对人脸的识别。实验结果表明,该算法是有效的,优于传统LDA方法。相似文献

15.

语音识别准确率与检索性能的关联性研究

周梁高鹏丁鹏徐波《中文信息学报》2006,20(3):101-106

对海量语音进行基于内容的检索需要语音识别技术和检索技术的结合。本文通过调节语言模型的途径研究在不同识别率的语音识别文本上进行关键词检索的差异,由此研究语音识别性能和检索性能之间的关联性。通过对114小时语音数据的实验表明:语音识别性能与检索性能有一定的相关性,同时也说明改进检索的方法可以消除一部分由于语音识别所带来的误差。研究结果为进一步针对性地改进识别引擎、语音识别输出的表示和相应的快速检索方法提供了基础。相似文献