期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

徐明星杨大利吴文虎《中文信息学报》2004,18(6):80-85

分级识别的策略在模式识别领域中提出相当长的时间了。尽管人类可以训练地使用这个策略进行识别,但对语音识别而言,缺少一个有效的系统化的方法来实现它。本文给出了我们最近在这方面做的一些研究工作,使用了子空间划分原理来实现一个分级识别器,并用树型结构来组织多个识别器。实验结果表明,该方法与传统方法相比,误识率降低10%。我们将在未来的研究工作中,测试全部汉语音节,并将该方法扩展到连续语音识别。相似文献

2.

基于特征提取的中文检索方法研究 总被引：1，自引：0，他引：1

程华《福建电脑》2006,(12):36-36,23

本文介绍了布尔检索模型、概率检索模型、向量空间检索模型，详细分析了基于字、词、内容为提职特征的中文检索方法及各自的特点。相似文献

3.

汉语语音检索的集外词问题与两阶段检索方法 总被引：2，自引：0，他引：2

孟莎刘加《中文信息学报》2009,23(6):91-98

该文针对大规模汉语语音检索任务提出汉语语音检索中的集外词问题和针对集外查询词的两阶段检索方法。汉语语音识别和检索中,集外词可以以词表词序列的形式被识别和检索到,因此被认为不存在集外词问题;该文发现集外查询词性能远远低于集内查询词,将此问题定义为汉语语音检索任务的集外词问题,并提出两阶段的检索方法,第一阶段通过模糊音素匹配的方法提高查全率,第二阶段通过词格修正的方法提高查准率。实验表明,两阶段的检索方法极大的提高了典型集外查询词的检索性能,FOM指标相对基线系统提高了24.1%。相似文献

4.

连续汉语语音识别技术

张文国《自动化博览》1997,(6):21-22

计算机能听懂人的语言，这意味着人工智能时代已向我们走来c北京中自汉王科技公司在IBM支持下，基于ViaVoice自行开发的一种最新语音识别软件与手写输入系统——汉王听写系统，它把IBM研究开发的语音识别核心技术与汉三优秀的手写汉字识别输入系统完美的集成在一起．形成了一个优势互补的非键盘输入系统。成为一种简单方便，人人会用的文字录入工具。这不仅提高了汉字输入速度，而且使讲话人更自然、更流畅地表达自己的意愿。汉王听写系统，具有汉语语音听写输入、语音命令、编辑、打印功能，基于中文自身的特点，同音字多，有声调、词… 相似文献

5.

普通话广播语音的多层次标注与检索

章森华绍和《中文信息学报》2007,21(4):97-104

广播语音的自动识别、标注、检索等是涉及到语音技术、自然语言处理、信息检索等多个领域的综合性课题。在介绍了广播语音的自动标注与检索的研究概况并分析了其中涉及的关键技术基础上,提出了面向普通话广播语音的多层次自动标注框架以及基于多层次标注的语音检索方案,对文档层、句子层和词语层的标注属性进行了探讨,采用了递归标注方法对属性逐层细化,并讨论了对语音自动标注至关重要的语音识别引擎和语音流分割等问题。基于本文提出的方法,对10 小时的普通话广播语音资料进行了标注和检索,得到了比较满意的实验结果。相似文献

6.

广播电视语音识别现状与应用策略 总被引：1，自引：0，他引：1

下载免费PDF全文

崔朝阳王建纲《计算机工程与应用》2007,43(23):181-183

综合分析了与广播电视语音智能化处理相关的连续语音识别、关键词检出、语种识别以及固定音频检索技术的国内外发展现状,提出了计算机自动音频处理技术在一般应用条件下已经基本达到实用要求。在此基础上,分析了将自动音频处理技术应用于我国广播电视内容管理的应用前景。相似文献

7.

建立超大规模文献集检索的技术性研究

温丹丽刘春雨宋煜杨光红《微计算机信息》2007,23(36):230-231,182

本文针对具有海量数据的超大规模文献集检索问题，深入分析与探讨了信息检索的理论和方法，对容量巨大、响应时限要求高等特征的超大规模文献集设计了相关的检索方法，并阐述了该方法的实现过程及相关算法。相似文献

8.

WEB语音检索中查询概念纠错的研究

沈玺王永成《计算机仿真》2006,23(2):222-226

使用语音识别技术为搜索引擎提供语音查询接口,使得奇询概念的输入更为简便。但是,由于查询概念中存在大量的专有名词和名称,识别精度往往不高,影响搜索结果的准确率。该文提出一种在新闻领域内,利用新闻领域知识提高查询概念识别率的方法,通过计算语音识别结果与新闻概念库中概念的语音相似度确定备选结果,计算备选结果与辅助概念的新闻相关度来确定最终的查询概念。实验证明,该方法对新闻搜索引擎的查询概念的纠错收到了良好的效果。相似文献

9.

>倒谱形状规整在噪声鲁棒性语音识别中的应用

杜俊戴礼荣王仁华《中文信息学报》2010,24(2):104-110

该文提出了一种新的用于鲁棒性语音识别的特征规整方法。我们观察到在噪声环境下语音特征分布的形状相比于干净环境变化很大,因此提出了一种称为倒谱形状规整的新方法,它是利用引入一个指数因子来达到对倒谱分布形状进行规整的目的。这种方法被证明在噪声环境下非常有效,特别是在低信噪比情况下。实验结果表明此新方法在aurora2和aurora3两个标准数据库上比经典的均值方差规整算法在词错误率方面分别有38%和25%的相对降低,并且倒谱形状规整也好于其它传统方法,比如直方图均衡和高阶倒谱矩规整方法。相似文献

10.

基于语音增强失真补偿的抗噪声语音识别技术 总被引：1，自引：0，他引：1

丁沛曹志刚《中文信息学报》2004,18(5):65-70

本文提出了一种基于语音增强失真补偿的抗噪声语音识别算法。在前端,语音增强有效地抑制背景噪声;语音增强带来的频谱失真和剩余噪声是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿。实验结果表明,此算法能够在非常宽的信噪比范围内显著的提高语音识别系统在噪声环境下的识别精度,在低信噪比情况下的效果尤其明显,如对-5dB的白噪声,相对于基线识别器,该算法可使误识率下降67.4%。相似文献

11.

嵌入式语音识别系统的研究和实现 总被引：9，自引：1，他引：9

方敏浦剑涛李成荣台宪青《中文信息学报》2004,18(6):74-79

本文首先给出了一种适合于在嵌入式平台上实现的可变命令集的非特定人语音识别系统,同传统的基于PC的非特定人语音识别系统相比,该系统具备内存消耗小,运算速度快的优点。然后给出了该语音识别系统在多种嵌入式平台上的实现和评估结果,论证了非特定人语音识别系统在嵌入式平台上实现的可行性及其对硬件的最低配置要求,在技术层次上分析了目前实现高性能语音识别SOC的主要问题和困难,并指出了今后相关的研究方向。相似文献

12.

语音识别中的一种说话人聚类算法 总被引：1，自引：1，他引：1

肖述才欧智坚王作英《中文信息学报》2005,19(4):85-89

本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR 距离作为距离测度的时候,该算法对句子的聚类正确率达85169 %;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。相似文献

13.

汉语大词汇量连续语音识别系统研究进展 总被引：6，自引：1，他引：5

倪崇嘉刘文举徐波《中文信息学报》2009,23(1):112

大词汇量连续语音识别(LVCSR)技术近年来发展迅速,并在许多领域得到了广泛的应用,国内外许多大公司加大了对语音识别技术的研究,不少商业化的语音识别系统已经面世,并得到较为广泛的使用。该文综述了近年来大词汇量连续语音识别技术的研究进展,描述了汉语大词汇量连续语音识别系统,主要是基于统计方法的语音识别系统的框架与设计方法,对语音识别系统的一些关键技术和原理进行了分析,并对近年来国内外对语音识别研究发展动向进行了讨论。相似文献

14.

一种文本相似度及其在语音识别中的应用 总被引：5，自引：1，他引：5

李红莲何伟袁保宗《中文信息学报》2003,17(1):60-64

随着语音识别研究的深入,提高通用识别引擎的精度变得越来越困难。但对具体的语音识别任务,结合相应的背景,采取相应的措施,有可能达到很理想的识别精度。在已知语音输入为某有限集元素之一的情形,利用文本在发音上的相似度可以大大提高识别的精度。本文对原有文本相似度的定义进行了改进与完善,并就其在语音识别任务中的作用进行了深入的研究。相似文献

15.

基于小波分析的大词汇汉语连续语音识别系统鲁棒性的研究 总被引：6，自引：0，他引：6

颜龙刘刚郭军《中文信息学报》2006,20(2):62-67

本文提出一种基于小波分析的大词汇汉语连续语音识别的方法,即采用一维小波变换将原始语音信号进行五层小波分解,然后对各层小波系数进行重构,得到五层语音信号,分别对各层语音信号进行训练,得到各层的声学模型,然后结合语言模型对各层声学模型的性能进行测试。通过对纯净语音和带噪语音的各层重构语音数据进行测试。结果表明对于含有高斯白噪声的带噪语音,该方法能使系统性能有所提高,但对于粉红噪声,该方法效果不明显。对于含有真实环境噪声的带噪语音,该方法能获得比基线系统更好的性能。相似文献

16.

多预测子融合实时连续语音识别输出词正误判别

付跃文杜利民《中文信息学报》2005,19(6):86-93

本文在采用堆栈译码词网重估输出作为识别最终输出的连续语音识别实时解码条件下,利用决策树方法将多个预测子融合,对识别输出词进行正确和错误的判别。本文首先构造了词后验概率、词长、相邻词的后验概率、词的声学和语言得分等共13 个预测子,然后利用决策树方法,通过选择不同的预测子组合方式和适当的决策树建树参数,筛选出预测子的最佳组合,建立优化的决策树进行输出词的正误判别。实验结果表明:利用局域词图计算的词后验概率与词长、相邻词的后验概率等几种实时预测子融合后,对识别输出词的正误判别能力得到提高,并且在实时性和分类效果两个方面优于n - best 输出的相应结果,相对于基线系统, 则分类错误率下降41. 4 %。实验结果也表明本文提出的相邻词的后验概率是相对重要的预测子。相似文献