首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
为了在远程教育环境中满足多媒体课件的关键词检索需求,描述了一种基于矢量量化(VQ)及连续语音识别(CSR)的关键词检索系统的设计与实现。该系统首先利用矢量量化算法对声学特征空间进行聚类并生成码本;接着利用该码本对语音文件逐帧进行处理并保存若干与该帧特征最相似的码表向量所对应的码值做成特征矩阵;然后利用改进的快速符号查找算法从特征矩阵中找出若干候选结果段;使用经简化的连续语音识别算法对候选段进行验证筛选,从而得到最终的结果。在此基础上利用一些测试数据给出其性能表现并做出分析。  相似文献   

2.
在普通话大词汇量连续语音识别中,使用最大后验概率决策规则解码得到的是具有最小句子错误率的识别结果,但是本文通常使用字错误率作为识别结果的评测标准.为了使识别结果具有最小字错误率,在充分考虑汉语语言特点的基础上,提出了一种汉字混淆网络算法.这种算法能够有效地将普通话大词汇量连续语音识别系统输出的词格转换成为汉字混淆网络.详细讨论了最小贝叶斯风险决策规则理论及使用汉字混淆网络进行的解码过程.基于2005 HTRDP(863)评测数据集进行的实验结果表明,这种使用汉语字混淆网络的方法有效地降低了普通话大词汇量连续语音识别结果的字错误率.  相似文献   

3.
近年来,由于动态贝叶斯网络(DBN)相对于传统的隐马尔可夫模型(HMM)更具可解释性、可分解性以及可扩展性,基于DBN的语音识别引起学者们越来越多的关注.但是,目前关于基于DBN的语音识别的研究主要集中在孤立语音识别上,连续语音识别的框架和识别算法还远没有HMM成熟和灵活.为了解决基于DBN的连续语音识别的灵活性和可扩展性,将在基于HMM的连续语音识别中很好地解决了上述问题的Token传递模型加以修改,使之适用于DBN.在该模型基础上,为基于DBN的连续语音识别提出了一个基本框架,并在此框架下提出了一个新的独立于上层语言模型的识别算法.还介绍了作者开发的一套基于该框架的可用于连续语音识别及其他时序系统的工具包DTK.  相似文献   

4.
关键词识别的基本技术和研究进展   总被引:1,自引:0,他引:1  
Keyword Spotting (KWS) or Keyword Recognition is to recognize a set of given keywords in continuous,spontaneous speech.It is a very active branch of Speech Recognition.It differs from Continuous Speech Recognition (CSR) in terms of research focus,implementation techniques and application background.So they are often regarded as two different issues.This paper gives an overview of basic techniques and advances in recent years,including how to combine the traits of Mandarin.  相似文献   

5.
一种联合语种识别的新型大词汇量连续语音识别算法   总被引:1,自引:1,他引:0  
单煜翔  邓妍  刘加 《自动化学报》2012,38(3):366-374
提出了一种联合语种识别的新型大词汇量连续语音识别(Large vocabulary continuous speech recognition, LVCSR)算法,并构建了实时处理系统. 该算法能够充分利用语音解码过程中收集的音素识别假设,在识别语音内容的同时识别语种类别.该系统可以应用于多语种环境,不仅可以以更小的系统整体计算开销替代独立的语种识别模块,更能有效应对在同一段语音中混有非目标语种的情况,极大地减少由非目标语种引入的无意义识别错误,避免错误积累对后续识别过程的误导.为将语音内容识别和语种识别紧密整合在一个统一语音识别解码过程中,本文提出了三种不同的算法对解码产生的音素格结构进行调整(重构):一方面去除语音识别中由发音字典和语言模型引入的特定目标语种偏置,另一方面在音素格中包含更加丰富的音素识别假设.实验证明, 音素格重构算法可有效提高联合识别中语种识别的精度.在汉语为目标语种、汉英混杂的电话对话语音库上测试表明,本文提出的联合识别算法将集外语种引起的无意义识别错误减少了91.76%,纯汉字识别错误率为54.98%.  相似文献   

6.
随着近几年语音识别研究的逐渐升温,把握好语音识别领域的正确研究方向显得尤为重要。本文介绍了语音识别技术的原理及系统构成,对2010年以来中国知网(CNKI)收录的中文核心期刊中主题为语音识别的论文进行统计分析,得出国内语音识别领域的研究现状和趋势。通过探讨其中存在的问题,得出大数据背景下的大词汇连续语音识别系统的设计及实现、方言语音识别研究、语音识别系统在现实生活中的应用以及深度学习、深层神经网络的应用将是未来语音识别领域研究的主要方向。  相似文献   

7.
在噪声环境下的语音识别率将会受到严重的影响.语音增强是解决噪声污染的有效方法.在语音增强技术中,语音识别和说话人识别是很重要的.因此.识别装置通常工作在环境噪声下.语音增强不仅与信号处理技术相关,并涉及到人的听觉感知和语音认知.由于噪声的来源有很多,在不同的应用场合,其特点也各不相同.因此很难确定一个通用的适用于各种环境噪声的语音增强算法.根据不同的噪声,采用不同的语音增强策略.  相似文献   

8.
介绍实现语音识别系统的一些基本概念,对双门限端点检测过程用流程图的形式做详细介绍.该系统采用连续隐马尔科夫模型(HMM)进行建模,对实现过程遇到的三个基本问题进行分析并给出了解决方案.利用该系统对不同人的语音命令进行识别,准确率可达95%.  相似文献   

9.
提出一种用于语音识别的性别鉴定的算法,算法融合基音频率鉴定法和隐马尔可夫模型(HMM)鉴定法的混合算法.循环幅度差函数用于检测基音频率,HMM鉴定法建立男女两个HMM,用Viterbi算法将输入语音匹配到这两个模型,用匹配结果鉴定性别,基于这两种方法设计了一个线性分类器,在TIMIT、HTIMIT和南方口音语料库上采用1s长的语音片段进行测试,达到98.54%的正确率.将该算法应用于连续语音识别前端,较大提高了识别精度.  相似文献   

10.
汉语大词汇量连续语音识别系统研究进展   总被引:6,自引:1,他引:5  
大词汇量连续语音识别(LVCSR)技术近年来发展迅速,并在许多领域得到了广泛的应用,国内外许多大公司加大了对语音识别技术的研究,不少商业化的语音识别系统已经面世,并得到较为广泛的使用。该文综述了近年来大词汇量连续语音识别技术的研究进展,描述了汉语大词汇量连续语音识别系统,主要是基于统计方法的语音识别系统的框架与设计方法,对语音识别系统的一些关键技术和原理进行了分析,并对近年来国内外对语音识别研究发展动向进行了讨论。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号