共查询到20条相似文献,搜索用时 46 毫秒
1.
神经网络语音识别的研究及进展 总被引:3,自引:0,他引:3
论述了在语音识别中听觉神经网络模型,BP网络,时延神经网络,自组织影射,学习矢量量化和神经预测网络的优缺点及神经网络语音识别的发展动态。 相似文献
2.
3.
本文介绍了在语音识别中使用人工神经网络(ANN)构成识别系统的新方法,分析了它与传统识别方法的不同及优越性,并以BP网络构成不定人汉语数字语音识别器,通过计算机模拟实验表明,其识别性能明显优于同样条件下HMM识别器,证明了用ANN进行语音识别是一种很具吸引力有发展前途的新方法。 相似文献
4.
开发ASR应用系统的相关技术和发展趋势展望 总被引:1,自引:0,他引:1
当前,许多公司纷纷在他们的呼叫中心和交互语音应答应用系统(IVR)中采纳语音识别技术,用来降低运营成本和提高客户服务水平。计算机处理性能的突飞猛进和不断改进的运算方法为语音识别技术的应用创造了良好的基础。目前的语音识别技术可以识别多种语言的上百万单词,并可以达到90%以上的准确识别率。用语音技术完全替代键盘来操作计算机可能还需要相当一段时间,但这项技术已经快速地应用到了许多垂直市场的呼叫中心自动化方面,如:金融服务、目录服务等行业。语音识别技术在网络和企业中的应用在企业,目前至少有70%的业务处理是通… 相似文献
5.
6.
近年来随着网络和语音处理技术的快速发展。分布式语音识别(DSR)成为语音处理的一个研究方向,与传统集中语音识别不同的是:它基于Client/Server模型,在Client端进行参数的提取,然后通过信道传送到Server端进行识别,把结果送回到Client端。文中介绍基于LAN所设计的DSR系统。 相似文献
7.
一种面向语音识别的新型神经网络 总被引:1,自引:0,他引:1
提出了一种新型神经网络模型,描述了该网络的工作原理和训练方法以及识别算法。为克服神经网络对时序信号建模能力差的缺点,引入了非线性分段处理和代表帧特征提取方法。最后介绍了根据这一模型所设计的一个汉语语音识别系统,试验表明该网络在汉语语音识别方面具有较大的潜力。 相似文献
8.
基于ANN的汉语数字语音识别 总被引:1,自引:0,他引:1
本文介绍了在语音识别中使用人工神经网络构成识别系统的新方法,分析了它与传统识别方法的不同及优越性,并以BP网络构成不定人汉语数字语音识别器,通过计算机模拟实验表明,勘误别性能明显优于同样条件下HMM识别器,证明了用ANN进行语音识别是一种具吸引力有发展前途的新方法。 相似文献
9.
10.
文章提出了一种基于神经网络的二级语音音调识别方法,采用常用的多层感知器结构BP反向传播算法.对非特定人的音调进行建模及识别。通过对网络输入矢量进行均值差处理,改善了非特定识别的效率,并且加速了网络训练的进程。根据BP网络得出的一级识别结果,再以音长超音段信息作为辅助条件进行二级识别,加速了网络学习进程.提高了识别率。 相似文献
11.
矢量量化降低BP网规模的方法 总被引:1,自引:1,他引:0
在用BP网进行语音和说话人识别过程中,BP网的输入节点数一般在几百个左右,使得网络的规模过大,训练速度过慢,为此本文在对语音特征进行了有效编码的基础上,充分考虑到BP网输入的自适应性多维码字间距离与一维码号间距离的不一致性,对量化码间中距离的不一致性,对量码字的码号进行有效的码号变换,用变换后的码号数据经归一化后作为BP网的输入,从而大大压缩了网络的规模。所进行的语音识别实验及与其它语音识别方法的 相似文献
12.
13.
从电话网络语音的特点出发,研究和提出了一种在实环境下利用DSP实现的电话网语音识别方案,通过户外实际环境下的电话语音识别实验,这种方法的有效性得到了验证。 相似文献
14.
随着网络采集技术的发展,我们设计开发了基于网络采集音频数据和指标数据的遥控终端,结合语音识别的技术,构建了一种新型的广播电视遥控监测系统。 相似文献
15.
下一代网络可以提供语音、数据、多媒体等各种业务,具有综合开放的特点。不同的业务对服务质量有不同的要求。因此,需要对各种网络新业务进行识别,并加以控制。本文论述了用于识别新业务的网络框架,提出了新业务控制方法,并验证了所提方法的可行性和有效性。 相似文献
16.
藏语语音情感识别是语音情感识别在少数民族语音处理上的应用,语音情感识别是人机交互的重要研究方向,提取最能表征语音情感的特征并构建具有较强鲁棒性和泛化性的声学模型是语音情感识别的重要研究内容。基于此,为了构建具有高效性和针对性的藏语语音情感识别模型,文中构建了一种藏语语音情感数据集(TBSEC001),并提出一种适合于藏语的手工语音情感特征集(TPEFS),该特征集是在藏语与其他语言的共性和特性的基础上手工提取得到的,TPEFS特征集在支持向量机(SVM)、多层感知机(MLP)、卷积神经网络(CNN)、长短时记忆网络(LSTM)这些经典网络中都取得了不错的效果。所提出的方法在藏语语音数据集(TBSEC001)上取得了88.4%的识别结果,以及在EMODB、RAVDESS、CASIA数据库上分别取得了84.1%、74.3%以及82.5%的识别结果。实验结果表明,该特征集在保证识别率的情况下,对藏语语音情感识别具有一定针对性。 相似文献
17.
18.
19.
民航陆空通话对民航飞行安全十分重要,但因其通话模式有特殊的语法结构与发音方式,日常语音识别声学模型无法有效应用于民航陆空通话的语音处理问题。针对民航陆空通话的特殊语境,本文提出了基于双向长短时记忆网络(BiLSTM)的民航陆空通话语音识别方法。首先,提取民航陆空通话语音的FBANK特征作为输入,以时序链式连接(CTC)为目标函数,训练BiLSTM网络得到BiLSTM/CTC模型。然后,利用声学模型,语言模型与陆空通话词典实现民航陆空通话的语音识别,并结合数据增强与数据迁移对模型进行增强训练提高语音识别性能。实验结果表明本文提出的方法适用于民航陆空通话语音识别,并且数据增强模型可有效降低民航陆空通话语音识别的词错误率。 相似文献