首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
神经网络语音识别的研究及进展   总被引:3,自引:0,他引:3  
论述了在语音识别中听觉神经网络模型,BP网络,时延神经网络,自组织影射,学习矢量量化和神经预测网络的优缺点及神经网络语音识别的发展动态。  相似文献   

2.
多年来在Intranet平台与计算机通信解决方案领域居世界领先地位的美国莲花软件公司(Lotus),日前利用其在电子表格和办公套件领域的领先优势,推出全球第一个具有语音识别功能的Lotus 1-2-3电子表格。这个集成了IBM ViaVoice语音识别软件的Lotus 1-2-3电子表格,具有内置的语音识别功能和语音输出功能,配备了具有语音激发功能的1-2-3SmartMaster模板,可以帮助LotusSmartSuite千年版用户从艰苦费力和单调乏味的电子表格处理事务中解放出来,使他们更集中…  相似文献   

3.
本文介绍了在语音识别中使用人工神经网络(ANN)构成识别系统的新方法,分析了它与传统识别方法的不同及优越性,并以BP网络构成不定人汉语数字语音识别器,通过计算机模拟实验表明,其识别性能明显优于同样条件下HMM识别器,证明了用ANN进行语音识别是一种很具吸引力有发展前途的新方法。  相似文献   

4.
开发ASR应用系统的相关技术和发展趋势展望   总被引:1,自引:0,他引:1  
当前,许多公司纷纷在他们的呼叫中心和交互语音应答应用系统(IVR)中采纳语音识别技术,用来降低运营成本和提高客户服务水平。计算机处理性能的突飞猛进和不断改进的运算方法为语音识别技术的应用创造了良好的基础。目前的语音识别技术可以识别多种语言的上百万单词,并可以达到90%以上的准确识别率。用语音技术完全替代键盘来操作计算机可能还需要相当一段时间,但这项技术已经快速地应用到了许多垂直市场的呼叫中心自动化方面,如:金融服务、目录服务等行业。语音识别技术在网络和企业中的应用在企业,目前至少有70%的业务处理是通…  相似文献   

5.
全音节连续汉语语音识别的研究   总被引:3,自引:0,他引:3  
在大词汇量连续汉语语音识别的研究中,我们根据汉语语音自身的特点,选用全音节作为识别单元,与音对文法相结合,以期达到实现大词汇量语音识别的目的.实现连续语音识别时,不需预先切分音节,而使用帧同步型网络搜索算法并在搜索中予以音长控制,用180句未训练过的任意词组成的无文本约束的连续语句对系统进行测试评估,获得了40.40%的音节识别率.  相似文献   

6.
近年来随着网络和语音处理技术的快速发展。分布式语音识别(DSR)成为语音处理的一个研究方向,与传统集中语音识别不同的是:它基于Client/Server模型,在Client端进行参数的提取,然后通过信道传送到Server端进行识别,把结果送回到Client端。文中介绍基于LAN所设计的DSR系统。  相似文献   

7.
一种面向语音识别的新型神经网络   总被引:1,自引:0,他引:1  
提出了一种新型神经网络模型,描述了该网络的工作原理和训练方法以及识别算法。为克服神经网络对时序信号建模能力差的缺点,引入了非线性分段处理和代表帧特征提取方法。最后介绍了根据这一模型所设计的一个汉语语音识别系统,试验表明该网络在汉语语音识别方面具有较大的潜力。  相似文献   

8.
基于ANN的汉语数字语音识别   总被引:1,自引:0,他引:1  
本文介绍了在语音识别中使用人工神经网络构成识别系统的新方法,分析了它与传统识别方法的不同及优越性,并以BP网络构成不定人汉语数字语音识别器,通过计算机模拟实验表明,勘误别性能明显优于同样条件下HMM识别器,证明了用ANN进行语音识别是一种具吸引力有发展前途的新方法。  相似文献   

9.
张煦 《数字通信》1995,22(2):7-9,52
本文扼要介绍音频处理技术的进展,分三部分:(1)语音和音响压缩编码,包括电话语音,立体声音乐和光盘存储;(2)计算机的文本至语音合成;(3)计算机的自动语音识别。  相似文献   

10.
文章提出了一种基于神经网络的二级语音音调识别方法,采用常用的多层感知器结构BP反向传播算法.对非特定人的音调进行建模及识别。通过对网络输入矢量进行均值差处理,改善了非特定识别的效率,并且加速了网络训练的进程。根据BP网络得出的一级识别结果,再以音长超音段信息作为辅助条件进行二级识别,加速了网络学习进程.提高了识别率。  相似文献   

11.
矢量量化降低BP网规模的方法   总被引:1,自引:1,他引:0  
在用BP网进行语音和说话人识别过程中,BP网的输入节点数一般在几百个左右,使得网络的规模过大,训练速度过慢,为此本文在对语音特征进行了有效编码的基础上,充分考虑到BP网输入的自适应性多维码字间距离与一维码号间距离的不一致性,对量化码间中距离的不一致性,对量码字的码号进行有效的码号变换,用变换后的码号数据经归一化后作为BP网的输入,从而大大压缩了网络的规模。所进行的语音识别实验及与其它语音识别方法的  相似文献   

12.
有序聚类方法及其在神经网络语音识别中的应用   总被引:3,自引:1,他引:2  
本文提出了一种新的网络结构,我们称之为有序聚类网络。这种网络能够对语音信号进行特征提取,很好地解决神经网络语音识别中的时间规整问题。有序聚类网络从输入语音信号的特征矢量序列中撮出一组固定数目的特 矢量,然后将这组特征矢量馈入神经网络分类器进行识别。和其他的神经网络语音识别方法相比较,用这种网络进行前端处理,可以缩短后端神经网络分类器的训练和识别时间,简化经分类器的网络产高的识别率。根据该 们建立了  相似文献   

13.
肖圣兵 《信号处理》2002,18(6):574-576
从电话网络语音的特点出发,研究和提出了一种在实环境下利用DSP实现的电话网语音识别方案,通过户外实际环境下的电话语音识别实验,这种方法的有效性得到了验证。  相似文献   

14.
随着网络采集技术的发展,我们设计开发了基于网络采集音频数据和指标数据的遥控终端,结合语音识别的技术,构建了一种新型的广播电视遥控监测系统。  相似文献   

15.
於建华  张顺颐 《光子技术》2006,21(4):229-232
下一代网络可以提供语音、数据、多媒体等各种业务,具有综合开放的特点。不同的业务对服务质量有不同的要求。因此,需要对各种网络新业务进行识别,并加以控制。本文论述了用于识别新业务的网络框架,提出了新业务控制方法,并验证了所提方法的可行性和有效性。  相似文献   

16.
藏语语音情感识别是语音情感识别在少数民族语音处理上的应用,语音情感识别是人机交互的重要研究方向,提取最能表征语音情感的特征并构建具有较强鲁棒性和泛化性的声学模型是语音情感识别的重要研究内容。基于此,为了构建具有高效性和针对性的藏语语音情感识别模型,文中构建了一种藏语语音情感数据集(TBSEC001),并提出一种适合于藏语的手工语音情感特征集(TPEFS),该特征集是在藏语与其他语言的共性和特性的基础上手工提取得到的,TPEFS特征集在支持向量机(SVM)、多层感知机(MLP)、卷积神经网络(CNN)、长短时记忆网络(LSTM)这些经典网络中都取得了不错的效果。所提出的方法在藏语语音数据集(TBSEC001)上取得了88.4%的识别结果,以及在EMODB、RAVDESS、CASIA数据库上分别取得了84.1%、74.3%以及82.5%的识别结果。实验结果表明,该特征集在保证识别率的情况下,对藏语语音情感识别具有一定针对性。  相似文献   

17.
田丽  刘英楠  孟耀华 《激光与红外》2010,40(10):1141-1143
过程神经网络是一种基于过程神经元的新型神经网络,其输入及权值皆为时序函数。针对语音识别的特点,对过程神经网络在语音识别技术中的应用进行了探索性的研究,并与传统的BP神经网络、径向基函数网络进行了比较。仿真结果表明,采用过程神经网络进行的语音识别,识别性能得到了提高。  相似文献   

18.
《现代电子技术》2019,(4):85-88
基于Android平台的语音识别技术,结合WiFi语音指令进行识别,通过WiFi网络和嵌入式控制模块控制音响设备工作的音响声控系统。语音识别采用科大讯飞开放平台提供的语音识别SDK,WiFi网络由WiFi路由器提供,嵌入式控制模块采用STC15F204EA控制器,配合NL6621-M3 WiFi模块,接收处理指令。经过实验测试,音响系统能有效地通过语音进行控制,满足现代音响设备智能化的要求。  相似文献   

19.
民航陆空通话对民航飞行安全十分重要,但因其通话模式有特殊的语法结构与发音方式,日常语音识别声学模型无法有效应用于民航陆空通话的语音处理问题。针对民航陆空通话的特殊语境,本文提出了基于双向长短时记忆网络(BiLSTM)的民航陆空通话语音识别方法。首先,提取民航陆空通话语音的FBANK特征作为输入,以时序链式连接(CTC)为目标函数,训练BiLSTM网络得到BiLSTM/CTC模型。然后,利用声学模型,语言模型与陆空通话词典实现民航陆空通话的语音识别,并结合数据增强与数据迁移对模型进行增强训练提高语音识别性能。实验结果表明本文提出的方法适用于民航陆空通话语音识别,并且数据增强模型可有效降低民航陆空通话语音识别的词错误率。   相似文献   

20.
为了进一步提高谎言语音检测的准确率,提出了一种基于栈式去噪自编码器的语音测谎算法(SDA-SVM),该算法 首先采用OpenSMILE提取了 384维语音特征,然后构建了两层去噪自编码网络对语音特征进行变换加工,最后,采用SVM分类器对语音是否为谎言进行分类识别,所用语音来源为CSC测谎语料库,实验结果显示:相比传统的SVM分类,所提算法的检测准确率至少提升1.85%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号