首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
研究了双模型语音识别系统中前合成和后合成两种听觉视觉合成方法;同时在后合成方法中引入了考虑听觉和视觉同步异步特点的复合模型。仿真实验证明了在声学噪音环境下,后合成方法能够带来比较理想的识别效果;考虑听觉和视觉同步异步性的模型可以有效地提高识别率。  相似文献   

2.
通过将深度神经网络直接应用于频谱图,提出了一种用于可变长度语音段的情感识别方法.频谱图包含对情绪识别有用的对话语言信息.从频谱图中提取这些信息,并通过将卷积神经网络(CNN)与递归神经网络(RNN)相结合来完成情感识别任务.与传统的将句子分割成更小的固定长度段的方法相比,该方法可以解决语音分割过程中引入的准确性降低问题.实验结果表明,该方法在加权精度(WA)和不加权精度(UA)上均优于定长神经网络.  相似文献   

3.
基于小波变换的静音与语音分割新算法   总被引:6,自引:1,他引:6  
含噪语音信号的静音与语音分割,即端点检测问题是语音识别至关重要 的一步,为了提高语音分割对环境的适应性,提出了一种利用小波变换分割含噪语音信号中静音与语音的新算法,该算法首先将语音信号进行小波变换,利用小波系数去噪,然后选择小波部分子带跟踪信号的能量变化以分割语音与静音,仿真实验表明该算法在低信噪比条件下也能够有效分割语音。  相似文献   

4.
针对语音识别过程中环境噪声干扰大的问题,提出一种基于经验模态分解(EMD)与动态时间规整 (DTW)相结合的孤立词识别算法。该方法利用EMD 算法,首先将提取的性能不好的语音信号分解成若干个基本模函数(IMF),去掉原始信号中的干扰和噪声。然后,基于DTW 算法,采用短时过零率和短时能量对语音信号进行端点检测,提取语音特征参数后与参考模板进行匹配。将参考模板与待测模板之间的最短路径作为识别结果。仿真结果表明,该算法能够提高语音的识别效率和识别的正确率。  相似文献   

5.
基于深度LSTM的端到端的语音识别   总被引:1,自引:0,他引:1  
基于长短时记忆(LSTM)神经网络在语音识别方面的良好性能,本文引入了一种新的深度LSTM方法.该方法利用深度控制门控函数连接多层LSTM单元,在循环神经网络中引入了上下层之间的线性相关性,可以更深层地构建语音模型.同时利用链接时序分类的训练准则进行模型训练,搭建端到端语音识别系统,解决了隐马尔可夫模型需要将标签和序列强制对齐的问题.实验表明,深度LSTM可以提高语音建模的性能,相比使用标准LSTM的模型,在准确率方面提高约4%.  相似文献   

6.
基于神经网络的汉语孤立词语音识别   总被引:3,自引:0,他引:3  
研究了基于神经网络的中文孤立词语音识别技术;将时间规整算法与神经网络相结合,组成一个混合级联神经网络语音识别系统. 在这个模型中,第一级是时间规整神经网络. 其作用是完成时间规整功能,从输入不等长的语音信号特征矢量序列中提取固定长度的特征矢量;然后将这组特征矢量馈入后一级BP网络完成语音识别. 利用该方法对小词表汉语孤立词进行语音识别实验,获得了98.25%的正确识别率. 实验结果表明,该系统不仅利用神经网络解决了语音识别中的时间规整难题,而且识别性能明显得到改善,识别率和训练速度均优于采用线性时间规整的神经网络语音识别方法.  相似文献   

7.
为提高噪声环境下的语音识别准确率,提出一种改进的语音特征提取算法。该算法采用模拟人耳听觉特性的非线性幂函数提取一种新的耳蜗滤波倒谱系数,并在特征提取前端引入谱减法对信号进行增强,将提取到的新的特征及其一阶差分组成一种混合特征参数;再联合主成分分析对该混合特征进行降维,将最终得到的特征用于一个非特定人、孤立词、小词汇量的语音识别系统。实验结果表明:采用非线性幂函数提取的耳蜗滤波倒谱系数特征与传统的耳蜗滤波倒谱系数特征相比,明显提高了语音识别准确率;混合特征参数相比单一特征能达到更佳的语音识别性能;结合主成分分析后的特征集在信噪比为0dB时的识别正确率可达到88.10%。  相似文献   

8.
该文建设性地提出基于分布式组件技术(DCOM)构建多层网络化机器人远程控制系统,利用分布式组件技术实现了机器人的远程控制和网络共享。通过对语音识别技术的研究,在引进IBM ViaVoice语音识别的基础上,使语音识别技术与机器人控制系统有机结合实现机器人语音识别与控制。结合DCOM和IBM ViaVoice两者技术可以实现语音远程控制,使声音通过网络加以延伸,使控制者离开机器人嘈杂的操作环境,对远距离的机器人进行语音控制,使语音识别率得到很大的提高。  相似文献   

9.
本文对语音的上升过零间从发音机理及统计角度进行了分析,认为语音信号及其并分值信号的上升过零间隔较好地体现了不同语音之间的差异性,是一种进行语音识别的理想参数,并利用该参数建立模板,以非线性分块法进行时间对准,以相邻三帧最佳间匹配法进行模板匹配,用软件模拟了特定人,小词汇量,孤立词的语音识别,得到了较好的实验结果。  相似文献   

10.
介绍了一种基于VQ的小词汇量特定人快速语音识别方法,并对该方法中的关键参数进行了比较性研究. 这一方法尤其适用于汉语特定人小词汇量语音识别. 与典型的HMM和NN识别算法相比,该方法复杂度低、系统资源消耗少而识别率高,在对汉语11个数字的大规模识别测试中误识率仅为3.86%. 因此,该方法适合于在手机、PDA等资源有限的系统中实现语音数字拨号、人名拨号及查询等语音控制功能.  相似文献   

11.
系统使用OCR设备,扫描与识别学生卡信息,并对所得信息进行软件支持和补偿.在此基础上,建立了一个基于ASP.Net的在线考试系统.通过Web技术与TTS技术相结合,实现了信息在不同客户端播报与提示,为外部信息转换到汉语文本进行探索,并为ATR实现语音播报打下基础.  相似文献   

12.
从Nuance语音平台工作流程、开发工具、开发过程等方面,对基于Nuance平台的语音识别环境设计进行了阐述和探讨,并重点阐述了主体代码及几个重要组成文件的作用和编写过程.  相似文献   

13.
Mandarin Digits Speech Recognition Using Support Vector Machines   总被引:1,自引:0,他引:1  
A method of applying support vector machine (SVM) in speech recognition was proposed, and a speech recognition system for mandarin digits was built up by SVMs. In the system, vectors were linearly extracted from speech feature sequence to make up time-aligned input patterns for SVM, and the decisions of several 2-class SVM classifiers were employed for constructing an N-class classifier. Four kinds of SVM kernel functions were compared in the experiments of speaker-independent speech recognition of mandarin digits. And the kernel of radial basis function has the highest accurate rate of 99.33 %, which is better than that of the baseline system based on hidden Markov models (HMM) (97.08%). And the experiments also show that SVM can outperform HMM especially when the samples for learning were very limited.  相似文献   

14.
语音识别是实现人机通信的一种重要技术手段.本文基于Samsung公司开发的B lues芯片,应用隐马尔可夫模型(HMM)理论和方法,完成了针对特定人、小词汇量嵌入式语音识别系统开发.文章介绍了语音识别过程的各个环节及其实现方法.  相似文献   

15.
一种新的基于感知轮廓描绘子的自动步态识别方法   总被引:2,自引:0,他引:2  
通过步态远距离识别人的身份是生物特征识别领域的1个研究热点。文中提出了一种新的基于感知轮廓描绘子的自动步态识别方法。通过检测步态序列中的行人,利用内边界跟踪算法提取出人的二值轮廓,并将其表示成为一维感知轮廓描绘子;使用主成分分析法将步态特征映射到低维特征空间中进行训练和分类,从而实现身份识别。实验结果验证了该方法的有效性。  相似文献   

16.
At present ,the trend to ever-increasing use ofdata communication is spreading to the mobile wire-less world. The small portable devices will be used toaccess these data and cry out for i mproved user inter-faces using speechinput , whichis very i mportan…  相似文献   

17.
金琰  张健 《辽宁工学院学报》2007,27(6):365-367,371
通过Mel频率倒谱系数的方法对语音信号波形进行处理,采用BP网络作为分类器,实现了孤立数字的语音识别系统,在matlab环境下对算法进行仿真。实验表明,这种方法具有计算简单,识别精度高的特点。  相似文献   

18.
为增加大型系统数据输入方式的多样化和灵活性,提出一种基于片上可编程系统(System On Programmable Chip,SOPC)的语音-文本转化方法。通过采用SOPC软硬协同设计实现基于线性预测编码(Linear Predictive Coding,LPC)算法的语音信号处理。与其他现有的实现方式比较,该方法可大大节约系统硬件资源,具有更优的处理性能,适用于大型系统用户数据输入源。  相似文献   

19.
针对声韵母相同但声调不同的近音字识别问题和声韵母及声调都相同的同音字识别问题,提出在语音模型和语言模型中分别引入声调和字转移概率,以提高近音字和同音字的识别率。首先将声调划分为5种表现形式添加到汉语音节的最后一个音素中构成新音素,使用高斯混合隐马尔科夫模型建模新音素。然后通过统计方法计算特定语境下的字间转移概率。最后使用HTK工具包实现了带声调的语音模型和有字转移概率的语言模型。实验结果证明添加声调可以提高近音字的识别率,使用特定语境下字间转移概率可以提高同音字的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号