首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个人特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。神经网络是一种基于非线性理论的分布式并行处理网络模型,具有很强的模式分类能力及对不完全信息的鲁棒性,为说话人识别技术提供了一种独特的方法。BP(Back-propagation Neural Network)是一种非循环多级网络训练算法,有输入层,输出层和N个隐含层组成。首先概述了语音识别技术,介绍了BP神经网络训练过程的7个步骤及其模型,如何建立BP神经网络模型。同时介绍了与其相关的特征参数的提取,神经网络的训练和识别过程,最后,通过编程在Linux系统下实现说话人身份的识别。  相似文献   

2.
针对混响环境中语音识别率相对安静环境下急剧下降的问题,提出了一种将语音视觉信息与音频特征相结合的方法.通过快速检测和定位包含说话人唇部的感兴趣区域(ROI),获得ROI图像序列.首先对ROI图像进行离散余弦变换,提取反映说话人唇动的视觉特征.音频特征的提取,则采用较为成熟的Mel频率倒谱系数(MF-CC)方法.对所获取的视、音特征采用隐马尔可夫模型作为训练识别算法.测试实验结果证明,采用视、听特征相结合的方法,有效地提高了混响环境中的语音识别率.  相似文献   

3.
本文提出了一种改进的混合蛙跳算法,利用混沌运动的遍历性改善初始个体的质量和引入高斯变异,提高了算法的全局搜索能力,同时将改进算法与人工神经网络结合,并把它应用到语音情感识别系统中.依据情感的维度空间模型.分别提取了情感语音的韵律特征与音质特征,研究了谐波噪声比特征随情感类别的变化特性.利用本文所提的蛙跳算法(SFLA)训练随机产生的初始数据,优化神经网络的连接权值,能快速地实现网络的收敛.在实验中比较了BP神经网络、RBF神经网络与改进SFLA神经网络分别用于语音情感以别的识别性能,结果表明基于改进SFLA的神经网络的平均识别率高于BP神经网络9.2个百分点,高于RBF神经网络7.9个百分点.因此本文所提的蛙跳神经网络用于语音情感识别能获得明显的识别性能的提升.  相似文献   

4.
在利用深度学习方式进行语音分离的领域,常用卷积神经网络(RNN)循环神经网络进行语音分离,但是该网络模型在分离过程中存在梯度下降问题,分离结果不理想。针对该问题,该文利用长短时记忆网络(LSTM)进行信号分离探索,弥补了RNN网络的不足。多路人声信号分离较为复杂,现阶段所使用的分离方式多是基于频谱映射方式,没有有效利用语音信号空间信息。针对此问题,该文结合波束形成算法和LSTM网络提出了一种波束形成LSTM算法,在TIMIT语音库中随机选取3个说话人的声音文件,利用超指向波束形成算法得到3个不同方向上的波束,提取每一波束中频谱幅度特征,并构建神经网络预测掩蔽值,得到待分离语音信号频谱并重构时域信号,进而实现语音分离。该算法充分利用了语音信号空间特征和信号频域特征。通过实验验证了不同方向语音分离效果,在60°方向该算法与IBM-LSTM网络相比,客观语音质量评估(PESQ)提高了0.59,短时客观可懂(STOI)指标提高了0.06,信噪比(SNR)提高了1.13 dB,另外两个方向上,实验结果同样证明了该算法较IBM-LSTM算法和RNN算法具有更好的分离性能。  相似文献   

5.
传统BP网络在语音识别应用中存在训练时间长,容易陷入局部极小值等问题,针对上述问题,本文建立一种基于ELM的语音识别系统。ELM是一种快速的单隐层前馈神经网络(SLFN)训练算法,将该算法与单隐层BP网络进行实验比较。实验中对提取的特征矩阵采用主成分分析(PCA)算法进行降维,该算法有效地提取了语音信号的主要成分。实验结果表明在训练时间上,ELM明显优于BP算法,在识别率上,ELM优于BP算法。  相似文献   

6.
《现代电子技术》2019,(14):152-156
语音识别作为人工智能研究中不可或缺的一部分已经逐渐渗透到人们的日常生活中。针对传统语音识别方法不能很好地实现并识别复杂多变、非特定人语音的问题,文中提出利用在时间序列上关联性较强的循环神经网络(RNN)建立语音识别模型。考虑到语音信号丰富的时频信息表达,在特征提取环节进行改进,利用具有较好时频分辨率的小波变换(WT)取代快速傅里叶变换(FFT)作为该模型的输入;然后,采用随时间展开的反向传播算法(BPTT)进行特征学习与训练。在实验测试中,首先,对比分析了基于小波变换的特征提取对识别效果的影响;其次,通过与传统的HMM模型及BP神经网络的识别率做对比,验证RNN神经网络可提高语音识别准确率和稳定性。  相似文献   

7.
宋鹏  王浩  赵力 《信号处理》2013,29(10):1294-1299
针对非对称语音库情况下的语音转换,提出了一种有效的基于模型自适应的语音转换方法。首先,通过最大后验概率(Maximum A Posteriori,MAP)方法从背景模型分别自适应训练得到源说话人和目标说话人的模型;然后,通过说话人模型中的均值向量训练得到频谱特征的转换函数;并进一步与传统的INCA转换方法相结合,提出了基于模型自适应的INCA语音转换方法,有效实现了源说话人频谱特征向目标说话人频谱特征的转换。通过客观测试和主观测听实验对提出的方法进行评价,实验结果表明,与INCA语音转换方法相比,本文提出的方法可以取得更低的倒谱失真、更高的语音感知质量和目标倾向度;同时更接近传统基于对称语音库的高斯混合模型(Gaussian Mixture Model,GMM)的语音转换方法的效果。   相似文献   

8.
孙卓  岳振军 《电声技术》2007,31(6):37-40
汉语语音变换技术的目的是将汉语语音中源说话人的语音特征转换为目标说话人语音特征。提出的适用于汉语说话人的变换算法分为3个部分:前两部分用高斯混合模型实现了语音的谱包络(线性预测编码)及其激励(残差)的转换;第三部分采用支持向量回归算法实现语音的韵律变换规则建模,结合汉语语音特点利用基音同步叠加算法实现语音的超音段特征调整。与现有的语音变换算法进行比较,算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音变换并得到高自然度合成语音,是一种有效的汉语语音变换算法。  相似文献   

9.
采用STRAIGHT语音分析一合成模型,提取源说话人和目标说话人的基频和光滑声道谱作为表征语音特征的参数。在频谱训练阶段,把声道谱转换成MFCC参数,采用人工神经网络算法对源一目标说话人的MFCC参数进行训练映射。主观和客观试验结果表明,该方法能取得较好的转换效果,转换语音和目标语音较接近,易于理解。  相似文献   

10.
特征提取和分类器设计是人脸识别算法中的两个关键问题。提出一种基于二次小波变换、PCA算法与BP神经网络的人脸识别算法。该算法采用二次小波变换与PCA相结合的算法提取人脸图像的主要特征,并运用加入动量项的改进BP神经网络算法进行人脸图像分类识别。在MATLAB环境下,利用ORL人脸图像数据库进行了仿真实验,实验结果表明,该算法实现简单、识别速度快、识别率较高。  相似文献   

11.
箔条和箔片的性能特性及其应用和趋势   总被引:6,自引:0,他引:6  
谭显裕 《雷达与对抗》1999,(3):10-17,56
从箔条和箔片用于干扰雷达测和扰乱、迷惑、转移或者引诱进攻出发,详细论述箔条、箔条云及箔片、箔片云的雷达散射截面、带度、平移速度、下降速度及转动等情况,空间和时间我、水平和垂直极化性能、多普勒频移效应以及频谱展宽特性等,通过箔条和箔片有效成火控雷达实例,提出对抗火控雷达的三个重要因素及其采取的对策。  相似文献   

12.
13.
The author observes that the social fabric of engineering, the support infrastructure of the profession, and the political and economic systems of the world are undergoing shifts that affect what engineering is, how it is accomplished, and what it should do. He asks what these changes mean in terms of the educational system and explores a few of these issues that lie between academia and the industrial environment beyond. He discusses the engineering curriculum as seen from industry, the role of continuing education, research in academia  相似文献   

14.
业务识别与控制技术及其测试评估   总被引:1,自引:0,他引:1  
在传统Intemet网络逐步向多业务网络演进的过程中,监管者、运营商以及最终用户都对网络的可管可控能力提出了差异化的要求,业务识别与控制技术应运而生.作为IP领域的一项热点技术,该技术得到了广泛的关注并取得了迅猛的发展.在考虑来自不同主体需求的基础上,介绍了业务识别与控制技术.此外,还结合技术发展以及网络部署等要求,着重分析了该技术的测试评估方法及测试内容.  相似文献   

15.
"电路原理"与"信号与系统"课程的整合与优化   总被引:2,自引:2,他引:2  
科学技术迅速发展,新兴学料不断增加,知识总量不断增长,迫使本科教育不断向着基础化方向发展,基础课程教学在本科教育中的地位愈来愈高。计算机技术的广泛应用,离散信号与系统的基础知识已是电气类各专业的必要的教学内容。因此基础课程要从根本上整体优化课程结构。本文提出了电气类专业“电路原理”与“信号与系统”课程教学改革方案,将两门课程教学内容进行整合与优化,并在实际教学过程中进行了教学试验,缩短了教学时间,提高了教学质量。  相似文献   

16.
The deposition of silicon carbide thin films and the associated technologies of impurity incorporation, etching, surface chemistry, and electrical contacts for fabrication of solid-state devices capable of operation at temperatures to 925 K are addressed. The results of several research programs in the United States, Japan and the Soviet Union, and the remaining challenges related to the development of silicon carbide for microelectronics are presented and discussed. It is concluded that the combination of α-SiC on α-SiC appears especially viable for device fabrication. In addition, considerable progress in the understanding of the surface science, ohmic and Schottky contacts, and dry etching have recently been made. The combination of these advances has allowed continual improvement in Schottky diode p-n junction, MESFET, MOSFET, HBT, and LED devices  相似文献   

17.
吴洁 《电子质量》2010,(4):15-17
文章介绍了针对特定电压变化特性的被测设备的、简单的、低成本的电压波动和闪烁的解析测量法,并将实际解析法测量计算结果与直接测量法结果进行了比较、验证,证明该方法切实可行,且符合标准规定的容差要求。  相似文献   

18.
信号与系统课程是高等院校电类专业一门重要的专业基础课程,本文以西安明德理工学院智能制造与控制技术学院的信号与系统课程建设与教学改革为例,介绍了我院在信号与系统课程资源建设和教学改革中的探索和实践。实践证明,本文提出的五维一体化线上线下课程资源建设和混合式教学改革能够有效推动教与学两个方面的变革,有效提高课程教学质量,为同类兄弟院校的同类课程建设和教学改革起到一定的借鉴作用。  相似文献   

19.
压电/电致伸缩材料及驱动器的新技术与应用   总被引:8,自引:2,他引:6  
压电/电致伸缩驱动器是一种广泛使用的驱动器,文章概括总结了几种压电/电致伸缩新材料的发展方向,同时还介绍了几种新型驱动模式和超声电机的研究动态,并对压电/电致伸缩驱动器的发展前景予以展望。  相似文献   

20.
Over the last 40 years in the semiconductor industry, one of the most reliable truths has been that "thepath forward is through integration." Moore's law and its various derivatives and cousins have illustrated how greater integration has provided tremendous benefits in cost, power, size, and performance. While shrinking process lithography has been a critical enabler of this trend, we should remember that tremendous innovation in device technology, circuits, system architecture, computer aided design (CAD), packaging, and many other areas have been necessary as well. The exponential integration phenomenon has not been limited to memory and microprocessors: mixed signal and radio functions have also seen striking advances in integration over the last 20 years, from cell phones to wireless LANs, integrated "systemon-a-chip" (SOC) transceivers have become prevalent in the circuits conferences, journals, and - in some applications - have even made it into commercial mainstream products.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号