首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
语音端点检测作为语音信号处理前端处理部分的一个重要环节,是各种语音任务的基础。基于深度神经网络的语音端点检测在数据支撑上需要对语音进行大量帧级别的标注,针对此问题,文中提出一种基于原型网络(ProtoNet)的小样本学习(Few-shot Learning)的语音端点检测算法,进一步减少在语音端点检测算法过程中因帧级别数据标注带来的繁琐工作。该算法利用所给出的标签计算出一个分类中心,通过计算查询点到分类中心的距离将未给出标签的查询点归类到分类中心,得到一个原型中心;在测试集上,计算测试集中的查询点与原型中心的距离并进行测试。实验语料基于MUSAN语音库,使用该语音库自带的噪声库进行加噪。实验结果表明,在各种环境噪声下,基于小样本学习的语音端点检测算法的性能优于基于深度神经网络的语音端点检测算法,而且该算法能够显著减少语音端点检测算法的数据准备工作量与系统数据量。  相似文献   

2.
为了提高语音端点检测的适应性和鲁棒性,提出一种小波分析和粒子群优化神经网络(WA -PSO -BP)的语音端点检测算法。首先利用小波分析提取语音信号的特征量,然后将特征量作为输入BP神经网络进行学习,并采用粒子群算法优化BP神经网络参数,从而建立语音端检测模型。仿真结果表明,WA -PSO -BP提高了语音端点检测正确率,有效降低了虚检率和漏检率。这说明WA -PSO -BP是一种可行性较高,环境适应性较强的语音检测算法。  相似文献   

3.
《现代电子技术》2019,(12):165-167
基于预测编码、SOM自主神经网络矢量编码和Huffman编码的联合编码算法(PV算法)压缩效果虽然较好,但它在对每段语音编码时,都需要利用该段语音信号,通过SOM自主神经网络训练得到码本,算法复杂、耗时。为此文中提出从具有一般特征的多段语音信号中通过SOM自主神经网络训练提取码本,所有的语音信号段PV编码都统一用该码本,不需要对每一段语音信号编码都做一次提取码本的运算,这样不仅节省了每段语音PV编码时用于训练码本的时间,也节省了需要编码的专用码本的信息,减小了码率。实验结果显示,通用码本的PV编码算法在保证一定语音质量的条件下,是可行的。文中提出的编码算法在语言压缩编码方面具有较高的研究价值和很好的应用前景。  相似文献   

4.
李战明  苏敏  赵正天  李二超 《电声技术》2007,31(12):44-46,50
基于隐马尔可夫模型(HMM)和改进后的概率神经网络(PNN)模型提出了一种用于语音识别的混合模型,该模型首先利用HMM生成最佳语音状态序列,然后对最佳状态序列进行时间规整,最后通过PNN神经网络进行分类识别。给出了HMM参数训练及时间规整的算法。实验结果表明这种模型比HMM具有更好的识别效果。  相似文献   

5.
粒子群算法(PSO)和神经网络的有机结合是目前一个十分活跃的研究领域,为分类问题的研究提供了新的思路和方法。针对基本SOM算法聚类数目不确定、聚类效果不佳等问题,提出PSOM算法用于未知雷达信号分选,利用PSO的优化算法替代SOM的启发式训练,对基本SOM算法进行改进,最后通过仿真实验验证了该算法在未知雷达信号分选应用上的有效性。  相似文献   

6.
基于倒谱特征的带噪语音端点检测   总被引:44,自引:0,他引:44       下载免费PDF全文
胡光锐  韦晓东 《电子学报》2000,28(10):95-97
在语音识别系统中产生错误识别的原因之一是端点检测有误差.在高信噪比情况下,正确地确定语音的端点并不困难.然而,大多数实际的语音识别系统需工作在低信噪比情况下,一些常规的端点检测方法,例如基于能量的端点检测方法在噪声环境下不能有效地工作.本文利用倒谱特征来检测语音端点,提出了带噪语音端点检测的两个算法,第一个算法利用倒谱距离代替短时能量作为判决的门限,第二个算法改进了基于隐马尔柯夫模型(HMM)的语音检测以适应噪声的变化,实验结果表明本方法可得到高正确率的带噪语音端点检测.  相似文献   

7.
在利用深度学习方式进行语音分离的领域,常用卷积神经网络(RNN)循环神经网络进行语音分离,但是该网络模型在分离过程中存在梯度下降问题,分离结果不理想。针对该问题,该文利用长短时记忆网络(LSTM)进行信号分离探索,弥补了RNN网络的不足。多路人声信号分离较为复杂,现阶段所使用的分离方式多是基于频谱映射方式,没有有效利用语音信号空间信息。针对此问题,该文结合波束形成算法和LSTM网络提出了一种波束形成LSTM算法,在TIMIT语音库中随机选取3个说话人的声音文件,利用超指向波束形成算法得到3个不同方向上的波束,提取每一波束中频谱幅度特征,并构建神经网络预测掩蔽值,得到待分离语音信号频谱并重构时域信号,进而实现语音分离。该算法充分利用了语音信号空间特征和信号频域特征。通过实验验证了不同方向语音分离效果,在60°方向该算法与IBM-LSTM网络相比,客观语音质量评估(PESQ)提高了0.59,短时客观可懂(STOI)指标提高了0.06,信噪比(SNR)提高了1.13 dB,另外两个方向上,实验结果同样证明了该算法较IBM-LSTM算法和RNN算法具有更好的分离性能。  相似文献   

8.
SOM+K-means两阶段聚类算法及其应用   总被引:2,自引:0,他引:2  
在众多聚类算法中,K-means和自组织神经网络(SOM)是较为经典的2个。在分析2种算法优缺点的基础上,提出基于SOM的K-means两阶段聚类算法,该算法根据SOM算法自动聚类的优点得到初步聚类数目和各类中心点,以此作为K-means算法的初始输入进一步聚类,从而得到精确的聚类信息。最后,应用该算法对某地区电信家庭客户数据进行分析,结果表明该算法有较好的聚类效果。  相似文献   

9.
《现代电子技术》2015,(23):80-84
入侵检测作为保障互联网安全的主要措施之一,对于网络入侵的识别和诊断有着重要的意义。将自组织映射(SOM)的思想引入网络入侵检测中,提出了一种基于SOM的网络入侵检测算法。算法通过对SOM神经网络中输出神经元的邻域密度进行排名,同时结合受试者工作特征(ROC)曲线设置邻域密度阈值等方法,使得入侵检测的结果通过输出神经元的邻域密度进行表达,克服了SOM神经网络训练时容易产生畸变导致输出神经元自身的聚类结果难以理解的缺点。通过对算法仿真实验,表明该算法不仅有效而且拥有相当可观的检测率。  相似文献   

10.
针对现有双通道语音活动检测(Voice Activity Detection, VAD)算法依赖于固定阈值难以在多种噪声环境下准确地检测语音和噪声,应用于手机消噪系统会造成语音失真或噪声消除不好等问题,该文提出一种基于神经网络的VAD算法,该算法以分频带能量差和归一化互通道相关为特征,采用神经网络对语音和噪声进行分类。在此基础上,将神经网络VAD与基于互通道信号功率比值的VAD相结合,提出一种新的适用于手机消噪系统的语音和噪声活动检测算法分别对语音和噪声进行检测,并以此进行噪声抑制处理,减少了消噪系统因VAD误判而造成的性能下降。实验结果表明,该处理方法在抑制背景噪声和减少语音失真等方面优于现有的消噪算法,对于方向性语音干扰也有很好的抑制效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号