共查询到19条相似文献,搜索用时 109 毫秒
1.
为了更好地运用深度置信网络( DBN)进行语音活性检测( VAD),针对现有方法过于繁杂的问题,提出采用语音频谱作为深度置信网络的输入的改进算法。在Matlab环境下使用TIMIT语料库进行仿真实验,实验结果验证了该方法的有效性,并且在Babble噪声环境下验证该方法比现有方法具有更高的检测正确率。 相似文献
2.
为了更好地运用深度置信网络进行语音端点检测,针对现有方法过于繁杂的问题,改进采用语音频谱作为深度置信网络的输入。在Matlab环境下使用TIMIT语料库进行仿真实验,实验结果验证了该方法的有效性,并且在Babble噪声环境下验证该方法比现有方法具有更高的检测正确率。 相似文献
3.
卡尔曼滤波是一种应用广泛的基于最小方差的递推式滤波算法,根据一定滤波规则对系统的状态进行估计。采用某种统计量最优方法对噪声和系统模型统计特性的先验知识决定的滤波的性能和估计的准确性进行度量。不精确的先验知识将导致滤波性能的明显下降和发散。采用新息自适应卡尔曼滤波克服标准卡尔曼滤波需要在先验条件下进行估计的缺点,通过深度置信网络对噪声的协方差矩阵做出调整,从而提高滤波性能。 相似文献
4.
针对深度信念网络(Deep Believe Network,DBN)模型泛化能力较弱,导致语音增强效果不佳的问题,提出了一种特征联合优化的回归DBN语音增强算法。该算法对语音和噪声不做任何假设。该算法分别提取语音信号的LMPS(Log-Mel frequency Power Spectrum)和MFCC(Mel-Frequency Cepstral Coefficients)特征。LMPS用于直接重构增强语音,保证了语音听觉质量,MFCC作为辅助次级特征。将两种特征联合输入到DBN体系中对网络参数进行优化。这种联合优化在对LMPS的直接预测中加入MFCC限制,提升了模型对LMPS估计的泛化能力,更加准确地重构增强语音。仿真结果表明,在不同的信噪比环境下,与LPS(Log Power Spectrum)和LMPS单特征优化相比,LMPS和MFCC联合优化使增强语音获得了较高的PESQ和SNR,提高了语音质量和可懂度。 相似文献
5.
深度置信网络(deep belief network,DBN)通过逐层无监督学习进行训练,但训练过程中易产生大量冗余特征,进而影响特征提取能力。为了使模型更具有解释和辨别能力,基于对灵长类视觉皮层分析的启发,在无监督学习阶段的似然函数中引入惩罚正则项,使用CD(contrastive divergence)训练最大化目标函数的同时,通过稀疏约束获得训练集的稀疏分布,可以使无标签数据学习到直观的特征表示。其次,针对稀疏正则项中存在的不变性问题,提出一种改进的稀疏深度置信网络,使用拉普拉斯函数的分布诱导隐含层节点的稀疏状态,同时将该分布中的位置参数用来控制稀疏的力度,即根据隐藏单元的激活概率与给定稀疏值的偏差程度而具有不同的稀疏水平。通过在MNIST和Pendigits手写体数据集上进行验证分析,并与多种现有方法相比,该方法始终达到最好识别准确度,并且具有良好的稀疏性能。 相似文献
6.
7.
8.
9.
李元绪 《计算技术与自动化》2024,(2):162-169
针对传统指纹定位算法中接收信号强度值在室内复杂环境中波动较大,指纹信息不可靠,造成定位精度不足的问题,提出了一种以测距值作为指纹信息的基于深度置信网络和极限学习机的超宽带定位方法。首先在深度置信网络底层采用多个堆叠受限玻尔兹曼机对输入数据做无监督学习,来提取深层次特征,然后在顶层选用极限学习机对输入数据及位置标签进行有监督学习。建立指纹库阶段,为优化指纹采集过程并减少人工勘测成本,提出一种基于高斯过程回归的超宽带指纹库扩充方法。真实场景下实验结果显示,视距环境和非视距环境中,该定位方法均能够达到厘米级定位精度。 相似文献
10.
随着互联网广告的飞速发展,如何预测目标用户对互联网广告的点击率(click-through rate,简称CTR),成为精确广告推荐投放的关键技术,并成为计算广告领域的研究热点和深度神经网络的应用热点.为了提高广告点击率预估的精确度,提出了基于深度置信网络的广告点击率预估模型,并通过基于Kaggle数据挖掘平台数据集的1 000万条随机数据的实验,研究不同的隐藏层层数和隐含节点数目对预测结果的影响.为了解决深度置信网络在数据规模较大的工业界解决方案中的训练效率问题,通过实验证明:广告点击率预估中,深度置信网络的损失函数存在大量的驻点,并且这些驻点对网络训练效率有极大的影响.为了提高模型效率,从发掘网络损失函数特性入手,进一步提出了基于随机梯度下降算法和改进型粒子群算法的融合算法,以优化网络训练.融合算法在迭代步长小于阈值时可以跳出驻点平面,继续正常迭代.实验结果表明,与传统的基于梯度提升决策树和逻辑回归的广告点击率预估模型以及模糊深度神经网络模型相比,基于深度置信网络的预估模型具有更好的预估精度,在均方误差、曲线下面积和对数损失函数指标上分别提升2.39%,9.70%,2.46%和1.24%,7.61%,1.30%;使用融合方法训练深度置信网络,训练效率提高30%~70%. 相似文献
11.
针对传统故障诊断方法中特征提取技术难度大、故障样本获取困难等问题,在深度学习计算框架下提出了一种半监督训练的故障检测方法,利用深度信念网络中的受限波茨曼机堆栈结构实现了数据高层特征的自动提取,结合支持向量数据描述方法实现了异常数据检测,只需利用正常工况的数据样本进行网络训练和模型拟合,无需故障样本数据,也无需人工干预进行信号特征提取,即能实现对故障数据进行的实时检测和判别;经采用标准轴承实验数据的三组故障数据进行验证,故障识别率达到100%,具有很强的工程应用价值。 相似文献
12.
针对基于非负矩阵分解(non-negative matrix factorization, NMF)的语音增强方法在低信噪比部分和无结构特征的清音部分会引入失真这一问题,利用语音信号在时频域呈现的稀疏特性和深度神经网络在语音增强应用中表现出的谱重构特性,提出了一种联合稀疏非负矩阵分解和深度神经网络的单通道语音增强方法.首先对带噪语音的幅度谱进行非负矩阵分解得到与语音字典和噪声字典相对应的稀疏编码矩阵,其中语音字典和噪声字典通过对纯净语音和噪声进行训练预先得到,以维纳滤波方法恢复出语音成分的主要结构;然后利用深度神经网络在语音增强中表现出的时频保持特性,通过深层网络学习经维纳滤波分离出的语音的对数幅度谱和理想纯净语音对数幅度谱之间的非线性映射函数,进而恢复出语音结构的缺失成分.实验结果表明:所提方法可以有效抑制噪声且较好地恢复出语音成分,在语音感知质量和对数谱失真性能评价指标上均优于基线方法. 相似文献
13.
"先使用,后付费"的营销方式导致电网公司电费回收不到位,难以支撑正常运转和获得基本效益。为了解决电力欠费对电网公司的不利影响,论文提出电力欠费预警智能预测的研究方法。将电费回收分为时间和金额两部分,结合相应的关联指标,建立参数自适应的深度信念网络,通过深度学习和训练对电力欠费情况精准预测。实验结果表明,与BP神经网络相比,深度信念网络更能准确预测出用户电费回收的未来情况,有效辅助电力企业制定用电和电费预警策略。 相似文献
14.
基于感知掩蔽深度神经网络的单通道语音增强方法 总被引:1,自引:0,他引:1
本文将心理声学掩蔽特性应用于基于深度神经网络(Deep neural network,DNN)的单通道语音增强任务中,提出了一种具有感知掩蔽特性的DNN结构.首先,提出的DNN对带噪语音幅度谱特征进行训练并分别得到纯净语音和噪声的幅度谱估计.其次,利用估计的纯净语音幅度谱计算噪声掩蔽阈值.然后,将噪声掩蔽阈值和估计的噪声幅度谱联合计算得到一个感知增益函数.最后,利用感知增益函数从带噪语音幅度谱中估计出增强语音幅度谱.在TIMIT数据库上,对不同信噪比下的20种噪声进行的仿真实验表明,无论噪声类型是否在语音的训练集中出现,所提出的感知掩蔽DNN都能够在有效去除噪声的同时保持较小的语音失真,增强效果明显优于常见的DNN增强方法以及NMF(Nonnegative matrix factorization)增强方法. 相似文献
15.
分析遗传算法和仿生小波变换的原理和方法,提出一种基于遗传算法的仿生小波语音增强算法.首先将普通小波变换转换为仿生小波变换,得到仿生小波变换系数,接着利用遗传算法的选择、交叉、变异获得仿生小波的优化阈值参数,从而确定最优小波阈值,随后结合最优小波阈值和改进阈值函数去噪,最终将经阈值处理后的仿生小波的系数变换至普通小波域且实行连续小波逆变换,获得增强的语音信号.仿真结果表明,在低信噪比环境下,与传统的最小统计和仿生小波变换算法相比较,经本文提出的算法处理后的增强语音其失真和残余噪声更小,语音质量和可懂度都较高. 相似文献
16.
基于深度信念网络的文本分类算法 总被引:2,自引:0,他引:2
随着网络的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.目前已经有许多不同类型的神经网络应用于文本分类,并且取得良好的效果.但是,大部分模型仅采用文档的少量特征作为输入,没有考虑到足够的信息量;而当考虑到足够的特征时,又会发生维数灾难,导致模型难以训练或者训练时间大幅增加.利用深度信念网络从文本中抽取特征,并利用softmax回归分类器对抽取后的特征分类.深度信念网络不仅具有强大的学习能力,同时还能从高维的原始特征中抽取低维度高度可区分的低维特征,因此利用深度信念网络来对文本分类,不仅能够考虑到文档的足够的信息量,而且能够快速的训练.并且实验结果也表明利用深度信念网络实现文本分类的性能很好. 相似文献
17.
铁路在交通运输行业有着举足轻重的地位,一旦列车发生故障将会导致严重的生命财产损失。由于列车发生故障的概率相对较低,因此难以捕获列车的故障样本。针对上述问题,提出了一种无监督学习的列车故障识别方法,通过检测列车音频信号来识别列车故障。该方法基于深度信念网络(DBN),利用小波包分解提取检测信号的特征向量并将其作为DBN的输入,待网络充分训练后,由训练好的DBN识别当前列车的运行状况。现场监测实验结果表明,该方法能够在无监督的条件下有效识别列车故障,保障了列车的运行安全。 相似文献
18.
深度语音信号与信息处理:研究进展与展望 总被引:1,自引:0,他引:1
论文首先对深度学习进行简要的介绍,然后就其在语音信号与信息处理研究领域的主要研究方向,包括语音识别、语音合成、语音增强的研究进展进行了详细的介绍。语音识别方向主要介绍了基于深度神经网络的语音声学建模、大数据下的模型训练和说话人自适应技术;语音合成方向主要介绍了基于深度学习模型的若干语音合成方法;语音增强方向主要介绍了基于深度神经网络的若干典型语音增强方案。论文的最后我们对深度学习在语音信与信息处理领域的未来可能的研究热点进行展望。 相似文献
19.
利用深度卷积神经网络提高未知噪声下的语音增强性能 总被引:2,自引:0,他引:2
为了进一步提高基于深度学习的语音增强方法在未知噪声下的性能,本文从神经网络的结构出发展开研究.基于在时间与频率两个维度上,语音和噪声信号的局部特征都具有强相关性的特点,采用深度卷积神经网络(Deep convolutional neural network,DCNN)建模来表示含噪语音和纯净语音之间的复杂非线性关系.通过设计有效的训练特征和训练目标,并建立合理的网络结构,提出了基于深度卷积神经网络的语音增强方法.实验结果表明,在未知噪声条件下,本文方法相比基于深度神经网络(Deep neural network,DNN)的方法在语音质量和可懂度两种指标上都有明显提高. 相似文献