排序方式: 共有38条查询结果,搜索用时 15 毫秒
31.
32.
33.
基于深度学习的骨导语音盲增强已经取得了较好的效果,但仍存在模型体积大、计算复杂度高等问题。为此提出一种融合卷积网络和残差长短时记忆网络的轻量级骨导语音增强深度学习模型,该模型在保持语音增强质量的前提下,能有效提升骨导语音盲增强的效率。该模型借助卷积网络参数量小、特征提取能力强等优点,在语谱图频率维度引入卷积结构,从而深入挖掘时频结构的细节和高低频信息间的关联关系以提取新型特征,并将此新型特征输入改进后的长短时记忆网络中,用于恢复高频成分信息并重构语音信号。通过在骨导语音数据库上实验,表明所提模型可以有效改善高频成分的时频结构,在提升增强效果的同时,降低了模型体积和推理的计算复杂度。 相似文献
34.
针对基于非负矩阵分解(non-negative matrix factorization, NMF)的语音增强方法在低信噪比部分和无结构特征的清音部分会引入失真这一问题,利用语音信号在时频域呈现的稀疏特性和深度神经网络在语音增强应用中表现出的谱重构特性,提出了一种联合稀疏非负矩阵分解和深度神经网络的单通道语音增强方法.首先对带噪语音的幅度谱进行非负矩阵分解得到与语音字典和噪声字典相对应的稀疏编码矩阵,其中语音字典和噪声字典通过对纯净语音和噪声进行训练预先得到,以维纳滤波方法恢复出语音成分的主要结构;然后利用深度神经网络在语音增强中表现出的时频保持特性,通过深层网络学习经维纳滤波分离出的语音的对数幅度谱和理想纯净语音对数幅度谱之间的非线性映射函数,进而恢复出语音结构的缺失成分.实验结果表明:所提方法可以有效抑制噪声且较好地恢复出语音成分,在语音感知质量和对数谱失真性能评价指标上均优于基线方法. 相似文献
35.
知识蒸馏能有效地将教师网络的表征能力迁移到学生网络,无须改变网络结构即可提升网络的性能.因此,在性能优异的目标分割主干网HRNet(High-Resolution Net)中构建自蒸馏学习模型具有重要意义.针对HRNet并行结构中深层与浅层信息充分融合导致直接蒸馏难以实现的挑战,本文提出一种基于多尺度池化金字塔的结构化自蒸馏学习模型:在HRNet分支结构中引入多尺度池化金字塔表示模块,提升网络的知识表示和学习能力;构造“自上而下”和“一致性”两种蒸馏模式;融合交叉熵损失、KL(Kullback-Leibler)散度损失和结构化相似性损失进行自蒸馏学习.在四个包含显著性目标和伪装目标的分割数据集上的实验表明:本文模型在不增加资源开销的前提下,有效提升了网络的目标分割性能. 相似文献
36.
采用静电纺丝制备的一维氧化锌(ZnO)纳米纤维是一种常见的可用于光催化降解有机染料和重金属离子污染物的半导体光催化剂。然而已报道的纳米纤维表面较为光滑,光催化能力有待进一步提高。本研究以硝酸锌为锌源,乙醇和N,N-二甲基甲酰胺作为混合溶剂,利用静电纺丝和高温煅烧合成了表面和内部同时具有丰富孔洞的树皮状ZnO纳米纤维,并研究了其对亚甲基蓝和Cr(Ⅵ)的光催化降解性能。通过调节纺丝液中锌源的浓度,得到了不同结构的ZnO光催化剂。X射线衍射仪、扫描和透射电子显微镜测试结果表明,所制备的ZnO纳米纤维高度结晶,纤维表面均匀分布有片状结构。光催化测试表明,经过3h紫外光照射后,树皮状ZnO纳米纤维对亚甲基蓝和Cr(Ⅵ)的降解效率分别达93.6%和63.4%。 相似文献
37.
研究中国碳排放关键影响因素对于实现碳达峰碳中和目标具有关键意义。首先,运用空间杜宾模型分析2003—2019年我国各省碳排放量的空间集群效应,表明我国碳排放量具有显著的空间分布特性,其中能源结构对碳排放量的影响最大,其次人口规模、能源强度,人均GDP、城镇化率和产业结构对碳排放也有一定的影响。然后,选取人均GDP、能源结构、能源强度、人口规模和城镇化率作为碳排放影响因素,发展了联合改进蝙蝠算法与BP神经网络的碳排放量预测模型,测试结果表明该模型的预测平均误差为0.16%。最后,设立高速、中速、低速碳达峰3种情景进行情景分析,得到了我国计及碳汇的碳排放量预测值,研究表明在高速和中速情景下,我国有望在2028—2029年实现碳达峰目标,对应碳排放峰值在120亿~122亿t之间。本研究可为我国制订能源强度和能源结构的调整方案提供参考。 相似文献
38.
数字音频作为网络空间中广泛应用的媒体,是承载秘密信息的良好载体,常被用来构建实时性强、复杂度低、不可感知性好的隐蔽通信。音频隐写作为确保网络信息安全和数据保密通信的关键技术手段之一,正受到越来越多学者的关注。本文对音频隐写方法的发展脉络进行了系统性梳理。首先,介绍了音频隐写的基本内容,对问题描述、常用数据格式、工具和评价指标等进行总结。其次,按照嵌入域的不同,将传统音频隐写方法分为时域方法、变换域方法和压缩域方法,并分析其优缺点;根据隐写载体的不同,将基于深度学习的隐写方法划分为嵌入载体式、生成载体式和无载体式音频隐写,并对这3种音频隐写方法进行了对比分析。最后,指出了当前音频隐写进一步的研究方向。 相似文献