共查询到20条相似文献,搜索用时 15 毫秒
1.
介绍了语音通信声学回声产生模型和自适应AEC回声消除算法原理,分析了AEC应用于VoIP语音通信中存在的问题,设计了一种基于短时能量的非线性回声消除方法,在NGN网络的VoIP通信中,使用该方法实现了极高的回声抑制比。测试结果表明该方法的消回声效果、算法稳定性和实现复杂度等指标明显优于自适应AEC算法,适合于嵌入式VoIP通信终端设备的开发。 相似文献
2.
随着无线通信技术的迅猛发展,以手机为代表的无线通信终端已经成为大众应用最为广泛的通信工具。这其中语音通话功能是非常重要的用途,通话质量的优劣直接影响着用户感受。而通话回声问题是最难解决的部分,因为回声产生途径多样、软件处理算法复杂、回声调试参数众多,因此给研发工程师调试带来很大困难。文章介绍NXP平台回声消除算法的原理及其应用,旨在帮助工程师较快理解此平台回声消除算法机理并运用介绍的思路进行软件音频调试系统的开发和应用,从而达到改善无线通信终端回声效果的目的。 相似文献
3.
针对极端环境话音系统下声学回波影响工作人员正常施工,且常规声学回声消除算法收敛速度慢的问题,提出一种基于动量梯度下降的基于l0范数的改进系数成比例归一化最小均方误差算法(L0-IPNLMS)。该算法将动量因子引入L0-IPNLMS算法中,解决在算法运行过程中梯度下降时梯度摆动幅度可能过大的问题,也提高了自适应滤波器的收敛速度,且残余回声下降明显,声学回波抑制效果更好。仿真实验表明,与L0-IPNLMS算法相比,新算法在模拟随机多音信号与真实语音信号输入时,均方误差(MSE)可以降低3.47 dB和3.69 dB,回波抑制比(ERLE)提高了3.46 dB和3.68 dB,在低信噪比情况下,使用新算法对真实语音信号进行回声消除,收敛速度高于L0-IPNLMS等算法,且收敛效果有明显改进。 相似文献
4.
现有单目深度估计(Monocular depth estimation)算法存在细节估计不准确、同一平面距离估计错误的问题。深度信息是通过图像像素的三通道信息估计出来的,目前已有的算法中很少考虑特征图通道之间的相互关系对深度信息的影响。因此本文提出了一种SE-DenseDepth网络,在网络的编码器中嵌入通道注意力机制,依据不同通道对深度信息的贡献度差异,对通道进行编码,提高编码器对图像特征的表征能力。为了获得图像精细的深度信息,网络建立编码器到解码器的跳连接,引入了更多的低层信息。本文在通用室内数据集NYU-Depth V2上训练,并在真实数据上测试。实验结果表明,本文提出的方法在深度突然变化的细节区域表现更好,在远距离大平面的情况下不会出现深度的断层,与其他主流算法相比可以获得较好的深度估计性能。 相似文献
5.
针对弹载武器可见光图像与红外融合高层特征融合不足,目标细节表现不突出导致打击目标检测失败的问题,提出了一种基于注意力机制的残差密集网络的红外与可见光图像融合模型。受残差网络和密集网络的启发,设计了一种基于残差密集网络的图像融合算法解决融合图像细节纹理信息不足的问题。采用注意力机制有效提取目标特征区域的关键信息,通过局部残差融合和全局残差融合算法保留目标的纹理细节。此外,为了更好地保留可见光图像中的细节纹理,对目标细节特征发现时增强特征抑制。实验证明,该算法能够增强目标细节特征,同时有效保存了其轮廓信息,与不采用注意机制提高相比,融合精度提高了5%,运算量下降2%左右。 相似文献
6.
7.
8.
视频会议场景中,用户扬声器、麦克风的非线性特性,使得麦克风采集到的回声信号存在明显失真,线性回声消除后仍会残留大量非线性回声,且能量和近端语音相当。此时需要高强度的非线性回声处理保证不漏回声,但近端语音也会被明显抑制甚至消音,影响会议体验。针对上述难点,提出一种基于最小无失真方差响应(Minimum Variance Distortionless Response,MVDR)后置滤波器的多通道回声消除算法,将各通道的信号分别进行线性回声处理,然后使用MVDR后置滤波提升近端语音能量、抑制残留回声能量,最后通过低强度非线性回声抑制器,得到回声消除后的信号。测试表明,本文方案多抑制了6.05%残留非线性回声,同时提升13.51%的近端语音能量,经过低强度的非线性回声抑制(Non-Linear Processing,NLP)处理后,保留了更多的近端语音能量,改善了语音通透性。本文提出的算法可以实时运行于低成本移动平台上。 相似文献
9.
10.
声学回声消除技术(AEC)在会议扩声系统的应用 总被引:1,自引:0,他引:1
从分析声学回声在电话会议的互联互通会议中的形成过程出发,解析了何为声反馈、回声及声学回声。详细讲解了声学回声的形成原理、过程以及危害所在,并提出在电话会议室会议扩声系统中消除声学回声的技术方法。 相似文献
11.
12.
为了提高VoIP的通信质量,减少回声干扰,对LMS算法、NLMS算法进行阐述,基于NLMS提出了一种运算量小并且提高收敛性能的改进的自适应滤波算法。通过在Matlab下的仿真研究和对误差曲线的分析,证明了该改进算法的收敛速度快,均方误差小。用改进的算法对语音回声信号进行消除,仿真得到消除回声后的信号效果明显,为IP电话中回声消除的自适应滤波问题提供了一个较好的算法。 相似文献
13.
14.
15.
语音增强的目的是从带有噪声的语音中分离出纯净语音,实现语音的质量和可懂度的提高。近年来,采用有监督学习的深度神经网络已经成为了语音增强的主流方法。卷积循环网络是一种新型的神经网络结构,包含编码层、中间层、解码层三个主要模块,其已经在语音增强任务中取得了较好的效果。时频注意力机制是一个由数个相连的卷积层通过跳跃连接构成的简单网络模块,在训练过程中可以计算语音幅度谱特征图的非邻域相关性,从而更加有利于网络关注到语音的谐波特性。本文将时频注意力机制引入卷积循环网络的编码层和解码层中,实验结果表明,在不同信噪比条件下,该方法相比基线卷积循环网络能够进一步提高语音质量和可懂度,且增强后的语音信号可以保留更多的语谱谐波信息,实现更低程度的语音失真。 相似文献
16.
文章从注意力机制结合其他深度技术的角度探讨基于注意机制的深度学习技术在推荐领域的应用类型,将注意力机制结合卷积神经网络、循环神经网络进行归纳梳理,并对局限性进行探讨,最后展望推荐领域未来研究趋势. 相似文献
17.
由于红外探测器感应波段与可见光不同,不依赖于大气光的反射传播,而是取决于环境中物体自身散发的辐射强度,所以其在雾霾、夜晚等可见度低的条件下往往比可见光具有更好的目标检测效果。针对红外场景中目标检测精度低、实行性差的问题,提出一种基于注意力机制的红外目标检测方法。首先,设计一种轻量化网络结构;其次,采用注意力机制提高网络的特征提取能力;然后,改进迭代特征金字塔结构提高对不同尺度目标的检测能力;最后,在训练过程中引入complete intersection over union(CIoU)损失函数和梯度均衡机制(GHM)损失函数改善正负样本不平衡问题。与其他算法的对比实验结果表明,所提算法的检测精度和速度显著提高。 相似文献
18.
为解决由行人姿态、环境等复杂因素导致的行人特征表达能力弱、识别率低等问题,本文通过对AlignedReID++模型进行改进,提出了基于跨纬度交互注意力机制的行人重识别方法.首先,在特征提取部分,将跨纬度交互注意力Triplet At?tention模块嵌入到ResNet50网络中,捕获空间维度和通道维度之间跨纬度的交互... 相似文献
19.
多标签文本分类的结果很大程度上受到标签相关性的影响.为了更加细致地处理标签相关性问题,提出一种融合注意力机制的多标签文本分类方法.首先,将文本和标签预处理后,对标签输入采用两种不同的嵌入方式提取特征;其次,运用注意力机制处理信息,针对文本和标签信息,自注意力机制进行特征处理,标签注意力机制和交互注意力机制进行依赖关系处理,进而得到两种不同状态下的表示方式;最后,通过两次融合,充分表示文本标签信息,得到较好的标签分类结果.实验结果显示,较之于基线方法,在精度和归一化折损累计增益上,该方法数据总体有所提高.由此,该方法可以有效地融合文本和标签信息,缓解标签相关性问题,有利于提升多标签文本分类任务性能. 相似文献
20.
入侵检测的难点之一是如何准确识别流量数据的异常特征。文中提出一个基于卷积神经网络(CNN)、双向长短期记忆网络(Bi-LSTM)和注意力(Attention)的时序流量异常检测模型,即BLAC。为提高BLAC模型的特征提取准确度,使用CNN提取流量数据中的空间特征,利用Bi-LSTM提取流量数据的完整时间特征,解决Attention难以对复杂时间序列数据位置信息进行编码的问题。通过对Attention权重的可视化分析,推测出异常在窗口中发生的时间点。使用雅虎的Webscope S5数据集进行对比试验,结果表明,BLAC模型的性能优于其他SOTA模型,其中关键指标召回率高达98.69%,表示二分类精确度的F1得分达到97.73%。 相似文献