排序方式: 共有58条查询结果,搜索用时 15 毫秒
11.
该文针对不规则干扰导致文字图片字符识别率下降的问题,提出一种基于U型网络框架和部分卷积运算的文字图片修复模型.首先,针对常见字体的干扰问题,通过图像融合建立干扰文字图像数据库,在逐像素损失、感知损失和全变分损失的共同约束下,根据已有笔画细节对污损部分进行修复,并对污损汉字的字体形状和笔画走向的细部特征进行复原;其次,使... 相似文献
12.
用支持向量机建立新的核函数,使得该函数集集成无穷多个AdaBoost算法的弱分类器,最终形成强分类器。应用该强分类器进行人脸检测。实验结果表明,该方法的人脸检测率优于有限维AdaBoost算法,提高了检测精度。 相似文献
13.
14.
针对噪声干扰环境下的说话人识别问题,提出了一种基于多任务学习的语音增强方法作为说话人识别系统的前端.在卷积神经网络(CNN)的基础上,通过构建语音增强与说话人识别的融合网络多任务学习模型,同时在输入输出端拼接梅尔频谱倒谱系数(MFCC)和基音周期特征作为辅助任务,以及利用同方差不确定性自适应调整损失权重.实验结果表明,... 相似文献
15.
针对语种识别在噪声环境下识别率低的问题,提出了一种基于对数Gammatone滤波器能量特征谱图的语种识别方法。依据Gammatone滤波器组的听觉特征提取出对数Gammatone滤波器能量特征,并将特征转化为图像获得特征谱图,然后运用暗通道先验算法对特征图进行增强去噪,最后使用残差神经网络模型进行训练识别。实验表明,在信噪比为0 dB,噪声源分别为白噪声、车内噪声和粉红噪声时,该方法相对于线性灰度语谱图识别率分别提升了32.7%、10.1%和29.1%,且在其他信噪比下的识别率也有一定的提升。 相似文献
16.
为了提高说话人识别系统的性能,提出基于改进语谱图的深度学习说话人识别算法。语谱图当中包含了语音的内容、情绪、语种以及说话人身份等多种信息,在以往的说话人识别算法中,往往没有考虑到说话人身份特性,采用直接提取语音中的语谱图作为网络输入,而说话人识别系统中需要提取语谱图中表征身份的信息,因此需要在原始语谱图的基础上进行改进。在语谱图中,基音频率以及共振峰等信息最能表现说话人的身份特征,从而提出根据语音信号中每一帧的基音频率进行自适应梳状滤波,得到改进后的语谱图,再通过卷积神经网络提取说话人特征,从而达到提升识别准确率的效果。网络模型采用MobileNetv2神经网络,该网络模型具有模型参数少、收敛速度快、识别速度快等优点,有利于实际应用。在对照实验结果中,该方法相对于原始语谱图的准确率分别提高了2.3%、5.2%、3%。 相似文献
17.
AWGN下平方环和科斯塔斯环的性能仿真分析 总被引:1,自引:0,他引:1
采用计算机仿真的方法,评估加性高斯白噪声(AWGN)对锁相环(PLL)相位估计性能的影响,进而对AWGN下两种在工程中大量使用的非面向判决环——平方环和科斯塔斯(costas)环的性能情况进行仿真对比分析,得出在噪声对相位估计值的影响方面,平方环和科斯塔斯环的性能相似。 相似文献
18.
19.
句法分析是自然语言处理领域中应用前景非常广阔的一个研究方向.针对目前句法分析多数是从字、词的角度出发且存在诸多不足,提出了二、三元词模型相结合的句法规则层次化分析算法,并结合分词、词性标注以及句子组织信息之间的结合度来解决词元间优先合成的问题,同时利用句子成分之间的语法结构关系对词性、词序的影响,实现句法规则的层次化分... 相似文献
20.