共查询到20条相似文献,搜索用时 31 毫秒
1.
吴俊杰 《计算机测量与控制》2020,28(1):116-119
传统声纹识别人控制系统识别准确率低,存在语音识别噪声鲁棒性问题。针对上述问题,基于非单调共轭梯度算法设计了一种新的声纹识别机器人控制系统,采用BioVoice 2.0 标准声纹采集器采集数据,提取声纹特征,根据提取的声纹特征建立模型库,同时引用了两个声纹数据采集终端,型号分别是TMC104-B和TMC104,选用型号为AS-MrobotR的机器人配合采集器和采集终端实现工作。在Windows平台下使用C/C+语言研究了一种专用的程序,在程序内部添加mde-api数据库,完成训练程序和识别程序。实验结果表明,基于非单调共轭梯度算法的声纹识别机器人控制系统能够很好地解决语音识别噪声鲁棒性问题,在有噪声环境下识别准确率提高15.24%,在无噪声环境下识别准确率提高21.55%。 相似文献
2.
声纹识别利用说话人生物特征的个体差异性,通过声音来识别说话人的身份.声纹具有非接触、易采集、特征稳定等特点,应用领域十分广泛.现有的统计模型方法具有提取特征单一、泛化能力不强等局限性.近年来,随着人工智能深度学习的快速发展,神经网络模型在声纹识别领域崭露头角.文中提出基于长短时记忆(Long Short-Term Memory,LSTM)神经网络的声纹识别方法,使用语谱图提取声纹特征作为模型输入,从而实现文本无关的声纹识别.语谱图能够综合表征语音信号在时间方向上的频率和能量信息,表达的声纹特征更加丰富.LSTM神经网络擅长捕捉时序特征,着重考虑了时间维度上的信息,相比其他神经网络模型,更契合语音数据的特点.文中将LSTM神经网络长期学习的优势与声纹语谱图的时序特征有效结合,实验结果表明,在THCHS-30语音数据集上取得了84.31%的识别正确率.在自然环境下,对于3 s的短语音,该方法的识别正确率达96.67%,与现有的高斯混合模型和卷积神经网络方法相比,所提方法的识别性能更优. 相似文献
3.
声纹识别系统的识别性能会随着环境噪声的增强而急剧降低,为了使系统具备一定的噪声鲁棒性,提出了一种基于数据驱动缺失特征检测与重建的声纹识别前端处理方法。充分利用大量数据训练得到的信息估计子带信噪比,检测、标记和重建被噪声污染严重的子带特征,从而得到噪声鲁棒性特征参数。实验表明,该方法在低信噪比环境下取得了较高的识别率提升,在非平稳噪声下系统性能也有着较好的改善。 相似文献
4.
本文建立了一种基于RBF神经网络的声纹识别系统。提取了Mel频率倒谱系数及其一阶差分参数,利用时间规整网络对所得参数进行了有效的简化,运用RBF神经网络对声纹特征参数进行了训练和识别。Matlab的实验结果表明,RBF神经网络在声纹识别中具有良好的发展前景。 相似文献
5.
针对传统声纹识别方法实现过程复杂、识别率低等问题, 提出了一种基于ResNet-LSTM的声纹识别方法.首先采用ResNet残差网络提取声纹的空间特征, 其次采用LSTM长短期记忆循环神经网络提取声纹的时序特征,通过ResNet与LSTM结合的特征提取方法获得了同时包含空间特征与时序特征的深度声纹特征. 实验结果表明,采用ResNet-LSTM网络的声纹识别方法的等错误率降低至1.196%, 较基线方法d-vector以及VGGNet分别降低了3.68%与1.95%, 识别准确率达到了98.8%. 相似文献
6.
电力变压器是直接影响电力系统安全运行的重要设备之一,目前多采用图像或侵入式传感测量的方式,本文设计了变压器声纹采集装置、特征提取方法、以及基于迁移学习的深度神经网络识别模型.首先,采集并预处理变压器噪声信号,对分帧信号进行时域和频域特征提取,获得声纹特征向量,然后,输入迁移学习算法模型,实现变压器直流偏磁、过负荷、以及绕组变形等8种工况的智能识别诊断,最后,设计声纹特征数据库建立方法,采集变压器运行声学样本,对声纹识别算法模型进行训练和优化.通过数据集对比测试和变电站部署应用,验证了算法模型的识别准确度和系统可行性,该装置可作为当前监测手段的有效补充,提高变压器综合监测和潜伏性缺陷识别能力. 相似文献
7.
通过分析掌纹、指纹、虹膜、人脸、步态、声纹等生物特征识别技术的特点以及煤矿现场对入井人员生物特征的影响,指出虹膜识别、人脸识别、步态识别、声纹识别适用于煤矿入井人员唯一性检测;提出了一种基于人员定位和生物特征识别的煤矿入井人员唯一性检测技术方案,将生物特征识别技术嵌入人员定位系统,利用人员定位识别卡实现识别卡数量及人员身份的唯一性检测;指出煤矿入井人员唯一性检测技术的研究关键点是严重污染人脸的识别算法、对设备遮挡情况下人员步态图像的采集及对混入人员语音信号的煤矿现场噪声消除算法。 相似文献
8.
研究人的声纹的准确识别问题.声音特性没有一个统一的、不可变的标准,人的声音容易受到外界的干扰,声音的声纹美尔频率倒谱系数特征各项属性很容易发生变化.现有算法多半以声纹美尔频率倒谱系数为基础,识别效果容易受环境噪声、语音变异等因素的影响,造成声纹的干扰性变化,造成识别的精度不高.为此提出了一种基于语义特征和美尔频率倒谱系数特征相结合的声纹识别算法.利用MFCC准确提取语音中的频率特征,转化成自然语言环境下的语义特征,由于语义特征不受客观因素影响,减少了噪声信号对语音信号的影响,实现对语音特征的准确识别.实验表明,利用改进算法实现了差异化车辆图像的正确识别,提高了识别的准确度. 相似文献
9.
10.
面向在运变压器运行状态在线监测应用,基于压缩感知理论和小波包分析技术,提出一种基于压缩感知和小波信息熵的变压器声纹特征提取方法,用于变压器声振异常检测和故障诊断。采用本文方法提取变压器铁心故障仿真数据声纹信号特征,应用PSO-SVM分类完成故障诊断仿真。实验结果表明,本文方法能够在较高压缩率条件下,获取较高的故障识别精度。 相似文献
11.
为了在电力系统不同故障位置、故障时刻和噪声环境中准确识别暂态故障类型,提出基于机器学习的电力系统暂态故障事件智能识别方法。将暂态故障结构特征值作为量子粒子群优化径向基神经网络模型的输入向量,通过选取合适的参数编码策略、适应度函数以及终止条件,输出优化后径向基神经网络最优参数,完成故障事件智能识别。仿真实验结果表明,该方法采用量子粒子群优化算法(QPSO)优化径向基函数(RBF)神经网络可以获取最佳训练参数,训练时间为3.561s,训练误差为0.000 257 7,可在不同故障位置、故障时刻和噪声环境下正确识别暂态故障类型,且识别效率优势显著。 相似文献
12.
声纹具有独特的生物学特征且相对稳定,已被广泛应用于身份识别。大数据时代,依托人工智能和云计算的声纹识别技术是新形势下打击电信网络诈骗的有力武器。本文基于声纹识别技术研究设计反诈系统,为精准打击电信网络诈骗犯罪实战提供了新路径。 相似文献
13.
传统说话人识别框架大多建立在高斯混合模型(GMM)上的,然而这种浅层学习模型不能有效地表征数据特征之间的高阶相关性,识别效果较差。本文提出一种基于深度神经网络(Deep Neural Network, DNN)与基音周期(Pitch Period, PP)相结合的说话人识别方法,模型主线识别以对数梅尔滤波器组特征参数作为DNN的输入,通过训练DNN模型提取说话人的声纹特征;针对DNN模型阈值设定人的主观性影响,利用动态时间规整技术匹配说话人基音周期进行辅助识别。实验结果表明,这种双重识别方法等错误率可以达到1.6%,较DNN系统与EM-GMM系统等错误率分别降低了1.2%和2.4%,并且在噪声环境中仍具有较好的鲁棒性。 相似文献
14.
15.
16.
为了提高声纹识别技术的识别性能,将DenseNet应用于语谱图实现声纹识别,从提高网络的运算效率和增强声纹特征的表征能力2个方面对DenseNet进行优化,提出采用深度可分离卷积来减少网络的参数量,以及增加中心损失函数项来提高声纹特征的表征能力.从训练结果可以看出,通过深度可分离卷积,网络的参数量减少了25.5%,模型... 相似文献
17.
针对因环境中存在过多噪声,导致桥梁焊缝裂纹识别精准度低的问题,提出基于声发射信号的桥梁焊缝裂纹识别方法。利用传感器提取桥梁周围的实时信号,通过信号在周期序列上的幅值变化,判定噪声信号,采用小波变换算法对噪声信号实施重构变换,建立硬阈值和软阈值函数,约束噪声信号。采用神经元传递函数计算原始信号序列中隐含层神经元的具体特征表现参数,得到信号的特征类间平均值,通过类间参数求得特征量。以带有声发射信号提取技术的传感器作为识别载体,将特征参数输入到识别传感器中,针对不同的桥梁测试点,建立焊缝裂纹识别通道,完成有效识别。实验结果证明,所提方法的识别精准度较高,无论是以持续频率还是持续时间信号作为测试指标,均能实现高效识别。 相似文献
18.
传统声纹识别方法过程复杂,模型识别准确率低,是声纹识别应用发展的关键问题。利用深度学习具有自主特征提取及分类的特点,结合卷积神经网络(CNN)和长短期记忆网络(LSTM),提出一种结合的网络模型学习声纹识别特征及对其进行身份认证。将原始语音转换为固定长度语谱图,顺序进入CNN、LSTM,结合网络进行训练以及声纹特征学习。通过对比CNN、LSTM以及DNN网络,验证CNN-LSTM网络在声纹识别中具有较少迭代次数情况下高准确率的特性。经实验结果可以得出,语音空间特征及时序特征均是声纹识别中重要的影响因素,实验中的CNN-LSTM网络模型准确率达到95.42%,损失低值达到0.097 3。该方法有利于实际声纹识别的应用。 相似文献
19.
声纹识别中,提出基于隐马尔可夫-通用背景模型的识别算法。针对声纹密码中每个人的注册语音数据量很少的问题,提出使用大量其他人数据先建立话者无关的声韵母隐马尔可夫模型作为通用背景模型,再根据最大后验概率准则,以通用背景模型为基础使用训练语音自适应获得说话人模型。该方法解决在声纹密码识别中训练数据不足的问题。在讯飞桌面数据库Ⅱ上,采用该算法的系统的等错误率为6。8%。 相似文献
20.
为了提高锂电池储能预警能力,结合边缘计算技术设计了一种锂电池储能预警系统。采用多模态锂电池声纹识别装置采集锂电池运行过程中发出的声音特征,并对声纹特征参数进行提取,计算出声纹信号的功率谱。在锂电池声纹识别装置中使用了FPGA芯片和硬件加速器,通过构建BP-SNN融合神经网络的故障预警模型结合反向传播神经网络与脉冲神经网络,利用特定的神经元模型进行时间信息的计算与传递,从而对锂电池监测数据的时间序列进行有效处理,提高锂电池故障预警能力。 相似文献