共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
音频场景分类是场景理解重要的一环,学习音频场景特征并精准分类能加强机器与环境的交互能力,在大数据时代其重要性不言而喻。鉴于分类任务表现依赖数据集规模,但实际任务中又面临数据集严重不足的情况,本文提出了数据增强和网络模型预训练策略,将频谱图转换器模型和音频场景分类任务相结合。首先,提取音频信号对数梅尔能量频谱图输入模型,然后通过模型动态交互能力,加强音频序列空间关系,最后由标记向量完成分类。将本文方法在DCASE2019task1和DCASE2020task1公开数据集上进行测试,分类准确率分别达到了96.489%和93.227%,与已有算法相比有明显的提升,说明本方法适用高精度音频场景分类任务,为高精度智能设备感知环境内容、检测环境动态打下了基础。 相似文献
4.
让计算机具有识别情感的能力是情感智能的主要标志和实现高级别人机交互的重要前提,其中通过记录和分析生理信号来识别情感状态已经成为情感计算和人机交互研究领域中的热点。针对多生理信号情感识别过程中的特征冗余以及在大样本数据下传统特征降维算法效率普遍不高的现状,提出了结合模拟退火和粒子群算法的混合智能优化算法(SA-PSO)来解决情感特征选择的问题,并结合带权重的离散KNN分类算法(WD-KNN),充分利用情感样本信息进行特征分类。通过对实验仿真数据的分析和与其他方法识别结果的比对,提高了识别率和效率,验证了算法的有效性。 相似文献
5.
为解决网络智能运维中智能模型构建门槛高、效率底的问题,提出了一种异常检测算法选择框架,通过对提取的时序数据特征进行波形分类,根据数据分类结果进行异常检测算法的最优匹配,并依据指令对本地选定的模型进行训练、更新,依靠选择的检测算法以及更新后的模型进行实时异常检测.本系统可以针对现实环境中各种KPI数据自动适配异常检测算法... 相似文献
6.
为了更好地从戏剧视频提取关键情节,提出了一种基于音乐情感特征(MEF)融合人脸特征(HFF)的自动提取方法.首先,利用基于音频指纹技术的二级音乐情感识别方法进行音频识别,并利用人脸特征进行视频识别;然后,利用音频和视频识别得到的各元素获取关键情节值,从而提取关键情节;最后,提出了一种量化评估方法评估关键情节提取方法的一致性.在四个戏剧视频上的评估实验验证了该方法的有效性及可靠性,相比其他几种较新的提取模型,该方法提取效果更好. 相似文献
7.
面向边缘计算设备的改进型YOLOv3垃圾分类检测模型 总被引:1,自引:0,他引:1
为提高垃圾分类的自主化和智能化程度,垃圾桶需要配备视觉传感器和搭载有效的垃圾检测与分类算法的智能硬件.针对该需求,提出了一种基于改进型YOLOv3的智能化垃圾识别分类算法.首先,引入MobileNetv3网络代替YOLOv3的主干网络Darknet53,并加入空间金字塔池化结构,在减少网络模型计算复杂度的同时保证模型准... 相似文献
8.
苟元琴 《信息技术与信息化》2022,(1):64-67
针对互联网时代网络言论不断增加而带来的监管难题,设计了基于语义识别和情感分析的网络舆情监测系统.首先,根据资源特征,构建了通用的网页爬取框架,通过去噪和去重后将结构化舆情信息储存到数据库中;然后,对分类特征进行降维处理并改进分类算法,同时,针对话题发现模型中存在的问题,提出一种情感词典扩充方法,能够对未知的情感词进行情... 相似文献
9.
自然图像情感分类在分析用户需求、监控网络舆情等方面具有重要意义。然而基于深度学习的分类算法存在训练过程难以控制、分类结果缺乏解释的问题。为此提出一种人类知识驱动的深度学习结构优化算法。首先通过特征可视化显示卷积神经网络提取的情感特征;其次结合人类对图像情感可视化结果的感知来优化网络结构,利用人类知识驱动网络,重点学习情感信息更明显的特征;最后对所构建网络的参数进行微调,使其更适用于自然图像情感分类任务。在Twitter情感图像数据集上与其他分类方法的对比实验表明,所提出的算法获得了88.1%的分类准确率,优于其他方法。消融实验证明网络优化结果比未优化提高了8.1%。类激活图、空间位置和神经元组特征可视化直观解释了模型运作的过程与原因,进一步证实算法识别自然图像情感的能力。 相似文献
10.
11.
为了提高数据分类的快速性与准确性,本文在大脑情感学习(Brain Emotional Learning,BEL)模型的基础上,结合遗传算法(Genetic Algorithm,GA),提出了一种基于GA-BEL的快速分类改进算法.BEL模型根据大脑中杏仁体和眶额皮质之间相互学习的神经生物学原理建立,模拟了情感刺激在大脑短反射通路中被快速处理的过程.因此,基于BEL模型的网络运算速度快.进一步采用遗传算法优化BEL网络权值,提高其分类正确率.在UCI数据集上的对比实验结果表明,无论对于小样本还是大样本数据集,较其他分类算法,GA-BEL算法均有较高的分类正确率和计算效率. 相似文献
12.
13.
为了提高传感器目标识别性能和近距空中目标识别准确性,结合雷达和红外传感器提出了一种目标融合识别模型:对于雷达传感器,提出基于参数学习贝叶斯网络的目标识别方法,首先采用EM算法对贝叶斯网络进行参数优化,然后根据获取的目标属性信息进行目标分类;对于红外成像传感器,采用基于小波矩特征的目标识别方法,首先对目标图像进行小波矩特征提取和选择,然后通过建立的BP神经网络分类器进行目标分类;最后通过D S证据组合法则对两部分识别结果进行融合处理,实现了基于雷达和红外数据融合的近距目标识别。仿真结果表明:和单传感器相比,所提出的模型可以更加精确地进行目标识别。 相似文献
14.
15.
随着并行计算能力的不断攀升和音频数据量的日益扩增,音频场景识别成为场景理解领域重要的研究内容之一。针对音频场景识别建模难度大和识别准确率不高的问题,本文提出了融合多优化机制的并行卷积循环神经网络算法模型。首先,将音频信号经预处理后转化为一定尺寸的梅尔声谱图,之后输入到网络模型中进行充分的空间特征和时间特征学习,最后进行识别。为了验证模型的有效性,在DCASE2019音频场景数据集上进行识别性能测试,结果显示,该算法模型对音频场景的识别准确率能够达到88.84%,优于传统网络模型,说明该算法模型对音频场景识别问题的有效性。 相似文献
16.
本文提出了一种录音设备的建模和识别算法。在特征选择方面,考虑到音频段中的静音包含了与正常语音一样的设备信息,并且不受说话人、文本、情感等因素的影响,因此从静音段中提取出表征录音设备“机器指纹”的特征,并用谱减法去除其中的背景噪声。在识别模型方面,利用设备通用背景模型构建反对设备模型;在设备通用背景模型的基础上,利用少量的特定设备数据,通过MAP自适应算法获得相应录音设备的模型。最后通过归一化似然度得分对输入的特定录音设备的语音样本进行分类判决。实验结果表明,对于9种不同录音设备的平均正确识别率为87.42%,并考察了不同因素对本文算法的影响,验证了本文算法的有效性和可靠性。 相似文献
17.
为提升人机交互时的用户体验以及满足多元化用途的需求,交互设备正逐步引入情感智能技术,其中,实现产业和技术有效融合的前提是可以对人类情感状态进行正确的识别,然而,这仍然是一个具有挑战性的话题。随着多媒体时代的快速发展,越来越多可利用的模态信息便逐步被应用到情感识别系统中。因此,本文提出一种基于特征蒸馏的多模态情感识别模型。考虑到情感表达往往与音频信号的全局信息密切相关,提出了适应性全局卷积(Adaptive Global Convolution, AGC)来提升有效感受野的范围,特征图重要性分析(Feature Map Importance Analysis,FMIA)模块进一步强化情感关键特征。音频亲和度融合(Audio Affinity Fusion, AAF)模块通过音频-文本模态间的内在相关性建模亲和度融合权重,使两种模态的情感信息得到有效融合。此外,为了提升模型泛化能力,有效利用教师模型中概率分布所携带的隐藏知识,帮助学生模型获取更高级别的语义特征,提出了在多模态模型上使用特征蒸馏。最后,在交互式情感二元动作捕捉(Interactive Emotional Dyadic Mot... 相似文献
18.
音乐灯光表演系统中音乐识别技术研究 总被引:2,自引:1,他引:1
分析了MIDI音乐情感体现及其计算机自动识别方法,利用支持向量机、聚类分析等先进算法实现了MIDI音乐基本特征数据的提取、主旋律音轨的自动定位、乐句的智能划分和音乐情感的识别。音乐特征与情感识别准确率高。 相似文献
19.
针对传统方法忽略时序信息的问题,提出了一种基于张量模型的暴力音频分类技术.该方法首先对音频样本提出矩阵特征,然后把同一类型的样本特征组成一个张量特征.采用ALS算法对张量进行分解,然后提出一个基于张量模型的分类器.实验结果表明,张量模型的特征对暴力音频分类问题具有一定提高效果,证明了保留时间维度上的信息是有意义的. 相似文献
20.
对于语音的情感识别,针对单层长短期记忆(LSTM)网络在解决复杂问题时的泛化能力不足,提出一种嵌入自注意力机制的堆叠LSTM模型,并引入惩罚项来提升网络性能.对于视频序列的情感识别,引入注意力机制,根据每个视频帧所包含情感信息的多少为其分配权重后再进行分类.最后利用加权决策融合方法融合表情和语音信号,实现最终的情感识别... 相似文献