共查询到19条相似文献,搜索用时 62 毫秒
1.
提出了一种多模型结融合的动作识别方法,目的是利用大数据时代下数据形态的多样性并结合已有模型,以提高识别准确率。该方法使用视频或图像序列与骨架序列对整个模型进行训练。对于骨架序列提取其关键帧,然后使用长短时记忆(LSTM)编码器对骨架序列进行特征提取得到骨架特征。接着使用卷积神经网络得到RGB视频或者图像序列的特征,进一步经过循环神经网络提取特征,得到RGB特征。网络的损失函数方程组由分类误差与上述两种特征的L2范数组成。使用混合最速下降进行网络优化。该方法使用关键帧训练LSTM编码器,大大缩短了训练时间。结合手工提取的关键帧与非监督方式获取的卷积特征,提高识别准确率。在Florence和MSR3D数据集上的实验结果表明,该方法对动作识别具有良好的分类效果。 相似文献
2.
3.
针对循环神经网络存在提取特征单一,对特征的空间信息处理不充分的问题,提出一种基于骨骼的双支融合的人体行为识别模型。该模型由双向循环门网络和多尺度的残差网络融合的双支网络中进行特征提取,得到丰富的时间和空间上的特征信息,并且在双向循环门网络中增加注意力机制,进一步提升整个网络的性能,最后将特征信息经过分类器进行分类得到动作。分别使用UCF101和HMDB51数据集进行实验,准确率分别为98.0%和67.8%。通过实验测试,证明该模型能够获得更加完整的特征信息并且具有良好的性能指标。 相似文献
4.
针对语音情感识别在多语言联合数据集上识别准确率低的问题,提出了一种基于幅值滤波与分层特征融合策略的语 音情感识别方法。该方法首先对梅尔谱图内幅值分布规律进行幅值滤波,通过概率叠加扩大梅尔谱图内相近幅值之间的差 异,实现谱图内的高频强增益、低频弱增益;同时,通过概率相乘缩小梅尔谱图内相远幅值之间的差异,以显示谱图内中频的 细节部分。在此基础上,使用矩形卷积提取音频信号的时间动态特征,生成梅尔谱图动态特征图,并将其作为分层特征融合 策略的输入。分层特征融合策略通过压缩特征图来提取不同尺度的时间动态特征,并提取不同深度中的时间动态特征。在 多语言联合数据集 CER 上取得了84.44%的分类准确率。 相似文献
5.
6.
语音识别技术使家用电器的控制更加人性化,本文利用凌阳SPCEO61A单片机系统结合语音识别模块实现了家居空调的语音控制,通过组合语音实现了空调控制命令的完整覆盖,测试结果表明该系统设计方案是可行和可实现的. 相似文献
7.
与传统模式识别的方法相比,仿生模式识别能识别单模板,并大大减小误识率。基于这两个优点,将仿生模式识别应用于语音信号处理中,进行2次识别。第1次使用传统模式识别方法,第2次为单模板识别。对小词汇量的关键词识别实验结果表明能够大大降低误识率。 相似文献
8.
9.
穆峰 《可编程控制器与工厂自动化(PLC FA)》2014,(5):107-109
本文提出采用分段PCA的方法提取信号的特征,再通过BP网络完成信号的训练及识别。仿真实验探究了识别网络的输入维数以及隐含层数目对识别率的影响,通过恰当的选择网络的输入维数及隐含层数,实验结果验证了使用分段PCA方法后,语音识别率会有所提高。 相似文献
10.
本文在分析语音识别原理的基础上,介绍了凌阳公司的16位单片机SPCE061A,并基于该款芯片丰富的语音处理功能,给出了用SPCE061A实现基于特定人语音识别系统的硬件结构及软件实现,该应用可适用于多种语音识别领域的场合,具有广泛的应用价值。 相似文献
11.
12.
在互联网和自动化技术的不断发展的影响下,智能家居已经成为了当今物联网技术发展的重要热点方向之一。本设计基于ICRoute公司生产的非特定语音识别芯片LD3320,利用非特定语音识别算法实现垃圾桶的智能化声音识别和语音控制,完成语音控制垃圾桶各方向运动、非接触式智能开闭、容量检测功能。通过在模拟工作环境下对于设计正确识别率进行检测,证明系统在正常工作环境下的正确识别率达到88.4%,可以在2 m距离内有效完成设计动作和功能。 相似文献
13.
14.
15.
基于DSP的语音识别智能控制系统 总被引:1,自引:0,他引:1
介绍了语音识别的基本原理及用浮点数字信号处理器(DSP)TMS320C32实现语音识别算法的一些原则和方法,阐述了语音识别的DSP实现技术,系统以预测倒谱参数为特征参数,并采用计算量相对较小的改进的动态时间规整(DTW)算法实现语音参数模板匹配,能够实现特定人、孤立词、小词汇量的语音识别,并用MATLAB进行了算法仿真,从而将语音识别技术应用到智能控制系统中,给出了实验结果和误差分析。试验结果表明,系统正确识别率在89.96%,具有一定的实用价值。 相似文献
16.
17.
Tetsuo Kosaka Akiyoshi Yamamoto Takuya Kumakura Masaharu Kato Masaki Kohda 《IEEJ Transactions on Electrical and Electronic Engineering》2011,6(1):23-29
Most of the state‐of‐the‐art speech recognition systems use continuous‐mixture hidden Markov models (CMHMMs) as acoustic models. On the other hand, it is well known that discrete hidden Markov model (DHMM) systems show poor performance because they are affected by quantization distortion. In this paper, we present an efficient acoustic modeling based on discrete distribution for large‐vocabulary continuous speech recognition (LVCSR). In our previous work, we proposed the maximum a posteriori (MAP) estimation of discrete‐mixture hidden Markov model (DMHMM) parameters and showed that the DMHMM system performed better in noisy conditions than the conventional CMHMM system. However, we conducted the recognition experiments on a read/speech task in which the vocabulary size was only 5k. In addition, the DMHMM was not effective in clean condition in that work. In this paper, we have developed a DMHMM‐based LVCSR system and evaluated the system on a more difficult task under clean condition. In Japan, a large‐scale spontaneous speech database ‘Corpus of Spontaneous Japanese’ has been used as the common evaluation database for spontaneous speech and we used it for our experiments. From the results, it was seen that the DMHMM system showed almost the same performance as the CMHMM system. Moreover, performance improvement could be achieved by a histogram equalization method. Copyright © 2010 Institute of Electrical Engineers of Japan. Published by John Wiley & Sons, Inc. 相似文献
18.
随着电子互感器的出现,合并单元作为将瞬时电流电压信号以指定帧格式传送给保护、控制装置而出现在变电站通信系统中。为满足IEC 61850标准对变电站自动化系统以及智能设备所提出的互操作性、实时性和稳定性要求,提出了一种新型的电子式互感器与智能设备间的数字通信接口——嵌入式合并单元,该设备采用ARM处理器,具有高可靠性和强实时性。先从合并单元的功能进行分析,研究了基于ARM的装置的功能实现,然后研究和分析了合并单元信息模型的构建,最后简单介绍了用于装置的自我描述的SCL配置文件的基本格式。 相似文献