排序方式: 共有23条查询结果,搜索用时 15 毫秒
1.
针对多通道脑电(EEG)的情感识别,提出了一种卷积回声状态网络(CESN)模型。首先构造EEG信号的特征矩阵序列;然后通过卷积操作提取各个样本的高层抽象特征,形成一维特征向量序列;利用具有自反馈功能的蓄水池结构,捕获向量序列的动态时序信息;最后用岭回归来实现情感识别。在情感分析专用生理信号数据集上进行实验的结果表明,EEG信号的动态时序性蕴含着与情感状态相关的区分性信息,所提的CESN模型能够有效地挖掘这种信息,并用于情感分类,解决了卷积神经网络中因使用反向传播算法而导致的局部最优和训练时间过长的问题。 相似文献
2.
晁浩 《计算机工程与应用》2015,(6):208-211
解码时声学特性最优的路径蕴含了揭示当前路径是否正确的重要参考信息,为此提出了一种随机段模型系统的解码优化方法。训练能够准确地衡量当前路径与声学最优路径相似性程度的上下文相关音素串编辑距离模型,在N-Best重打分的过程中将音素串编辑距离加入到路径总得分中。在“863-test”测试集上进行的连续语音识别实验显示汉语字的相对错误率下降了8.1%。实验结果表明了将音素串编辑距离应用到随机段模型的可行性。 相似文献
3.
提出了一种随机段模型系统的说话人自适应方法。根据随机段模型的模型特性,将最大似然线性回归方法引入到随机段模型系统中。在“863 test”测试集上进行的汉语连续语音识别实验显示,在不同的解码速度下,说话人自适应后汉字错误率均有明显的下降。实验结果表明,最大似然线性回归方法在随机段模型系统中同样能取得较好的效果。 相似文献
4.
5.
提出基于发音特征的声调建模改进方法,并将其用于随机段模型的一遍解码中。根据普通话的发音特点,确定了用于区别汉语元音、辅音信息的7种发音特征,并以此为目标值利用阶层式多层感知器计算语音信号属于发音特征的35个类别后验概率,将该概率作为发音特征与传统的韵律特征一起用于声调建模。根据随机段模型的解码特点,在两层剪枝后对保留下来的路径计算其声调模型概率得分,加权后加入路径总的概率得分中。在“863-test”测试集上进行的实验结果显示,使用了新的发音特征集合中声调模型的识别精度提高了3.11%;融入声调信息后随机段模型的字错误率从13.67%下降到12.74%。表明了将声调信息应用到随机段模型的可行性。 相似文献
6.
卷积神经网络的性能与超参数配置密切相关,然而最优超参数的选择耗时耗力. 为了提高超参数选择的效率,提出了一种基于多策略的蝠鲼觅食优化算法,一方面采用半数均匀初始化策略提升种群的多样性;另一方面,融合新权重因子更新策略和分裂策略,提升收敛速度和拟合精度. 根据实数编码策略将所提算法用于卷积神经网络的超参数优化研究中,用3种觅食方式进行迭代,以得到最优的超参数配置. 为了评估超参数优化的有效性,与卷积神经网络超参数优化算法在手写数字和CIFAR-10数据集上进行了对比实验,实验结果表明,所提算法可消耗较少的资源,并获得更高的准确率. 相似文献
7.
8.
针对声效检测过程中基于帧的谱特征不能描述语音现象中固有的时间相关性和动态变化信息的问题,提出一种结合回声状态网络和径向基函数网络的声效检测方法。首先将声学观测特征序列输入到回声状态网络,根据回声状态网络中储备池的节点状态对输入的观测矢量序列进行编码,从而将基于语音帧的声学观测矢量序列映射到高维编码空间;然后径向基函数网络被用于拟合每种声效模式编码后的概率密度函数;最后使用最小错误率贝叶斯决策方法来确定声效模式。对拥有5 000个孤立词的测试集进行声效检测试验,获得79.5%的识别精度。结果表明,所提方法可以有效获取语音帧之间的相关性信息,克服帧间独立假设的缺陷。 相似文献
9.
针对情感识别中堆叠式自动编码器存在反向传播方法收敛速度慢和容易陷入局部最优的问题,提出一种基于堆叠式降噪自动编码器(SDAE)和正则化极限学习机(RELM)的情感状态识别方法。从脑电信号的时域、频域和时频域中提取表征情感状态的初始特征,使用SDAE进行无监督特征学习,提取初始特征的高层抽象表示。在网络的回归层,使用RELM进行情感分类。在DEAP数据集上的实验结果表明,与SDAE以及DT、KNN等传统基于机器学习的方法相比,该方法在实时性、准确性和泛化性能等方面均有明显提升。 相似文献
10.