首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
提出一种基于改进多核学习的语音情感识别算法.算法以高斯径向基核函数为基准,通过采样不同的样本,采用不同的评价标准并获得不同的参数,来提高分类性能.此外,通过引入多核技术,将得到的高斯核函数构建多核学习的基核,并通过利用松弛因子构建的软间隔多核学习的目标函数改善了学习效率.对比仿真实验结果表明,本文提出的基于多核学习语音情感识别算法有效提高了语音情感识别性能.  相似文献   

2.
语音信号在传播过程中会产生持续时长不等的音素特征,这些特征会影响语音识别的正确率.针对这一问题,提出一种多核卷积融合网络(Multi-core Convolution Fusion Network,MCFN),用于对不同长度的音素特征进行标准化,用标准化后的特征训练语音识别模型.此外,还利用子空间高斯混合模型(Subspace Gaussian Mixture Model,SGMM)将一般说话者的语音和信息加入到模型中,减小语料稀疏性对模型的影响.通过在Thchs30和ST-CMDS数据集对模型进行评估,结果显示,基于MCFN的BLSTM-CTC语音识别模型的识别字错误率(WER)较传统的语音识别模型有所降低.  相似文献   

3.
李飞  杜亮  任超宏 《计算机应用》2019,39(4):1021-1026
非负矩阵分解(NMF)算法仅能用于对原始非负数据寻找低秩近似,而概念分解(CF)算法将矩阵分解模型扩展到单个非线性核空间,提升了矩阵分解算法的学习能力和普适性。针对无监督环境下概念分解面临的如何设计或选择合适核函数这一问题,提出基于全局融合的多核概念分解(GMKCF)算法。同时输入多种候选核函数,在概念分解框架下基于全局线性权重融合对它们进行学习,以得出质量高稳定性好的聚类结果,并解决概念分解模型面临核函数选择的问题。采用交替迭代的方法对新模型进行求解,证明了算法的收敛性。将该算法与基于核的K-均值(KKM)、谱聚类(SC)、KCF(Kernel Concept Factorization)、Coreg(Co-regularized multi-view spectral clustering)、RMKKM(Robust Multiple KKM)在多个真实数据库上的实验结果表明,该算法在数据聚类方面优于对比算法。  相似文献   

4.
王忠民  刘戈  宋辉 《计算机工程》2019,45(8):248-254
在语音情感识别中提取梅尔频率倒谱系数(MFCC)会丢失谱特征信息,导致情感识别准确率较低。为此,提出一种结合MFCC和语谱图特征的语音情感识别方法。从音频信号中提取MFCC特征,将信号转换为语谱图,利用卷积神经网络提取图像特征。在此基础上,使用多核学习算法融合音频特征,并将生成的核函数应用于支持向量机进行情感分类。在2种语音情感数据集上的实验结果表明,与单一特征的分类器相比,该方法的语音情感识别准确率高达96%。  相似文献   

5.
抽象画作为一种寓意含蓄的艺术作品,传递出的情感也是含蓄的,确定其情感分类也比较困难,为此采用多特征融合方式预测抽象画的情感。首先采用K-means聚类提取抽象画图像的主色调作为底层颜色特征,采用灰度—梯度共生矩阵提取底层纹理特征,采用卷积神经网络自动提取高层语义特征;其次由于特征维度不同,采用多核学习对底层和高级语义特征进行融合;最后采用支持向量机实现抽象画情感识别,分为积极与消极两类。在MART数据集上进行测试,并与其他现有分类模型进行了比较,实验结果显示该方法在测试性能上优于已有模型。  相似文献   

6.
提出了一种藏语句多特征融合的主观题自动评分算法,构建了关键词词形相似度计算模型、词序相似度计算模型、句子长度相似度计算模型和句子语义相似度计算模型。该算法将计算模型与最大相似度矩阵相结合,计算主观题的标准答案与学生答案之间句子、段落的相似度,最终做出自动评分。实验结果表明,与其他方法比较,该算法能有效降低平均误差值。  相似文献   

7.
针对跟踪过程中目标形态不断变化或部分遮挡导致鲁棒性差的问题,提出一种基于多特征自适应融合的粒子滤波跟踪算法.该算法从视觉特征集中选取了描述能力强的2种特征,并将其按照与目标模型的多尺度相似度进行线性融合;为了减小跟踪漂移,通过计算当前目标模型与初始目标模型的多尺度相似度自适应地更新目标模型.大量仿真实验结果表明,文中算法可以鲁棒地跟踪到部分遮挡和形态变化的运动目标.  相似文献   

8.
语音情感识别是语音处理领域中一个具有挑战性和广泛应用前景的研究课题。探索了语音情感识别中的关键问题之一:生成情感识别的有效的特征表示。从4个角度生成了语音信号中的情感特征表示:(1)低层次的声学特征,包括能量、基频、声音质量、频谱等相关的特征,以及基于这些低层次特征的统计特征;(2)倒谱声学特征根据情感相关的高斯混合模型进行距离转化而得出的特征;(3)声学特征依据声学词典进行转化而得出的特征;(4)声学特征转化为高斯超向量的特征。通过实验比较了各类特征在情感识别上的独立性能,并且尝试了将不同的特征进行融合,最后比较了不同的声学特征在几个不同语言的情感数据集上的效果(包括IEMOCAP英语情感语料库、CASIA汉语情感语料库和Berlin德语情感语料库)。在IEMOCAP数据集上,系统的正确识别率达到了71.9%,超越了之前在此数据集上报告的最好结果。  相似文献   

9.
针对现有基于人体骨架的行为识别方法存在计算量大、不适合在线应用的问题,提出一种多骨架特征前期融合的在线行为识别算法。该算法通过前期嵌入层融合不同类型的输入特征,并结合最大池化和层次池化操作提取骨架空间的多语义信息。根据日常行为的数据特征设计有效的骨架序列选取方式,并制作NTU-GAST Skeleton数据集,实现在线的行为识别应用。在公开数据集NTU60/120 RGB+D上进行测试,结果表明提出的算法需要更少计算量的同时取得了较高的识别准确率。  相似文献   

10.
语音识别领域的发展日新月异.同时,现有的研究结果表明声学特性集中存在较多的互补信息.本文提出了一种基于轨迹的空间-时间谱特语音情感识别方法.其核心思想是从语音频谱图中获得空间和时间上的描述符,进行分类和维度情感识别.本方法采用了穷举特征提取的实验表明:与MFCCs和基频等特征提取方法相比,提出的方法在噪声条件下,更具鲁棒性.通过在4类情感识别实验中获得了可比较的非加权平均回馈,得到了较为准确的结果,语音激活检测方面也具有显著的改进.  相似文献   

11.
在高维小样本数据的特征选择中,样本的变化会导致最终选出的特征呈现不稳定的特点。针对这种情况,提出了一种新的特征选择算法。首先通过计算特征间的互信息以确定特征关联性的强弱,依据将特征间的关联性强弱将特征分为不同的组,待分组完成后,使用粒子群算法对特征进行选择,并对少部分粒子进行随机扰动,避免粒子陷入局部最优。选择完成后的特征进行集成,得到最终特征子集。结合5个公开数据集进行实验,该算法的特征维度平均降低77.5%。与现有的方法比较,得到的结果在稳定性方面平均提高了4.0%。  相似文献   

12.
This paper presents an object tracking framework based on the mean-shift algorithm, which is a nonparametric technique that uses statistical color distribution of objects. Tracking objects through highly similar-colored background is one of the problems that need to be addressed. In various cases where object and background color distributions are very similar, the color distribution obtained from single frame alone is not sufficient to track objects reliably. To deal with this problem, the proposed algorithm utilizes an adaptive statistical background and foreground modeling to detect the change due to motion using kernel density estimation techniques based on multiple recent frames. The use of multiple frames supplies more information than single frame and thus it provides more accurate modeling of both background and foreground. In addition to color distribution, this statistical multiple frame-based motion representation is integrated into a modified mean-shift algorithm to create more robust object tracking framework. The use of motion distribution provides additional discriminative power to the framework. The superior performance with quantitative results of the framework has been validated using experiments on synthetic and real sequence of images  相似文献   

13.
提出了一种基于证据推理的多特征融合人脸识别算法(DSPSA).该算法利用证据推理理论在处理不确定和冲突信息方面的优越性,融合多个面部特征的信息,有效地处理了人脸图像由于光照、旋转、表情等因素造成不确定信息,从而达到改善识别结果以及增强识别系统对训练样本库以外类别的识别能力.算法中提出了新的基本置信指派构造公式.  相似文献   

14.
俞磊  朱铮  蒋超  肖爽 《控制工程》2022,29(1):182-192
由于传统的多核聚类算法忽略了局部密度和过度限制学习最优核的表示能力,提出了一种自适应局部核的最优邻域多核聚类算法。首先通过选择不同数目的邻域构造自适应局部核,邻域之间的相似度由一个预定义的阈值下界进行度量。然后将构造的自适应局部核应用于多核聚类模型,同时放宽了最优核的刚性约束。最后在6个具基准数据集上验证了提出聚类算法的优越性和有效性。  相似文献   

15.
16.
袁德平  郑娟毅  史浩山  刘宁 《计算机科学》2016,43(2):235-238, 244
在敌多目标对我多目标群进攻的态势下,提出了一种对敌目标分群的算法。该算法首先根据敌目标的几何态势要素,采用约束条件下的chameleon算法实现敌目标的空间聚类;再根据敌空间群的几何要素,推算出敌空间群对我空间群的进攻要素优势函数,并形成空间群进攻要素矩阵;最后通过对进攻要素的主、客观权重的推导,计算出综合权重和敌我双方空间群的进攻矩阵,进而划分出敌相互关系群。通过场景的设定与算法的仿真验证,证明了该算法的有效性。  相似文献   

17.
基于特征融合的自适应镜头边界检测   总被引:1,自引:0,他引:1       下载免费PDF全文
葛宝 《计算机工程》2007,33(19):180-182
根据HSV色彩直方图进行镜头边界检测是一种常用、有效的方法,该文提出了一种基于色彩和形状融合的方法计算帧间不连续值、形状特征选取梯度方向角,在计算出帧间不连续值以后,采用Kohonen自组织网络对不连续值进行聚类得到镜头边界。实验结果表明该方法能弥补采用单一的色彩或形状信息所造成的漏检或错检,并且Kohonen网络能取得与滑动窗高斯模型方法相差无几的性能表现,却克服了检测性能对于参数的敏感性。  相似文献   

18.
鉴于传统属性选择算法无法捕捉属性之间的关系的问题,文中提出了一种非线性属性选择方法。该方法通过引入核函数,将原始数据集投影到高维的核空间,因在核空间内进行运算,进而可以考虑到数据属性之间的关系。由于核函数自身的优越性,即使数据通过高斯核投影到无穷维的空间中,计算复杂度亦可以控制得较小。在正则化因子的限制上,使用两种范数进行双重约束,不仅提高了算法的准确率,而且使得算法实验结果的方差仅为0.74,远小于其他同类对比算法,且算法更加稳定。在8个常用的数据集上将所提算法与6个同类算法进行比较,并用SVM分类器来测试分类准确率,最终该算法得到最少1.84%,最高3.27%,平均2.75%的提升。  相似文献   

19.
基于核空间距离测度的特征选择   总被引:1,自引:0,他引:1  
提出核空间距离测度这一可分性判据。在核空间中计算两类样本点之间的距离,并以距离的大小评价子集的分类性能。使用顺序前进法作为搜索算法,在人造和真实的数据集上进行测试,文中的核空间距离测度可分性判据明显优于传统非核的可分性判据,优于或接近于Wang提出的核散布矩阵测度,并在运行时间上快一个数量级。将文中方法应用于胰腺内镜超声图像分类,取得较好分类结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号