首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 8 毫秒
1.
改进的球结构SVM多分类增量学习算法   总被引:1,自引:0,他引:1  
针对球结构支持向量机(support vector machine,SVM)增量学习算法在训练时间和分类精度上的不足,提出了一种改进的球结构SVM多分类增量学习算法.该算法首先构造一个完全二叉树用于多类分类;分析新增样本的加入对原支持向量集的影响,将新增样本集中部分样本和原始训练集中的支持向量以及分布在球体一定范围内的样本合并做为新的训练集,完成分类器的重构.实现通过减少训练样本缩短训练时间和完善分类器提高分类精度的目的.通过UCI标准数据集实验,结果表明,该算法在所需训练的样本数、训练时间以及准确率3方面都优于球结构SVM增量学习算法,尤其当样本分布不平衡时,该算法有更高的分类准确率.  相似文献   

2.
时间序列分类是数据挖掘中的重要主题,现有的大部分时间序列分类方法较少考虑到序列形状对分类结果的影响。该文提出了一种基于k-shape的时间序列模糊分类方法。该方法通过使用k-shape聚类算法对时间序列训练数据集各类别的成员进行聚类,获得各类别的聚类中心并形成聚类中心群,将每个类别的聚类中心群作为时间序列数据模糊分类的初始聚类中心,根据隶属度最大原则确定测试时间序列数据的类别标签。在30个时间序列公开数据集上的分类实验结果表明,该方法相较于SVM、Bayes、EAIW和TLCS这4种分类算法具有更好的分类性能,对具有扭曲和位移特征的时间序列数据分类有更好的可用性。  相似文献   

3.
为提高不平衡数据集中少数类的分类性能,本研究提出一种改进的AdaBoost算法(UnAdaBoost算法)来解决数据不平衡问题。该方法首先改进基分类器,使其在损失一定程度的多数类分类性能的情况下提高少数类的分类性能,而多数类分类性能的损失可通过后面的多个分类器集成弥补回来,这样既提高了少数类的分类性能又不会损失多数类的分类精度。本研究把改进的朴素贝叶斯方法作为基分类器,用改进投票权值的AdaBoost算法对基分类器进行融合。实验结果表明,与传统的Adaboost算法相比,该方法可以有效地提高不平衡数据的分类性能。  相似文献   

4.
为了判断一个给定的DNA序列片段是基因序列还是间区序列,基于语言学方法提取了DNA序列特征,通过支持向量机(SVM)训练方法,实现了对人类22号染色体的DNA序列中的基因和基因间区序列的分类.在不依赖于任何生物领域知识的前提下,该方法能得到85%以上的分类精度.相对于SVM分类方法,虽然二元Logistic回归(BLR)方法也能达到较高的分类精度,但在训练时间上SVM方法远优于BLR方法.  相似文献   

5.
为了实现Scratch可视化编程领域的作品分类,提出了一种基于标签关联性的多标签分类算法(MLLR),构建了一个有效的多标签Scratch分类模型.首先提取作品的Block使用特征、计算思维技能特征和复杂度特征3类特征作为分类特征;然后针对RAKEL算法随机选择标签子集,忽略了标签间的关联性,提出了改进的MLLR算法,该方法根据多标签之间的关联性来划分标签子集,再训练相应的标签幂集子分类器.实验结果表明,MLLR算法在分类性能和时间性能上优于RAKEL等多标签分类算法,构建的分类模型对于Scratch作品具有较强的适用性,分类的准确率达到81.3%.  相似文献   

6.
分析了现有多类分类支持向量机算法的不足,在此基础上提出了基于类半径的多类分类支持向量机算法.这种算法在训练前首先对训练集进行分析,然后用one-class SVM进行分类.试验结果表明,该算法分类精度较高,训练时间短.  相似文献   

7.
为解决时间序列的早期分类问题,提出一种顺序子空间堆叠泛化(sequential subspace stacked generation, SSSG)的多分类器集成方法。该方法利用滑动窗口将时间序列划分成顺序子空间,采用多个一级分类器在顺序子空间上进行学习,输出各个子空间可能类别的概率,利用二级学习算法在这些概率结果上进行训练得到第二级的分类器。通过两级分类器可以判断已经出现部分特征的时间序列的类别,理论分析了影响分类性能的几个因素,仿真实验证明了本文算法的有效性。  相似文献   

8.
针对传统单点串行的分类算法在面对新闻数据规模较大、分类属性较多时存在效率低的问题,本文研究了朴素贝叶斯分类算法在MapReduce下的并行实现方法.首先对新闻信息进行分词、格式转换等预处理,然后进行特征提取、分类模型构造;最后进行了分类测试.测试结果表明,在大数据量的情况下,并行化的贝叶斯算法较传统的贝叶斯算法具有更好的执行效率和较高的扩展性.  相似文献   

9.
目前大多分类算法都是从数据库的单个表中挖掘分类模式的,但是现实中的数据大多以多个关系表的形式存在,而且各个表之间存在联系.用选择图表示多关系决策树中结点的分类算法,直接从多个关系表中挖掘分类模型,不需要将多个表进行连接操作.对该方法进行了研究,发现多关系决策树算法在处理限定词互补方面存在缺陷,并给出了相应的改进.  相似文献   

10.
分类算法是时间序列数据挖掘中极为重要的任务和技术,该文提出一种基于簇中心群的时间序列数据分类方法。该方法根据时间序列训练数据集中的类别标签进行簇划分,利用近邻传播算法分别对每个簇进行中心代表点选择,构造出各代表点的代表对象集;然后借助基于动态时间弯曲的均值中心方法对各代表对象集实现中心群计算,结合改进后的K近邻算法实现时间序列数据的分类。数值实验结果表明,与传统方法相比,新方法具有更好的分类效果和计算性能。  相似文献   

11.
提出一种基于马氏距离的分段矢量量化时间序列分类(Mahalanobis distance-based time series classification using PVQA, MPVQA)算法。该算法在继承传统算法时间复杂度的基础上,引入马氏距离,克服了欧氏距离容易受模式特征量纲影响的缺点,提高了算法精度。首先,在训练时采用分段矢量量化近似方法获得码本,然后以马氏距离为相似性度量对时间序列进行分段重构。对重构后的时间序列,同样基于马氏距离为相似性度量进行判别。在4个时间序列数据集上进行的试验结果验证了所提方法在时间序列表示和分类上的优越性。  相似文献   

12.
Shapelet发现的目标是寻找质量最佳的Shapelet,Shapelet的质量取决于子序列的可辨别性。针对精准发现有效Shapelet的问题,提出基于子类聚类和SAX表示的Shapelet快速发现算法,将子类聚类与经典的符号表示SAX法相结合进而快速准确的获取最优的Shapelet。该算法利用子类聚类将时间序列进行降维,得到多个子序列原型作为Shapelet候选集;再利用SAX表示将候选集符号化表示,直观的将候选集用字符串表示,便于找到最优Shapelet;最后选取候选集中信息增益最大的作为最优Shapelet进行时间序列分类。实验结果表明,该算法具有较好分类效果,同时提高了分类速度。  相似文献   

13.
针对时序分类问题,提出一种竞争型径向基过程神经网络时序分类器.给出了复合竞争过程神经元单元的定义,引入复合竞争过程神经元隐层,利用竞争型径向基过程神经网络输入为时变函数的特点,由复合竞争过程神经元单元完成对过程式输入信息的模式匹配和时空聚合运算,给出了具体学习算法,省去了输出层线性连接权的计算,简化了网络结构和训练过程,提高了网络泛化能力.最后以UCI数据集多变量时序分类问题验证了分类器的有效性.  相似文献   

14.
本文对数据成时间序列的动态决策表 ,用增量式算法提取决策表的规则模型。增量式算法的关键点是在分类正确率和相容度下对属性集进行优级排序 ,算法的特点是随着数据的增加逐次推导规则。随着计算轮次的增加 ,比较运算的次数按多项式增加。由于大型静态数据库可转化为动态数据库 ,所以 ,增量式算法是大型决策表规则提取的有效算法  相似文献   

15.
提出了针对移动平台使用XMPP协议服务器端的基于分类回归树和K近邻结合的预测算法.该方法首先通过动态反馈采集服务器节点的资源信息组成时间序列,对时间序列进行预测计算.然后将服务器节点分区域管理,运用不同的调度策略.实验结果证明,与原始的加权轮询和最小连接数算法相比,该预测算法在连接响应时间上减少了25%,在建立连接的平均速率上提升了近1.3倍,动态的调度策略使得服务器集群有更大的吞吐量,对于移动平台有更好的适应性.  相似文献   

16.
泛在电力物联网的提出推动了智慧用电、负荷监测等技术的大力发展,为解决传统非侵入式负荷监测与分解方法耗时长,辨识精度低等问题,文章提出了一种半监督学习聚类数据建立特征集并结合果蝇优化广义回归神经网络模型的负荷分解方法。首先,该方法利用输入的设备有功功率和电流数据采取半监督学习优化相似矩阵,以近邻传播聚类算法为基础挖掘出用电设备的运行状态特性以及功率信息,再使用数字编码方式将设备运行状态表示为分类标签,然后输入总有功功率、无功功率以及电流的时间序列数据和对应序列的分类标签矩阵,利用果蝇优化算法的寻优能力求得广义回归神经网络模型的最优Spread值完成模型优化和训练,随后输入测试时间序列数据,得到分类矩阵即各设备运行状态,并利用设备运行状态对应的功率信息进行总有功功率重构拟合,完成负荷分解。经仿真对比,此方法对所有用电设备运行状态辨识准确率达到86%左右,对单个用电设备运行状态辨识准确率达到96%左右,且耗时较短,显著提高了对负荷特性信息的挖掘能力和分解辨识能力。  相似文献   

17.
护士排班问题是多约束条件下的NP难优化问题,好的排班对提高护士工作效率、优化医院人力资源配置具有重要意义。然而,目前大多数算法不仅在计算时间和求解质量之间难以有效达到平衡,而且很难在可行的时间内求解这类大规模问题。针对上述问题,提出了一种新的智能高效两步并行护士排班算法。第1步采用启发式调整排序随机生成问题的初始解,以获得高质量的算法初始解;在此基础上,第2步采用并行智能多样化变邻域搜索和增量式计算来快速寻优。同时,采用随机扰动使算法逃离局部最优,并引入禁忌列表以避免冗余计算。大量的标准测试数据集上的仿真实验结果表明:这种算法在平均解质量和运行时间上均优于现有最好的护士排班算法,且更适合于大规模护士排班问题的求解。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号