期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

鲁淑霞李黎敏《山东大学学报(工学版)》2014,44(3):1-7

为了处理大规模数据和不平衡数据分类问题,提出了一种新的分类方法,利用基于最大夹角间隔的核心集向量机算法实现对大样本数据的分类;针对不平衡数据分类问题,通过对不同的样本给予不同的权重,来提高算法的分类性能。加权最大夹角间隔核心集向量机方法不仅能够有效地解决不平衡数据的分类问题,而且能够实现对大样本数据的快速训练。相似文献

2.

基于流形判别分析的全局保序学习机

张静刘忠宝《电子科技大学学报(自然科学版)》2015,44(6):911-916

当前主流分类方法在分类决策时无法同时考虑样本的全局特征和局部特征,而且大多算法仅关注各类样本的可分性,往往忽略样本之间的相对关系。为了解决上述问题,提出了基于流形判别分析的全局保序学习机。该方法引入流形判别分析来反映样本的全局特征和局部特征;通过保持各类样本中心的相对关系不变进而实现保持全体样本的先后顺序不变;借鉴核心向量机有关理论和方法,通过建立所提方法与核心向量机对偶形式的等价关系实现大规模分类。人工数据集和标准数据集上的比较实验验证了该方法的有效性。相似文献

3.

基于中心加权的局部核向量机算法

李琳伍少梅唐宁九《电子科技大学学报(自然科学版)》2014,43(4):612-617

为了解决大规模非线性分类中局部学习的不平衡性问题,提出一种改进的局部支持向量机算法,在高维特征空间中聚类后,为每一个簇构造局部非线性支持向量机。为了克服簇内样本的分布不均衡问题,根据闭合超平面不规则边界的几何特点,经过梯度下降寻找稳定均衡向量,以此构造簇几何中心;再结合簇密度中心共同约束类心形成双重加权中心。然后通过求解加权最小闭球问题实现对大规模样本向量的分类。对照实验显示,除了个别数据集以外,改进的算法在训练时间、测试时间以及测试精度等方面都比另外两种分类算法表现更佳。相似文献

4.

基于Fisher向量投影的支持向量机增量算法

《西安邮电学院学报》2018,(1):79-84

针对支持向量机训练样本冗余导致训练效率低下的问题,提出一种基于Fisher向量投影的支持向量机增量算法。该算法根据支持向量机中支持向量的分布特性对初始训练集及增量集进行预处理,减少训练样本个数;通过判断初始样本是否满足新增样本集的卡罗需-库恩-塔克(Karush-Kuhn-Tucker conditions,KKT)条件,剔除对最终结果无用的样本,减少参与训练的样本数目。实验结果表明,与标准支持向量机算法和基于向量投影的支持向量机增量算法相比,基于Fisher向量投影的支持向量机增量算法的训练速度分别提升了86%和33%左右。该方法可用于大规模样本集的分类识别问题。相似文献

5.

基于概率主成分分析的差分隐私数据发布方法

《哈尔滨工程大学学报》2021,42(8)

针对高维相关数据发布的隐私保护问题,本文提出2种隐私保护数据发布方法,解决高维相关数据发布时重复加噪导致的发布数据效用过低问题。基于概率主成分分析模型的隐私数据发布方法,及基于概率主成分分析和差分隐私的数据发布方法,利用主成分分析对高维数据降维,在低维数据中加入拉普拉斯噪声,然后再由概率主成分分析的生成模型生成数据集发布,使得发布的数据集满足差分隐私。经过分析与验证,当选取恰当的主成分个数时,2个真实数据集上的分类准确率较同类方法提高2%～5%。本文方法在支持向量机分类准确率方面可以保持良好的数据效用。相似文献

6.

稀疏最小二乘支持向量机 总被引：4，自引：0，他引：4

甘良志孙宗海孙优贤《浙江大学学报(工学版)》2007,41(2):245-248

针对大规模数据集的回归和分类问题，改进了最小二乘支持向量机.以再生核希尔伯特空间中的线性分析为基础，把样本集映射到再生空间中，然后张成再生空间的一个线性子空间，并求出这个子空间的基.利用基线性表示子空间中的其他元素，减小了求解矩阵的维数，通过求解规模相对较小的线性方程组完成对支持向量机的训练.采用该方法对较大规模的数据样本进行了回归和分类仿真试验，并与普通的最小二乘支持向量机进行比较.结果表明，采用该方法解决复杂非线性函数的回归和分类问题，不但可以得到稀疏解，而且计算速度比普通最小二乘支持向量机提高了约20％. 相似文献

7.

基于支持向量机的模糊回归估计

孙宗海杨旭华孙优贤《浙江大学学报(工学版)》2005,39(6):810-813

针对给定的大规模数据集的回归估计问题，提出基于支持向量机的模糊回归估计方法.该方法把复杂的数据集看作多个群体的混合，每个群体采用单一的回归模型进行描述，使得大规模数据集的回归估计问题变成了一个多模型估计问题.在此基础上把支持向量机与模糊C聚类结合起来得到基于支持向量机的模糊回归模型，并给出了实现该模型回归估计的算法.该方法对大规模的数据样本进行模糊C聚类，并回归估计各聚类的数据样本.数值仿真结果表明，该方法在聚类数据样本的同时能实现多个模型的回归估计，而且模糊隶属度的初始化影响要小于其他的模糊回归估计方法. 相似文献

8.

一种改进的加权边界调节支持向量机算法 总被引：1，自引：0，他引：1

程丽丽张健沛马骏《哈尔滨工程大学学报》2007,28(10):1135-1138

为了改进现有支持向量机所确定的边界抗干扰能力差、对噪声数据敏感等问题,减少野点数据对形成支持向量机边界存在的影响,根据各个样本在整个训练样本集中的重要性不同,将各个训练样本的重要性程度值作为权值赋予边界值上,提出了一种基于加权边界调节的支持向量机算法.通过对标准UCI数据集和人工数据集上的仿真实验表明,基于加权边界调节的支持向量机具有较好的野点免疫能力,具有更高的分类精度、更少的支持向量和更好的推广能力. 相似文献

9.

一种基于聚类的快速局部支持向量机算法

浩庆波牟少敏尹传环昌腾腾崔文斌《山东大学学报(工学版)》2015,45(1):13-18

为进一步改善局部支持向量机的分类效率和分类精度,提出一种改进的局部支持向量机算法。该算法对每类训练样本分别进行聚类,使用聚类生成的样本中心点集代替样本,使用改进的k最近邻算法选取测试样本的k个近邻。分别在UCI数据集和自建树皮图像数据集上对本研究算法的有效性进行测试。实验结果表明,本研究提出的算法在分类精度和效率上具有一定的优势。相似文献

10.

支持向量机大规模样本快速训练算法

李飞李红莲《北京机械工业学院学报》2012,(2):83-87

普通的支持向量机算法在对大规模样本进行分类的时候有着较高的时间代价。随着训练样本数量的增多,支持向量机的训练速度问题将会越发明显,并且成为制约其实际应用的瓶颈。针对此问题提出了超椭球面方法,通过去掉噪声点、冗余点,并保留能明确体现样本在空间分布位置特征的样本点,以达到提高支持向量机对大规模样本训练速度的目的。实验表明,超椭球面法在最大限度保证识别正确率的前提下可以大幅加快支持向量机的训练速度。相似文献

11.

垂直分布数据的隐私保护支持向量机

刘晓红贺国平《佳木斯工学院学报》2011,(3):375-378

随着人们对隐私权的越来越重视,隐私保护数据挖掘成为当前研究热点.分类算法作为一个重要的数据挖掘方法被应用到各个领域,其中支持向量机（SVM）是分类算法中一个重要方法.并且数据的隐私性和安全性是人们关注的重点.本文对SSP协议进行扩展提出了一个基于垂直分布数据的隐私支持向量机算法,这个算法具有更高的效率和更好的安全性. 相似文献

12.

一种分离超平面的确定方法

刘万里刘三阳薛贞霞《中北大学学报(自然科学版)》2007,28(6)

相似文献

13.

用遗传算法求SVM的最优超平面 总被引：2，自引：0，他引：2

李路袁震东《上海工程技术大学学报》2005,19(1):21-23

支持向量机(SVM)是解决小样本学习问题的有力工具,其关键是如何得到判别样本类别的最优超平面。受约束条件的限制,最优超平面的求解比较繁琐。遗传算法具有全局搜索最优解的特点,是求最优值问题的非常有效的方法。由此,利用遗传算法得到了一个直接求最优超平面近似解的方法,该方法不同于传统的二次规划方法。相似文献

14.

基于支持向量机的增量式算法

黄启春刘仰光何钦铭《浙江大学学报(工学版)》2008,42(12):2121-2126

为了扩展支持向量机在大规模数据集和成批出现数据领域的应用,提出了一种基于支持向量机的增量式学习算法.利用标准的支持向量机算法训练得到初始的目标概念,通过增量式步骤不断更新初始的目标概念.更新模型是求解一个与标准支持向量机具有类似的数学形式的凸二次规划问题.证明了在可分情况下,如果新增加的样本不是位于边界区,那么增量式过程既不会改变分类平面也不会改变分类平面的表达.与现有的增量式支持向量机算法相比,该算法无需额外计算就可实现增量式的逆过程并且训练时间与增量式步骤数成反比.实验结果表明,该算法满足稳定性、能够不断改进性能以及性能回复三个准则. 相似文献

15.

新型支持向量机在风速预测模型中的应用研究

刘忠宝《电子科技大学学报(自然科学版)》2014,43(5):754-757

在短期风速预测方面支持向量机已被广泛应用并取得较好的效果. 然而, 随着应用的深入, 其逐渐暴露出两大问题: 一, 对噪声较为敏感; 二, 未能充分利用样本已有信息. 为进一步提高支持向量机的泛化能力, 该文提出模糊流形支持向量机FMSVM. 该方法引入模糊技术, 保证不同样本区别对待, 减少或消除噪声的影响; 充分利用流形判别分析的性质, 进一步改进支持向量机, 在分类决策时同时考虑样本的边界信息、分布特征以及局部流形结构. 通过某风场风速数据集上的比较实验验证该方法的有效性. 相似文献

16.

一种具有统计不相关性的最优边界鉴别向量集

孙正张晓光徐桂云胡晓磊王忠青《中国矿业大学学报》2009,38(6)

为了解决现有维数约简算法受样本分布影响较大、不支持小样本学习等问题,在分析线性鉴别分析(LDA)中最优鉴别向量与支持向量机(SVM)中分类超平面法向量之间关系的基础上,基于统计不相关最优鉴别向量集优于正交最优鉴别向量集的事实,提出了通过对改进的SVM的二次优化问题进行递归求解来获取具有统计不相关性的最优边界鉴别向量集的算法,并使用核方法将其推广到可以解决非线性特征抽取问题.结果表明:在采用相同参数并使用k-最近邻分类器进行训练和测试的情况下,提出的算法对实际数据集Waveform,Heart,Diabetis的分类精度均高于SVM和RSVM,不会出现当抽取超过最优维数时随着抽取维数的增加分类精度反而降低的现象,体现了本算法在抽取不相关特征向量方面的有效性. 相似文献

17.

基于支持向量机和云模型的网络健康状态评估 总被引：1，自引：0，他引：1

温祥西孟相如《北京邮电大学学报》2012,35(1):10-14

分析了支持向量机分类方法的几何意义,结合健康评估问题的定义提出了一种基于支持向量机的网络健康评估方法.将健康评估转化为分类问题,以点到健康分类边界的距离为评估参数从整体上评价网络健康状况,降低了主观因素对网络评估的影响.采用云模型实现了健康度与评语域之间的不确定性映射,更符合评估的实际情况.基于opnet的仿真实验结果表明了该方法的可行性. 相似文献

18.

一种调整分类超平面偏移的方法一平均距离比MDR法

刘维会贺国平《佳木斯工学院学报》2010,(1):132-135

分析了传统的支持向量分类机对不平衡数据集的影响,并提出了一种调整分离超平面偏移的方法一平均距离比MDR法．首先分别计算正、负类的支持向量到分离超平面距离的平均值,让这个平均值之比等于两类样本数的反比,从而得到偏移b＊的值．实验表明,对于不平衡数据集问题,该方法比标准SVM具有更好的效果．相似文献

19.

基于多描述子分层特征学习的图像分类

郭继昌王楠张帆《哈尔滨工业大学学报》2016,48(11):83-89

为解决图像分类任务中词袋(Bag-of-Words)模型分类算法单一局部描述子信息缺失、特征量化误差较大、图像特征表现力不足等问题,提出一种基于多描述子分层特征学习的图像分类方法.结合尺度不变特征变换(SIFT)与形状核描述子(KDES-S)进行局部特征提取,并构建分层特征学习结构来减少编码过程中的量化误差,最后将图像特征分层归一化后进行线性组合并利用线性支持向量机(SVM)进行训练和分类.在Caltech-101、Caltech-256、Scene-15数据库上进行实验,结果表明:相比其他图像分类方法,本文方法在分类准确率上具有显著提升. 相似文献