首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 72 毫秒
1.
为解决传统支持向量机易出现学习“过拟合”和丢失数据统计特征等问题,通过引入模糊隶属度和总间隔思想,提出一种基于总间隔的最大间隔最小包含模糊球形学习机(TMF-SSLM),使得一类(正类)被包含于一个最小包含超球内,而另一类(负类)与该超球间隔最大化,从而同时实现类间间隔的增大和正负两类类内体积的缩小。通过使用差异成本,解决不平衡训练样本问题。引入总间隔和模糊性惩罚,克服传统软间隔分类机的过拟合问题,显著提升球形学习机的泛化能力。采用UCI实际数据集分别对二类和一类模式分类进行实验,结果显示TMF-SSLM具有优于相关方法的稳定分类性能。  相似文献   

2.
为提高支持向量机的模式分类性能,综合模糊支持向量机和球形支持向量机等方法,提出一种模糊最小包含球(FMEB)支持向量机,对于模式分类问题,通过引入模糊隶属度,寻找2个分别包含二类模式的同心最小包含球,使类间间隔最大化,同时二类模式类内分布最小化,从而增强泛化性和鲁棒性。实验结果证明FMEB的模式分类性能优于其他方法。  相似文献   

3.
最大间隔最小体积球形支持向量机   总被引:9,自引:1,他引:8  
结合支持向量机(SVM)类间最大分类间隔和支持向量数据描述(SVDD)类内最小描述体积思想,提出一种新的学习机器模型———最大间隔最小体积球形支持向量机(MMHSVM).模型建立两个大小不一的同心超球,将正负类样本分别映射到小超球内和大超球外,模型目标函数最大化两超球间隔,实现正负类类间间隔的最大化和各类类内体积的最小化,提高了模型的分类能力.理论分析和实验结果表明该算法是有效的.  相似文献   

4.
基于最大间隔最小体积超球支持向量机的多主题分类算法   总被引:1,自引:1,他引:0  
艾青  赵骥  秦玉平 《计算机科学》2012,39(8):239-238,267
针对多主题分类,结合最大间隔最小体积超球支持向量机和模糊理论,提出一种多主题最大间隔最小体积超球支持向量机来实现多主题分类.该算法首先基于最大间隔最小体积超球支持向量机,采用1-a-r方法训练子分类器,通过子分类器得到待分类样本的隶属度向量,再依据隶属度向量判定该待分类样本所属类别.实验结果表明,该算法具有较好的准确率、召回率、F1值.  相似文献   

5.
文传军  柯佳 《计算机工程与应用》2012,48(29):177-180,209
针对多类分类问题,提出一种超球支持向量机算法——广义最大间隔球形支持向量机,该算法利用两同心超球将正负类样本分隔开来,最大化两超球半径的差异,从而挖掘正负类样本的鉴别信息,同时对超球类支持向量机算法判决规则进行改进,引入模糊隶属度补充判决,弥补二类分类器投票决策的缺陷.理论分析了算法的相关性质,通过仿真实验验证了该算法的有效性.  相似文献   

6.
相同应用领域,不同时间、地点或设备检测到的数据域不一定完整。文中针对如何进行数据域间知识传递问题,提出相同领域的概率分布差异可用两域最小包含球中心点表示且其上限与半径无关的定理。基于上述定理,在原有支持向量域描述算法基础上,提出一种数据域中心校正的领域自适应算法,并利用人造数据集和KDDCUP99入侵检测数据集验证该算法。实验表明,这种领域自适应算法具有较好的性能。  相似文献   

7.
程昊翔  王坚 《控制与决策》2016,31(5):949-952
为了提高孪生支持向量机的泛化能力,提出一种新的孪生大间隔分布机算法,以增加间隔分布对于训练模型的影响.理论研究表明,间隔分布对于模型的泛化性能有着非常重要的影响.该算法在标准孪生支持向量机优化目标函数上增加了间隔分布的影响,间隔分布通过一阶和二阶数据统计特征来体现.在标准数据集上的实验结果表明,所提出的算法比SVM、TWSVM、TBSVM算法的分类精确度更高.  相似文献   

8.
应文豪  王士同 《计算机科学》2013,40(8):239-244,257
许多模式分类方法比如支持向量机和L2核分类器等都会利用核方法并转化为二次规划问题进行求解,而计算核矩阵需要O(m2)的空间复杂度,求解QP问题则需要O(m3)的时间复杂度,这就使得此类方法在大样本数据上的学习性能非常低下。对此,首次提出了相似度差支持向量机算法DSSVM。算法旨在寻求样本与某类相似度的一个最佳线性表示,并从线性表示的稀疏性以及相似度差意义上的间隔最大化角度构造了新的最优化问题。同时,证明了该算法等价于中心约束型最小包含球问题,这样就可以通过引入最小包含球的快速学习理论将相似度差支持向量机扩展为相似度差核支持向量机DSCVM,从而较好地解决了大规模数据集的分类问题。实验证明了相似度差支持向量机和相似度差核支持向量机的有效性。  相似文献   

9.
文章提出了两种快速分类的方法——基于最小超球体的平分最近点法和基于最小超球体的按比例划分法。前者只对分别包含正、负类训练点的两类超球体线性可分的情形有效,后者则适用于线性可分和近似线性可分的两类分类问题,且在确定分划超平面时融入了对训练集分布特征的考虑。两种方法皆借鉴了平分最近点法的思想,结合超球体的几何特征,用解析几何方法就可求得分划超平面,从而避免了求解二次规划,大大缩短了训练时间,减小了内存占用量,尤其在处理大规模数据集时优势更为明显。两种方法的特点及其和平分最近点法的对比在实证中都给予了分析说明。  相似文献   

10.
在现实生活中的很多应用里,对不同类别的样本错误地分类往往会造成不同程度的损失,这些损失可以用非均衡代价来刻画.代价敏感学习的目标就是最小化总体代价.提出了一种新的代价敏感分类方法——代价敏感大间隔分布学习机(cost-sensitive large margin distribution machine, CS-LDM).与传统的大间隔学习方法试图最大化“最小间隔”不同,CS-LDM在最小化总体代价的同时致力于对“间隔分布”进行优化,并通过对偶坐标下降方法优化目标函数,以有效地进行代价敏感学习.实验结果表明,CS-LDM的性能显著优于代价敏感支持向量机CS-SVM,平均总体代价下降了24%.  相似文献   

11.
传统支持向量机的时间空间复杂度和样本个数有关,样本个数大时,将产生时间空间上的巨大耗费。文章通过对一类问题最小包围球研究分析的基础上提出了一种简化算法,该算法对每一类别样本单独构造一个近似最小超球,不仅降低了二次规划问题的复杂度,而且易于扩充。仿真实验表明,该算法在不降低识别率的情况下,减少了支持向量的个数,降低了算法的复杂度。  相似文献   

12.
一般化最小包含球的大样本快速学习方法   总被引:1,自引:0,他引:1  
胡文军  王士同  王娟  应文豪 《自动化学报》2012,38(11):1831-1840
标准最小包含球(Minimum enclosing ball, MEB)模型的对偶问题可视为MEB问题并能够利用核心集向量机(Core vector machine, CVM)实现大样本的快速训练,但对于一般化MEB模型,对偶问题中的不等式约束发生了变化而不能视为MEB问题, 不能方便地使用CVM来解决大样本的快速训练.为此,提出了一般化MEB快速学习方法(Fast learning of generalized MEB, FL-GMEB),首先放松对偶问题中的不等式约束条件,使其等价于中心约束的MEB问题,从而利用CVM获得其核心集(Core set, CS);然后利用局部线性嵌入(Locally linear embedding, LLE)的逆思想将CS扩充为拓展核心集(Extended core set, ECS);最后将ECS及其对应的优化权作为一般化MEB模型的逼近解. UCI和USPS数据集上的实验结果表明, FL-GMEB在大样本快速训练方面具有较好的性能优势.  相似文献   

13.
提出一种基于近似最小闭包球原理的中文博客(Blog)话题分类方法。根据近似最小闭包球原理,将支持向量机的优化求解转换为近似最小闭包球求解,使得只需选择大规模数据集的一个核心子集参与分类器的训练过程,以提高Blog话题分类中大规模训练集的处理能力。在较大规模的Blog数据集上进行中文Blog特征选择及话题分类实验。实验结果表明,该方法不仅准确率可达到支持向量机同等的效果,且可减少训练时间,获得较好的Blog话题分类效果。  相似文献   

14.
传统支持向量机的时间空间复杂度和样本个数有关,样本个数大时,将产生时间空间上的巨大耗费。文章通过对一类问题最小包围球研究分析的基础上提出了一种简化算法,该算法对每一类别样本单独构造一个近似最小超球.不仅降低了二次规划问题的复杂度,而且易于扩充。仿真实验表明,该卓法在不降低识别率的情况下,减少了支持向量的个数,降低了算法的复杂度。  相似文献   

15.
杨莹  冯立颖  赵静  陈利 《计算机工程》2010,36(15):199-201
针对大规模地形数据庞大、绘制速度慢的问题,提出一种基于数据分块和包围球误差函数的地形绘制方法。该方法对数据进行分块组织,按行列顺序对数据块编号,实现对地形数据的部分读取。依据视点可见性判断,实时调入可见数据块,设计一种基于包围球的误差函数,通过三角形二叉树构建层次细节模型,实现大规模地形实时绘制。实验结果表明该方法可以取得较高的帧速率和较好的绘制效果。  相似文献   

16.
在多分类问题中,分类算法的优劣直接影响到最终分类结果的好坏。现有的多分类算法中,基于支持向量机的多分类算法在综合性能方面要优于其他算法,但是,这些较优算法同样面临一些多分类中常见的问题,如不可分问题和效率低问题。针对这些问题,文中提出了一种改进的二叉树支持向量机多分类算法,该算法综合考虑了两个类之间的距离和分布情况对可分离性的影响,并采用最容易分离的类最先分割出来的策略来建立树的结构。通过在不同的数据集上进行测试,表明该方法不仅解决了多分类的不可分问题,还能提高分类的效率和准确度,可更好地解决现实中的多分类问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号