首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
综述了基于超曲面的分类算法,该算法通过区域合并计算获得多个超平面组成的双侧闭曲面作为分类超曲面对空间进行划分.分类超曲面可以有效地解决在有限连通区域分布很复杂的非线性数据多类分类问题,分析了算法准确率与极小样本集的关系,总结了已有成就和最新进展,指出了基于超曲面的分类算法进一步发展的方向.  相似文献   

2.
一种新的海量数据分类方法   总被引:5,自引:1,他引:5  
使用支持向量机对非线性可分数据进行分类的基本思想是将样本集映射到一个高维线性空间使其线性可分。文章则基于Jordan曲线定理,提出了一种通用的基于分类超曲面的分类法,它是通过直接构造分类超曲面,根据样本点关于分类曲面的围绕数的奇偶性进行分类的一种新分类判断算法,不需作升维变换,不需要考虑使用何种核函数,而直接地解决非线性分类问题。对数据分类应用的结果说明:基于分类超曲面的分类法可以有效地解决非线性数据的分类问题,并能够提高分类效率和准确度。  相似文献   

3.
基于超曲面的海量数据直接分类方法   总被引:1,自引:1,他引:1  
使用支持向量机对海量数据的分类是相当困难的,为了解决这个问题,该文讨论了以下问题:(1)提出了一种通用的基于超曲面的直接分类方法,它是基于Jordan曲线定理,根据围绕数的奇偶进行分类判断的一种新算法;(2)提出了分类超曲面的概念,设计出超曲面的构造方法及基于Jordan定理的分类算法;(3)对双螺旋等问题的分类实验结果说明,分类超曲面可以有效地解决在有限区域分布很复杂的海量的非线性数据分类问题,并能够提高分类效率和准确率。  相似文献   

4.
分类超曲面算法复杂度研究   总被引:1,自引:0,他引:1  
分类超曲面算法是一种简单的基于覆盖的分类算法.实验证明该算法具有分类正确率高、速度快的优点.但是,关于该算法的相关理论问题需要深入研究.文中对该算法的几个相关理论问题进行了研究.首先给出并证明了在分割的最大层数给定时算法假设空间的VC维,在此基础上结合可能近似正确(Probably Approximately Correct,PAC)学习框架,得出了对算法样本复杂度的估计,使得分类超曲面算法保证可PAC学习到任意目标概念.其次,分析了算法的时间复杂度和空间复杂度.最后,给出了无矛盾样本集的概念,并证明当输入样本集是有限无矛盾样本集的条件下,算法一定是收敛的.  相似文献   

5.
基于覆盖的分类算法研究进展   总被引:1,自引:0,他引:1  
何清  史忠植 《计算机学报》2007,30(8):1235-1243
理解数据与感知数据密切相关.覆盖学习算法在低维空间往往能模拟人的视觉感知来表示数据分布.文中综述了基于覆盖的分类算法的研究进展,特别对基于超曲面的覆盖分类算法进行了详细阐述和分析,并指出了基于超曲面的分类算法进一步研究的方向.  相似文献   

6.
曲学军  张璐 《计算机仿真》2010,27(7):358-361,369
研究了由散乱数据点集重构N边域曲面的方法.已有方法大都使用单张B样条曲面进行拟合,或由用户手工描绘曲面片的边界曲线网格.与之不同,为便于数字处理,采用广义基曲面参数化方法可以在建立曲面片网格同时进行散乱数据的参数化,全过程无需人工干预.另外,推导了在曲面拟合算法中控制顶点约束的确定方法以满足给定的边界条件.通过仿真,研究了曲面片网格的光顺以在N边域曲面内部达到G1连续,并以实例证明了文中算法的有效性.  相似文献   

7.
1 引言人的智慧中一个很重要的方面是从实例学习的能力,通过对已知事实的分析总结出规律,预测不能直接观测的事实。在人们对机器智能的研究中,用机器(计算机)来模拟这种学习能力,这就是我们所说的基于数据的机器学习问题,它是现代智能技术中的重要方面,其研究从观测数据(样本)出发寻找规律,利用这些规律对未来数据或无法观测的数据进行预测(分类)。统计机器学习理论为机器学习问题建立了一个较好的理论框架,也发展了一种新的通用学习算法一支持向量机(SVM),其关键思想是将在低维空间非线性可分的数据通过非线性函数(核函数)映射到一个非常高维的特征空间,并在这个新的线性空间构筑分类超平面。这一结果相应于原始空间就是通过分类超曲面进行分类判别。  相似文献   

8.
B-样条函数极小曲面造型   总被引:11,自引:3,他引:11       下载免费PDF全文
满家巨  汪国昭 《软件学报》2003,14(4):824-829
极小曲面在建筑、航空、轮船制造等领域有着重要应用,但由于极小曲面表示复杂,给实际应用带来了很大的困难.研究了具有给定边界的极小曲面的B-样条函数曲面逼近.基于非线性约束优化方法和有限单元方法,求极小曲面方程的近似解.在算法中使用数值延拓方法,使非线性问题的初值选择问题自动化,同时,使用一个简单的线性化策略对非线性问题进行线性化.给出了几个数值结果.  相似文献   

9.
针对有理Bézier调和曲面的复杂的有理性,提出一种构造有理Bézier调和曲面的近似算法.借助于有理曲线曲面的Hybrid多项式逼近方法与Bézier调和曲面的Monterde算法,将有理Bézier调和曲面的造型问题转换为线性约束条件下关于有限维变量的一个非线性目标函数的最小化问题.进一步,将该算法推广到有理Bézier双调和曲面的造型问题中去,并用有理双2次、双3次调和曲面与有理双3次双调和曲面的实例对文中算法进行了验证.结果表明,该算法对有理Bézier调和曲面与双调和曲面的构造问题有一定的实际应用价值.  相似文献   

10.
现有过滤型特征选择算法并未考虑非线性数据的内在结构,从而分类准确率远远低于封装型算法,对此提出一种基于再生核希尔伯特空间映射的高维数据特征选算法。首先,基于分支定界法建立搜索树,并对其进行搜索;然后,基于再生核希尔伯特空间映射分析非线性数据的内部结构;最终,根据数据集的内部结构选择最优的距离计算方法。对比仿真实验结果表明,本方法与封装型特征选择算法具有接近的分类准确率,同时在计算效率上具有明显的优势,适用于大数据分析。  相似文献   

11.
半监督学习在不平衡样本集分类中的应用研究   总被引:2,自引:1,他引:1  
在对不平衡样本集进行分类时容易产生少数类样误差大的问题,而目前半监督学习中的算法多数是针对未有明显此类特征的数据集。针对一种半监督协同分类算法在该问题上的有效性进行了研究。由于进一步增强了分类器差异性,该算法在理论上对不平衡样本集具有良好的分类性能。根据该算法建立分类模型,利用其对桥梁结构健康数据进行分类实验,与Tri-Training算法的结果比较表明,该算法对不平衡样本集具有良好的适用性,从而验证了上述算法的有效性。  相似文献   

12.
基于k-最近邻图的小样本KNN分类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对象进行类别标识。采用标准数据集进行测试,结果表明该算法在小样本情况下能够提高KNN的分类精度,减小最近邻阈值k对分类效果的影响。  相似文献   

13.
刘应东  孙秉珍 《计算机工程》2012,38(7):155-157,160
样本集中的数据数量过少会影响最后的分类精度。为此,提出基于元胞自动机模型的小样本集分类算法,利用元胞自动机的状态转换规则和分类规则,通过元胞空间的演化实现对数据集的分类。对标准数据集的测试结果表明,在小样本集和样本集中数据分布不均匀的情况下,该算法具有较高的分类精度。  相似文献   

14.
针对标准遗传算法的不稳定性、准确性低等问题,为了提高遗传分类算法的稳定性和准确性,基于贝叶斯算法的有关理论,提出一种新的遗传算法分类方法.将初始样本集随机的分成数量相等的几组,通过朴素贝叶斯算法从初始样本集中选出部分“区分度”比较高的样本作为新的样本集,通过改进的遗传算法对选出的新样本集进行处理,从而得到最优分类规则.通过两种算法的组合对数据分类时,使分类的稳定性和准确性得到了明显的改善.仿真实验结果表明,该算法有较高的稳定性和准确性.  相似文献   

15.
传统的KNN算法存在分类效率低等缺点.针对这些缺点,本文提出一种高效的结合多代表点思想的加权KNN算法,利用变精度粗糙集上下近似区域的概念,结合聚类算法生成代表点集合构造分类模型,再运用结构风险最小化理论优化分类模型并对影响分类模型的因素进行分析.分类过程中根据测试样本与各代表点的相似度,得到测试样本的相对位置.其中属于样本点下近似区域的测试样本可直接判断其类别.若测试样本在其他区域,则根据测试样本与各代表点的相对位置对各代表点覆盖范围内的样本进行加权后判断测试样本的类别.在文本分类领域的数据集上进行实验,结果表明该算法能有效的提高分类模型的性能.  相似文献   

16.
决策树作为一种经典的分类算法,因其分类规则简单易懂被广泛应用于医学数据分析中.然而,医学数据的样本不平衡问题使得决策树算法的分类效果降低.数据重采样是目前解决样本不平衡问题的常见方法,通过改变样本分布提升少数类样本的分类性能.现有重采样方法往往独立于后续学习算法,采样后的数据对于弱分类器的构建不一定有效.鉴于此,提出一种基于C4.5算法的混合采样算法.该算法以C4.5算法为迭代采样的评价准则控制过采样和欠采样的迭代过程,同时依据数据的不平衡比动态更新过采样的采样倍率,最终以投票机制组合多个弱分类器预测结果.通过在9组UCI数据集上的对比实验,表明所提出算法的有效性,同时算法也在稽留流产数据上实现了准确的预测.  相似文献   

17.
采样技术与ELM分类算法进行结合可提高少数类样本的分类精度,但现有的大多数结合ELM的采样方法并未考虑到样本的不平衡程度及样本内部的分布情况,采样技术过于单一,导致分类模型的效率低下,少数类样本的识别率不高。针对此问题,提出了一种基于DPC聚类的重采样技术结合ELM的不平衡数据分类算法,首先根据数据集的不平衡程度分2种情况构建一个混合采样模型来平衡数据集;然后在此模型上运用DPC聚类算法分别对多数类样本和少数类样本进行分析处理,解决数据中存在的类内不平衡和噪声问题,使得2类样本相对均衡;最后使用ELM分类算法对得到的数据集进行分类。实验结果表明,与同类型分类算法进行比较,所提算法的2个分类性能指标在实验数据集上都有明显提升。  相似文献   

18.
郑仙花  骆炎民 《计算机应用》2012,32(11):3201-3205
针对传统的克隆选择算法(CSA)只依次单独针对某一类样本数据进行监督学习从而造成分类效率和精确度不高的问题,提出一种基于改进克隆选择算法的多类监督分类算法。算法通过进化学习可以同时获得多类样本数据的最佳聚类中心,进化过程中抗体适度值的计算综合考虑各类的类内相似性和类间差异性,从而保证得到的最佳聚类中心更具代表性。后续的分类实验中,分别利用常用的4组UCI数据和红树林多光谱TM遥感图像对算法进行验证,实验结果表明遥感图像的分类总精度达到92%,Kappa系数为0.91,UCI数据分类结果也较好,证明该算法是一种有效的多类数据分类算法。  相似文献   

19.
传统的分类算法大都默认所有类别的分类代价一致,导致样本数据非均衡时产生分类性能急剧下降的问题.对于非均衡数据分类问题,结合神经网络与降噪自编码器,提出一种改进的神经网络实现非均衡数据分类算法,在神经网络模型输入层与隐层之间加入一层特征受损层,致使部分冗余特征值丢失,降低数据集的不平衡度,训练模型得到最优参数后进行特征分类得到结果.选取UCI标准数据集的3组非均衡数据集进行实验,结果表明采用该算法对小数据集的分类精度有明显改善,但是数据集较大时,分类效果低于某些分类器.该算法的整体分类效果要优于其他分类器.  相似文献   

20.
本文提出了一种改进的KNN分类算法,利用样本集合中同类别样本点间距离都十分接近的特点辅助KNN算法分类.将待分类样本点的K个最近邻样本点分别求出样本点所属类别的类别平均距离和样本点与待分类样本点距离的差值比,如果大于一个阈值,就将该样本点从K个最近邻的样本点中删除,再用此差值比对不同类别的样本点个数进行加权后执行多数投票,来决定待分类样本点所属的类别.改进后的KNN算法提高了分类的精度,并且时问复杂度与传统KNN算法相当.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号