首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
提出一种新的、基于面片错分率和面积错分率的三维网格模型分割定量评价准则.定量评价是精确衡量分割效果、针对特定应用选择最有效的分割算法、以及指导新算法研究的重要基础.基于分割质量显著的数据库进行的三维分割评价准则给出的定量评价指标属于模糊的、统计性质的评价,在评价特定类型的分割时,该评价指标的可信较低、精确性较差.本文基于普林斯顿大学数据库中7类385份高质量的手工分割结果,以及7种自动分割算法中分割数目与手工分割数目相近的部分高质量数据,基于面片错分和面积错分两种准则,对7种自动分割算法进行定量了评价.实验证明本文提出的两种错分评价准则具有较高的精度和可信性.  相似文献   

2.
针对模式分类中特征选择问题,为去除冗余特征,提高分类准确率,提出一种基于ReliefF算法、Fisher比率算法和马氏距离算法的多准则排序融合的特征选择方法。动态结合上述3种单准则特征选择法的优点,实现对多个评价准则的综合利用。以Ionosphere标准数据集和高速列车转向架故障数据集为研究对象进行实验仿真,仿真结果表明,相比于单准则特征选择法,该方法能更有效地降低特征维数,具有更高的分类性能。  相似文献   

3.
一种改进的红外目标识别算法   总被引:1,自引:1,他引:0  
提出一种基于一维搜索和距离函数的快速独立分量分析(Fast ICA)特征提取改进算法。该算法针对Fast ICA中迭代初始值的选取影响其收敛性的问题,通过一维搜索策略使其收敛性不依赖于初始值的选取。与此同时,根据红外图像的特性设计类内类间距离函数准则对提取的独立分量进行优化选择,保留对目标识别贡献大的独立分量特征,从而克服在高维特征子空间下随着训练图像样本数的增多,红外目标识别率和稳定性下降的问题。实测数据实验结果表明,与传统算法相比,该算法能够在提取少量红外目标特征的情况下达到更低的错分率,且算法在不同类别数下的错分率具有较强的鲁棒性。  相似文献   

4.
基于排序融合的特征选择   总被引:3,自引:0,他引:3  
针对模式分类中的特征选择问题,分别依据ReliefF算法、类间可分性及特征相关性等多个评价准则对待约简特征进行评价与排序,基于排序融合方法实现对多个特征选择评价准则的综合利用.基于多个数据集的实验结果表明,该方法在有效降低特征维度的同时,具有比单准则特征选择方法更高的分类性能.  相似文献   

5.
不平衡支持向量机的平衡方法   总被引:2,自引:0,他引:2  
针对支持向量机中两类不平衡数据的分离超平面提出一种调整算法.首先用标准的支持向量机对原始数据进行初步训练,产生一个分离超平面的法向量.然后把高维样本投影到该法向量上得到一维数据.最后由投影数据的标准差以及样本容量所提供的信息,给出两类数据惩罚因子比例,再用标准的支持向量机进行第2次训练,从而得到一个新的分离超平面.实验显示该方法的有效性,即在一般情况下能平衡错分率,甚至还能减少错分率.  相似文献   

6.
如何构造差异性大的基分类器是集成学习研究的重点,为此提出迭代循环选择法:以最大化正则互信息为准则提取最优特征子集,进而基于此训练得到基分类器;同时以错分样本个数作为差异性度量准则来评价所得基分类器的性能,若满足条件则停止,反之则循环迭代直至结束.最后用加权投票法融合所选基分类器的识别结果.通过仿真实验验证算法的有效性,以支持向量机为分类器,在公共数据集UCI上进行实验,并与单SVM及经典的Bagging集成算法和特征Bagging集成算法进行对比.实验结果显示,该方法可获得较高的分类精度.  相似文献   

7.
在已有的特征选择算法中,常用策略是通过相关准则选择与标记集合相关性较强的特征,然而该策略不一定是最优选择,因为与标记集合相关性较弱的特征可能是决定某些类别标记的关键特征.基于这一假设,文中提出基于局部子空间的多标记特征选择算法.该算法首先利用特征与标记集合之间的互信息得到一个重要度由高到低的特征序列,然后将新的特征排序空间划分为几个局部子空间,并在每个子空间设置采样比例以选择冗余性较小的特征,最后融合各子空间的特征子集,得到一组合理的特征子集.在6个数据集和4个评价指标上的实验表明,文中算法优于一些通用的多标记特征选择算法.  相似文献   

8.
在机器学习及其分类问题时经常会遇到非平衡数据集,为了提高非平衡数据集分类的有效性,提出了基于商空间理论的过采样分类算法,即QMSVM算法。对训练集中多数类样本进行聚类结构划分,所得划分结果和少数类样本合并进行线性支持向量机(SVM)学习,从而获取多数类样本的支持向量和错分的样本粒;另一方面,获取少数类样本的支持向量和错分的样本,进行SMOTE采样,最后把上述得到的两类样本合并进行SVM学习,这样来实现学习数据集的再平衡处理,从而得到更加合理的分类超平面。实验结果表明,和其他几种算法相比,所提算法虽在正确分类率上有所降低,但较大改善了g_means值和acc+值,且对非平衡率较大的数据集效果会更好。  相似文献   

9.
周頔  李勇明 《计算机应用》2009,29(1):132-135,
针对filter模式下传统遗传算法特征选择精度不高,wrapper模式特征选择时间代价较高的缺点,提出了一种新的轮询多准则特征选择算法。该算法以搜索性能较好的链式智能体遗传算法为搜索算法,引入主准则分析方法确定评价准则的轮询次序,实现高性能的多准则特征选择。将该算法与filter模式和wrapper模式下特征选择算法以及顺序轮询式特征选择算法进行了比较。实验结果表明,该算法具有比filter模式下单评价准则选择精度更高,比wrapper模式所需时间代价更低等特点。  相似文献   

10.
针对传统原型选择算法易受样本读取序列、异常样本等干扰的缺陷,通过分析原型算法学习规则,借鉴最近特征线法思想,改进传统原型算法,提出一种自适应边界逼近的原型选择算法。该算法在原型学习过程中改进压缩近邻法的同类近邻吸收策略,保留更优于当前最近边界原型的同类样本,同时建立原型更新准则,并运用该准则实现原型集的周期性动态更新。该算法不仅克服读取序列、异常样本对原型选取的影响,而且降低原型集规模。最后通过人工数据和UCI基准数据集验证文中算法。实验表明,文中算法选择的原型集比其他算法产生的原型集更能体现数据集的分布特征,平均压缩率有所提高,且分类精度与运行时间优于其他算法。  相似文献   

11.
This paper proposes a new feature selection methodology. The methodology is based on the stepwise variable selection procedure, but, instead of using the traditional discriminant metrics such as Wilks' Lambda, it uses an estimation of the misclassification error as the figure of merit to evaluate the introduction of new features. The expected misclassification error rate (MER) is obtained by using the densities of a constructed function of random variables, which is the stochastic representation of the conditional distribution of the quadratic discriminant function estimate. The application of the proposed methodology results in significant savings of computational time in the estimation of classification error over the traditional simulation and cross-validation methods. One of the main advantages of the proposed method is that it provides a direct estimation of the expected misclassification error at the time of feature selection, which provides an immediate assessment of the benefits of introducing an additional feature into an inspection/classification algorithm.  相似文献   

12.
针对传统的特征选择使用阈值过滤导致有效信息丢失的问题,提出一种粗糙集的文本特征选择方法。该方法以核为起点利用特征属性的重要性和依赖性作为启发式信息进行特征选择,使文本的特征维数得到一定程度的降低。实验表明,此算法不仅易于实现而且能够有效降低特征数目,提高分类效率。  相似文献   

13.
基于遗传算法及聚类的基因表达数据特征选择   总被引:1,自引:0,他引:1  
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象(如基因表达数据)的特征选择,一方面可以提高分类及聚类的精度和效率,另一方面可以找出富含信息的特征子集,如发现与疾病密切相关的重要基因。针对此问题,本文提出了一种新的面向基因表达数据的特征选择方法,在特征子集搜索上采用遗传算法进行随机搜索,在特征子集评价上采用聚类算法及聚类错误率作为学习算法及评价指标。实验结果表明,该算法可有效地找出具有较好可分离性的特征子集,从而实现降维并提高聚类及分类精度。  相似文献   

14.
提出了一种利用数据库分组记数技术构造决策树的算法,利用数据库系统的结构化查询语言来实现主要的样本统计计算任务。并将构造决策树的过程与相关属性的选择方法有机地结合在一起。使用这些方法和策略,该算法能较快速地生成决策树,与ID3算法相比,在不影响决策树分类准确度的前提下,具有较高的执行效率。  相似文献   

15.
Reducing the dimensionality of the data has been a challenging task in data mining and machine learning applications. In these applications, the existence of irrelevant and redundant features negatively affects the efficiency and effectiveness of different learning algorithms. Feature selection is one of the dimension reduction techniques, which has been used to allow a better understanding of data and improve the performance of other learning tasks. Although the selection of relevant features has been extensively studied in supervised learning, feature selection in the absence of class labels is still a challenging task. This paper proposes a novel method for unsupervised feature selection, which efficiently selects features in a greedy manner. The paper first defines an effective criterion for unsupervised feature selection that measures the reconstruction error of the data matrix based on the selected subset of features. The paper then presents a novel algorithm for greedily minimizing the reconstruction error based on the features selected so far. The greedy algorithm is based on an efficient recursive formula for calculating the reconstruction error. Experiments on real data sets demonstrate the effectiveness of the proposed algorithm in comparison with the state-of-the-art methods for unsupervised feature selection.  相似文献   

16.
介绍了基于辨识集的属性约简算法,把该属性约简算法同类别相关性结合起来,提出了一个综合的特征选择方法.该综合方法使用类别相关性进行特征初选,并用所提属性约简算法消除冗余.实验结果表明此种特征选择方法能够获得较具代表性的特征子集.  相似文献   

17.
PCCS部分聚类分类:一种快速的Web文档聚类方法   总被引:16,自引:1,他引:15  
PCCS是为了帮助Web用户从搜索引擎所返回的大量文档片中筛选出自已所需要的文档,而使用的一种对Web文档进行快速聚类的部分聚类分法,首先对一部分文档进行聚类,然后根据聚类结果形成类模型对其余的文档进行分类,采用交互式的一次改进一个聚类摘选的聚类方法快速地创建一个聚类摘选集,将其余的文档使用Naive-Bayes分类器进行划分,为了提高聚类与分类的效率,提出了一种混合特征选取方法以减少文档表示的维数,重新计算文档中各特征的熵,从中选取具有最大熵值的前若干个特征,或者基于持久分类模型中的特征集来进行特征选取,实验证明,部分聚类方法能够快速,准确地根据文档主题内容组织Web文档,使用户在更高的术题层次上来查看搜索引擎返回的结果,从以主题相似的文档所形成的集簇中选取相关文档。  相似文献   

18.
针对局部二值模式没有考虑邻域点之间的关系以及局部序数模式(LIOP)的邻域点数过少不足,提出一种利用大邻域范围内邻域点间序数信息的特征提取算法。该算法首先以类似LIOP编码的方式得到的邻域特征向量,然后应用[k]均值聚类算法降低特征向量的主模数量。同时此聚类过程可以离线进行并且运行十分高效;最终将级联直方图特征作为人脸特征向量。实验结果表明,该方法的鲁棒性和识别率均优于对比算法。最后应用WPCA算法既降低特征维数又提升了算法的识别率。  相似文献   

19.
在数据挖掘中,由于数据集中含有大量的冗余和不相关的特征,因此特征选择是一个重要的预处理过程。提出了一个基于混合互信息和粒子群算法的过滤式-封装式的多目标特征选择方法(HMIPSO)。根据粒子的pbest距离上次更新的迭代次数,提出了自适应突变策略去扰动种群,避免种群陷入局部最优。同时基于帕累托前沿面和外部文档提出了一个新的集合概念。结合互信息和新的集合知识提出了一个局部搜索策略,使得帕累托前沿面中的粒子可以删除不相关和冗余的特征,然后通过精英策略更新学习前和学习后的帕累托前沿面。最后将提出的算法和另外4种多目标算法在15个UCI数据集上进行了测试,实验结果表明提出的算法能够更好地降低特征个数和分类错误率。  相似文献   

20.
本文首先简单分析了几种经典的特征选择方法,总结了它们的不足,然后提出了特征集中度的概念, 紧接着把差别对象对集引入粗糙集并提出了一个基于差别对象对集的属性约简算法,最后把该属性约简算法同特征 集中度结合起来,提出了一个综合性特征选择方法.该综合性方法首先利用特征集中度进行特征初选以过滤掉一些 词条来降低特征空间的稀疏性,然后再使用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结 果表明该综合性方法效果良好.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号