共查询到18条相似文献,搜索用时 96 毫秒
1.
当前主流特征提取方法主要从全局特征或局部特征出发实现降维。为了能充分反映样本的全局特征和局部特征,提出基于图的人脸特征提取方法。该方法首先通过对训练样本进行学习得到最佳投影方向,该方向保证投影后的样本类内紧密而类间松散;然后将测试样本映射到最佳投影方向上并利用最近邻分类器进行样本类属判定。标准人脸库上的比较实验结果证明了所提方法的有效性。 相似文献
2.
图聚类是图挖掘研究领域目前的研究热点之一.现有基于非深度学习技术的多个中小规模图的聚类算法提取频繁子图并作为特征,主要存在所选特征无效或重要特征丢失的问题,影响了聚类的性能.因此,本文提出了一种基于混合特征选择的图聚类算法.首先提出了一种基于主成分分析原理(Principal Component Analysis, PCA)的评估函数,从图数据集中挖掘出区分特征子图,作为候选特征.其次,提出了一种分支定界技术,加速了区分子图的挖掘过程.接着,为了进一步提高聚类准确率,不失一般性地选择了一种流行的嵌入式特征选择算法,继续对候选特征集进行特性选择,并同时完成图聚类.最后,通过真实数据集上的实验验证了本文提出的基于混合特征选择的图聚类方法的有效性. 相似文献
3.
针对图像检索问题,提出一种基于群稀疏特征选择的图像检索方法.利用特征具有的群聚与稀疏的特性,构建一个L2,1范数正则化逻辑回归问题,运用自适应谱梯度算法(ANSPG)有效地求解权重,根据这个权重选择出有效特征.最后运用所选择的有效特征在基于内容的检索框架上进行图像检索.在Core15K与IAPR IC12图像库上进行的实验结果表明,提出的方法具有非常良好的性能. 相似文献
4.
5.
6.
一种基于聚类的文本特征选择方法 总被引:6,自引:0,他引:6
传统的文本特征选择方法存在一个共性,即通过某种评价函数分别计算单个特征对类别的区分能力,由于没有考虑特征间的关联性,这些方法选择的特征集往往存在着冗余。针对这一问题,提出了一种基于聚类的特征选择方法,先使用聚类的方法对特征间的冗余性进行裁减,然后使用信息增益的方法选取类别区分能力强的特征。实验结果表明,这种基于聚类的特征选择方法使得文本分类的正确性得到了有效的提高。 相似文献
7.
关于研究多源信息问题,为了解决在多源信息融合中当多种来源的特征信息具有冗余性、互补性和不确定性的情况下,如何进行和优化特征选择的问题.采用博弈论的思想,博弈论和多源信息融合结合起来.将多源特征空间中的特征信息抽象为局中人和策略集,对特征信息的不确定性及其冲突与合作的性质,采用互信息熵的方法进行描述,用构造的支付值函数来表示,最后通过对赢得矩阵求取策略均衡求解出特征子集.实验结果表明,选出的特征子集不仪能够提高决策判断系统的性能,而且解决了由于特征维数过高所引起的"特征维数灾难"问题.证明是一种有效的多源信息融合方法. 相似文献
8.
特征选择是文本分类的一个重要环节,它可以有效提高分类精度和效率。在研究文本分类特征选择方法的基础上,分析了信息增益方法的不足,将频度、集中度、分散度应用到信息增益方法上,提出了一种基于信息增益的特征优化选择方法。实验表明,该方法在分类效果与性能上都优于传统方法。 相似文献
9.
一种特征选择的动态规划方法 总被引:8,自引:0,他引:8
通过分析特征选择的机理,提出了一种特征选择性能指标和基于此指标的动态规划特征选择方法.使复杂的多类特征信息选择的全局满意解寻求过程,转变成一个简单的阶段性最优化问题.在一定条件下,由各阶段最优决策构成的整体策略等价于原问题的全局满意解.本文法较好地应用于水声信号特征分析. 相似文献
10.
11.
特征选择是模式识别和机器学习领域的重要问题。针对目前Filter和Wrapper方法,以及传统二阶段组合式方法存在的缺陷,提出了一种双重过滤式特征选择方法FSTPF,并在三个国际公认数据集和一个盾构隧道施工实时数据集上进行了验证测试。实验结果表明,FSTPF算法降维效果好,且获得的优化特征子集的分类准确率得到了提高。 相似文献
12.
针对传统的偏最小二乘法只考虑单特征的重要性以及特征之间存在冗余和多重共线性等问题,将特征之间的统计相关性引入到传统的偏最小二乘分析中,构造了一种基于特征相关的偏最小二乘模型。首先利用特征相关度对特征进行评估预选出特征组,然后将其放入偏最小二乘模型中进行训练,评估该特征组是否可取。结合前向贪心搜索策略依次评价候选特征,并选中使目标函数最小的候选特征加入到已选特征。分别采用麻杏石甘汤君药止咳、平喘和UCI数据集进行分析处理,实验结果表明,该特征选择方法能较好寻找较优的特征组。 相似文献
13.
将信息论中熵的概念应用到特征选择中,定义了两种信息测度评价特征——误差熵和混叠熵,然后阐述了两种定义的不用物理意义,分析了计算熵中最关键的区间划分问题,并提出一种较好的区间划分方法。由于熵不能将相似的特征进行剔除,结合相似系数提出了一套完整的基于熵的特征选择过程,并通过仿真实验进行验证。 相似文献
14.
特征选择旨在降低待处理数据的维度,剔除冗余特征,是机器学习领域的关键问题之一。现有的半监督特征选择方法一般借助图模型提取数据集的聚类结构,但其所提取的聚类结构缺乏清晰的边界,影响了特征选择的效果。为此,提出一种基于稀疏图表示的半监督特征选择方法,构建了聚类结构和特征选择的联合学习模型,采用l__1范数约束图模型以得到清晰的聚类结构,并引入l_2,1范数以避免噪声的干扰并提高特征选择的准确度。为了验证本方法的有效性,选择了目前流行的几种特征方法进行对比分析,实验结果表明了本方法的有效性。 相似文献
15.
一种新的基于多启发式的特征选择算法 总被引:24,自引:1,他引:24
在查询扩展方法中,如果通过查询结果中关键词的上下文来计算候选关键词的权重,将权重大的词作为查询扩展词,其候选关键词来源于文档中关键词的上下文,这种方法存在主题漂移的问题。为了解决这个问题,提出一种将初始查询结果过滤,只选择与源文档语境相似的搜索结果,来帮助选择查询扩展词的方法。实验结果表明该方法能获得更合适的查询扩展词。 相似文献
16.
特征选择对于分类器的分类精度和泛化性能起重要作用。目前的多标记特征选择算法主要利用最大相关性最小冗余性准则在全部特征集中进行特征选择,没有考虑专家特征,因此多标记特征选择算法的运行时间较长、复杂度较高。实际上,在现实生活中专家依据几个或者多个关键特征就能够直接决定整体的预测方向。如果提取关注这些信息,必将减少特征选择的计算时间,甚至提升分类器性能。基于此,提出一种基于专家特征的条件互信息多标记特征选择算法。首先将专家特征与剩余的特征相联合,再利用条件互信息得出一个与标记集合相关性由强到弱的特征序列,最后通过划分子空间去除冗余性较大的特征。该算法在7个多标记数据集上进行了实验对比,结果表明该算法较其他特征选择算法有一定优势,统计假设检验与稳定性分析进一步证明了所提出算法的有效性和合理性。 相似文献
17.
特征选择是数据挖掘和机器学习领域中一种常用的数据预处理技术。在无监督学习环境下,定义了一种特征平均相关度的度量方法,并在此基础上提出了一种基于特征聚类的特征选择方法 FSFC。该方法利用聚类算法在不同子空间中搜索簇群,使具有较强依赖关系(存在冗余性)的特征被划分到同一个簇群中,然后从每一个簇群中挑选具有代表性的子集共同构成特征子集,最终达到去除不相关特征和冗余特征的目的。在 UCI 数据集上的实验结果表明,FSFC 方法与几种经典的有监督特征选择方法具有相当的特征约减效果和分类性能。 相似文献
18.
针对传统的谱特征选择算法只考虑单特征的重要性,将特征之间的统计相关性引入到传统谱分析中,构造了基于特征相关的谱特征选择模型。首先利用Laplacian Score找出最核心的一个特征作为已选特征,然后设计了新的特征组区分能力目标函数,采用前向贪心搜索策略依次评价候选特征,并选中使目标函数最小的候选特征加入到已选特征。该算法不仅考虑了特征重要性,而且充分考虑了特征之间的关联性,最后在2个不同分类器和8个UCI数据集上的实验结果表明:该算法不仅提高了特征子集的分类性能,而且获得较高的分类精度下所需特征子集的数量较少。 相似文献