首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
计算信息特征(属性)的权重问题在信息分类及模式匹配中是一个研究热点。该文提出一种基于改进ReliefF算法的主成分特征提取方法,利用此算法删除原始特征中与分类不相关的特征,并对数据进行归一化处理和主成分提取。实验将34个特征变量降维成10个主成分,大大减轻后续的分类器工作量,提高分类器的分类精度。  相似文献   

2.
基于核的特征提取技术及应用研究   总被引:17,自引:0,他引:17  
该文分析了一般主成分分析在处理非线性问题上存在的不足,阐述了基于核的主成分分析方法,并将其首次应用到综合评价中,应用结果表明:基于核的主成分分析方法具有优秀的特征提取性能,采用不同形式的核函数基本上能获得相同精度的特征提取效果,文末指出为提高运算速度,减少内存要求和降低复杂度,可在KPCA中结合主动学习的方法。  相似文献   

3.
提出一种新的步态特征提取方法,首先利用坎尼算子提取前端腿部的边缘线,并对底部可能产生的误差点进行剔除;接着计算每两帧之间腿部边缘线每个像素点前进的位移,作为原始步态特征;然后,对步态特征进行远近归一化处理,消除被拍摄对象与拍摄镜头之间因距离不同所产生的影响;最后运用主成分分析,将特征空间维度由60维降到3~4维。在识别阶段,用归一化欧式距离计算样本之间的相似程度。提出的这种新的步态特征提取算法在3个人每人4个序列的小样本纯数据库上用最近标本分类器验证所提算法的性能,正确分类率为83.33%;在5个人每人4个序列的小样本混合数据库上,正确分类率为55%。  相似文献   

4.
为了对图像进行最优压缩,提出了两步2维主成分分析方法进行特征提取,称为增强的2维主成分分析。增强的2维主成分分析首先对图像进行行方向的2维主成分分析,再进行列方向的2维主成分分析。增强的2维主成分分析对图像进行了行方向和列方向的压缩,因此增强的2维主成分分析比2维主成分分析需要更少的系数来表示图像,需要更少的存储空间和分类时间。在ORL和FERET人脸库上的实验证明了该方法的有效性。  相似文献   

5.
基于PCA的XML文档特征提取方法   总被引:1,自引:0,他引:1  
郭丽红  王箭 《计算机工程与设计》2011,32(11):3894-3896,3911
为了更好地对XML文档进行分类或聚类分析,以主成分分析的理论基础为指导,在研究了文本表示的各种模型的基础上,提出了两种对XML文档进行向量化表示并进行特征提取的方法,同时也实现了对XML文档的有效降维。实验结果表明,两种方法都能有效地表示XML文档的主体特征,但全路径特征向量抽取方法能更好地描述XML信息,为下一步有效处理XML文档做了良好铺垫,具有一定的研究价值。  相似文献   

6.
受限于人脸姿态、光照变化等因素,通过引入多通道Gaborface表征结合基于子空间的二维双向线性降维算法,提出了一种结合优化多通道Gaborface与二维线性降维的特征提取算法。首先,采用多通道Gaborface表征(MGFR)模型对样本集进行预处理,提取不同通道下的人脸Gabor特征表示并优化选取通道融合方式而组合成新特征;再引入样本间类别信息获得改进线性二维双向特征降维算法,从而对获得的人脸表示进行特征降维与提取;最终通过最近邻分类器得到分类结果。试验结果表明,通过在AR、ORL和YALE人脸库进行对比分析,改进算法对人脸姿态等变化具有较强的鲁棒性,且较其他算法表现出了较优的识别性能。  相似文献   

7.
随着认知心理学和人工智能技术的不断发展,人脸面部表情识别技术越来越受到重视。本研究首先介绍了表情识别研究的发展过程及识别过程包括的四个部分,然后重点阐述了表情识别过程中特征提取的不同研究方法,最后对各种研究方法进行了比较,进而展望了表情识别研究的发展方向。  相似文献   

8.
为了获得更好的文本分类准确率和更快的执行效率, 研究了多种Web文本的特征提取方法, 通过对互信息(MI)、文档频率(DF)、信息增益(IG)和χ2统计(CHI)算法的研究, 利用其各自的优势互补, 提出一种基于主成分分析(PCA)的多重组合特征提取算法(PCA-CFEA)。通过PCA算法的正交变换快速地将文本特征空间降维, 再通过多重组合特征提取算法在降维后的特征空间中快速提取出更具代表性的特征项, 过滤掉一些代表性较弱的特征项, 最后使用SVM分类器对文本进行分类。实验结果表明, PCA-CFEA能有效地提高文本分类的正确率和执行效率。  相似文献   

9.
侯勇  郑雪峰 《计算机应用》2013,33(4):998-1000
核主成分分析(KPCA)与多层感知器(MLP)是流行的特征提取算法,但这些算法存在效率低下与易陷于局部最优解等问题。针对KPCA与MLP算法存在的问题,提出了一个新颖的特征提取算法--基于最大间隔超平面的增强的特征提取算法(EFE)。该算法独立于输入样本的概率分布,通过采用隔间最大化且两两正交的最大分割超平面,将输入样本映射到超平面的法线所张成的子空间中,实现输入样本的特征提取。在对现实世界数据集wine与AR的特征提取的实验表明,基于最大间隔超平面的增强特征提取算法在执行效率、识别准确率方面均超出了KPCA与MLP的执行效率与识别准确率。  相似文献   

10.
利用PCA进行深度学习图像特征提取后的降维研究   总被引:1,自引:0,他引:1  
深度学习是当前人工智能领域广泛使用的一种机器学习方法.深度学习对数据的高度依赖性使得数据需要处理的维度剧增,极大地影响了计算效率和数据分类性能.本文以数据降维为研究目标,对深度学习中的各种数据降维方法进行分析.在此基础上,以Caltech 101图像数据集为实验对象,采用VGG-16深度卷积神经网络进行图像的特征提取,以PCA主成分分析方法为例来实现高维图像特征数据的降维处理.在实验阶段,采用欧氏距离作为相似性度量来检验经过降维处理后的精度指标.实验证明:当提取VGG-16神经网络fc3层的4096维特征后,使用PCA法将数据维度降至64维,依然能够保持较高的特征信息.  相似文献   

11.
Classification is a method of accurately predicting the target class for an unlabelled sample by learning from instances described by a set of attributes and a class label. Instance based classifiers are attractive due to their simplicity and performance. However, many of these are susceptible to noise and become unsuitable for real world problems. This paper proposes a novel instance based classification algorithm called Pattern Matching based Classification (PMC). The underlying principle of PMC is that it classifies unlabelled samples by matching for patterns in the training dataset. The advantage of PMC in comparison with other instance based methods is its simple classification procedure together with high performance. To improve the classification accuracy of PMC, an Ant Colony Optimization based Feature Selection algorithm based on the idea of PMC has been proposed. The classifier is evaluated on 35 datasets. Experimental results demonstrate that PMC is competent with many instance based classifiers. The results are also validated using nonparametric statistical tests. Also, the evaluation time of PMC is less when compared to the gravitation based methods used for classification.  相似文献   

12.
针对传统特征检测算法提取的特征点稳定性差且不唯一,导致误匹配率过高的问题,提出了三条特征点筛选准则:稳定性准则、唯一性准则和显著性准则.其中稳定性准则保证筛选出健壮稳定的特征点,唯一性准则剔除特征重复的特征点,显著性准则保留带有明显特征信息的点.通过剔除掉不满足这三条准则的特征点,不仅减少了描述符的计算时间,同时也提高...  相似文献   

13.
特征选择是数据挖掘、机器学习和模式识别中始终面临的一个重要问题。针对类和特征分布不均时,传统信息增益在特征选择中存在的选择偏好问题,本文提出了一种基于信息增益率与随机森林的特征选择算法。该算法结合Filter和Wrapper模式的优点,首先从信息相关性和分类能力两个方面对特征进行综合度量,然后采用序列前向选择(Sequential Forward Selection, SFS)策略对特征进行选择,并以分类精度作为评价指标对特征子集进行度量,从而获取最优特征子集。实验结果表明,本文算法不仅能够达到特征空间降维的效果,而且能够有效提高分类算法的分类性能和查全率。  相似文献   

14.
带有通配符的模式匹配问题(PMWL)模式定义的灵活性给用户提供方便,却也造成求解上的困难。目前没有任何多项式算法能得到该问题的完备解,同时也缺少足够的完备性分析。文中认为模式特征是影响PMWL完备性的关键因素,并提出模式重复度的概念,记为rep。证明在rep=0的限定条件下PMWL的完备性,同时分析rep>0时PMWL不完备的原因。实验以近似比为指标,说明rep对PMWL完备性的影响。  相似文献   

15.
16.
针对应用广泛的单模式匹配算法进行阐述:先分析最原始的BF算法,它会产生指针回溯;接着分析KMP算法,它避免了BF算法中的指针回溯;然后分析Snort系统中采用的BM模式匹配算法的基本思想,它对目标串进行跳跃式搜索;分析了BMH算法,它较BM算法性能上又有显著提高;最后对各种算法作了一个比较,并通过实验进行性能测试。  相似文献   

17.
在文本分类中,对高维的特征集进行降维是非常重要的,不但可以提高分类精度和效率,也可以找出富含信息的特征子集.而特征选择是有效降低特征向量维数的一种方法.目前常用的一些特征选择算法仅仅考虑了特征词与类别间的相关性,而忽略了特征词与特征词之间的相关性,从而存在特征冗余,影响了分类效果.为此,在分析了常用的一些特征选择算法之后,提出了一种基于mRMR模型的特征选择方法.实验表明,该特征选择方法有助于提高分类性能.  相似文献   

18.
SIFT特征匹配算法研究   总被引:1,自引:0,他引:1  
提取灰度图像的SIFT特征并将其应用于图像检索是目前国内外研究的热点。用距离函数对图像的特征向量进行相似性度量,从而实现SIFT特征向量的匹配。通过实验很好地证明当图像本身的变化(例如大小或者旋转)对于图像的匹配的几乎没有影响。  相似文献   

19.
AC多模式匹配算法研究   总被引:2,自引:0,他引:2       下载免费PDF全文
巫喜红  曾锋 《计算机工程》2012,38(6):279-281
AC算法的内存空间开销大,不利于硬件实现。为此,提出AC多模式匹配算法。分析AC算法的特点,使用位图存储技术和压缩处理技术对其进行改进。从模式串长度和模式串数目角度出发进行实验,结果表明,该算法能缩短扫描时间,提高模式匹配速度和访问速度。  相似文献   

20.
大数据时代,文本数据量的爆炸式增长使得特征选择成为文本挖掘领域最关键的任务之一。文档中的词语和模式规模庞杂,故需保证所挖掘特征的质量充满挑战。“基于模式”特征选择方法具有传统“基于词语”方法所没有的优越特性,可以进行有效地信息去噪,提升文本挖掘性能。该文提出基于包含度和频繁模式的文本特征选择方法: 首先,定义基于包含度的相似性度量原理;然后,提出基于包含度的冗余文本频繁模式过滤方法。基于包含度度量文本频繁模式间相似性,以此去除子模式及相似度较高的交叉模式。再通过冗余模式去噪,提升文本频繁模式挖掘性能;提出基于关联度的文本特征选择方法。以经过过滤处理后的非冗余文本频繁模式为基础,进行文本特征选择,并利用词语与文档的关联度进行词语类别划分及权重分配。使所选特征与文档关联度更加清晰,分类效果更好。通过在数据集Reuters-21578上的实验得知,基于包含度和频繁模式的文本特征选择算法性能,优于当前普遍应用的传统文本特征选择方法和新的特征选择及特征抽取方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号