首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 46 毫秒
1.
函数型数据将观测到的数据作为一个整体,关注数据自身的内在结构而不只是数据的呈现形式,相较于传统的数据包含了更多的信息,因此对函数型数据的分析和研究具有重要的价值。在函数型数据分析中,特征选择也是一个需要解决的问题。提出了一种面向函数型数据的动态互信息(dynamic mutual information,DMI)特征选择方法,充分考虑数据的内在特征,运用互信息将特征进行排序和动态选择,不仅可以获得稳定的特征子集,而且充分考虑了样本在特征选择中的作用,较好地避免了信息的冗余。进一步提出了一种动态条件互信息(dynamic conditional mutual information,DCMI)特征选择方法,在动态特征选择的过程中,考虑到已选特征会对后续的特征选择产生影响,引入条件互信息,将已选特征对待选特征的影响进行量化表示,更恰当地描述特征与特征集合之间的关系。在UCR数据集上的实验结果表明,DMI方法和DCMI方法进行特征选择得到的特征子集规模小且分类精度高。  相似文献   

2.
基于粒计算视角,提出粒化-融合框架下的海量高维数据特征选择算法.运用BLB(Bag of Little Bootstrap)的思想,首先将原始海量数据集粒化为小规模数据子集(粒),然后在每个粒上构建多个自助子集的套索模型,实现粒特征选择,最后,各粒特征选择结果按权重融合、排序,得到原始数据集的有序特征选择结果.人工数据集和真实数据集上的实验表明文中算法对海量高维数据集进行特征选择的可行性和有效性.  相似文献   

3.
生物神经中的感知理论符合黎曼流形,相比其它滤波器,Log-Gabor滤波器更适合人眼的非线性对数特性,因此两者结合符合人类视觉的感知过程.基于上述情况,文中利用协方差鉴别学习,提出基于Log-Gabor 滤波特征的黎曼流形图像集分类算法.使用Log-Gabor滤波器滤波图像,获得多尺度多方向的图像特征,然后对高维的协方差矩阵使用双向二维主成分分析进行降维,利用协方差鉴别学习进行分类.在多个标准数据库上的实验结果表明文中算法效果较好,从而验证算法的有效性.  相似文献   

4.
目前已有很多针对单值信息系统的无监督特征选择方法,但针对区间值信息系统的无监督特征选择方法却很少.针对区间序信息系统,文中提出模糊优势关系,并基于此关系扩展模糊排序信息熵和模糊排序互信息,用于评价特征的重要性.再结合一种综合考虑信息量和冗余度的无监督最大信息最小冗余(UmIMR)准则,构造无监督特征选择方法.最后通过实验证明文中方法的有效性.  相似文献   

5.
针对特征空间中存在潜在相关特征的规律,分别利用谱聚类探索特征间的相关性及邻域互信息以寻求最大相关特征子集,提出联合谱聚类与邻域互信息的特征选择算法.首先利用邻域互信息移除与标记不相干的特征.然后采用谱聚类将特征进行分簇,使同一簇组中的特征强相关而不同簇组中的特征强相异.继而基于邻域互信息从每一特征簇组中选择与类标记强相关而与本组特征低冗余的特征子集.最后将所有选中特征子集组成最终的特征选择结果.在2个基分类器下的实验表明,文中算法能以较少的合理特征获得较高的分类性能.  相似文献   

6.
在已有的特征选择算法中,常用策略是通过相关准则选择与标记集合相关性较强的特征,然而该策略不一定是最优选择,因为与标记集合相关性较弱的特征可能是决定某些类别标记的关键特征.基于这一假设,文中提出基于局部子空间的多标记特征选择算法.该算法首先利用特征与标记集合之间的互信息得到一个重要度由高到低的特征序列,然后将新的特征排序空间划分为几个局部子空间,并在每个子空间设置采样比例以选择冗余性较小的特征,最后融合各子空间的特征子集,得到一组合理的特征子集.在6个数据集和4个评价指标上的实验表明,文中算法优于一些通用的多标记特征选择算法.  相似文献   

7.
基于互信息的主成分分析特征选择算法   总被引:3,自引:0,他引:3  
主成分分析是一种常用的特征选择算法,经典方法是计算各个特征之间的相关,但是相关无法评估变量间的非线性关系.互信息可用于衡量两个变量间相互依赖的强弱程度,且不局限于线性相关,鉴于此,提出一种基于互信息的主成分分析特征选择算法.该算法计算特征间的互信息,以互信息矩阵的特征值作为评价准则确定主成分的个数,并衡量主成分分析特征选择的效果.通过实例对所提出方法和传统主成分分析方法进行比较,并以神经网络为分类器分析分类效果.  相似文献   

8.
完成众多视觉任务的关键是提取具有较强表达能力的图像特征,传统的图像特征仅描述图像某一方面的信息,表达能力受到很大限制.文中基于卷积神经网络提出图像深度层次特征(DHF)提取算法,通过对图像的层层抽象表达,可以有效挖掘隐藏在图像内部的本质信息.首先基于卷积神经网络产生图像特征图,选取卷积输出层的特征图构建图像阶层结构.然后基于匹配实验选择最佳的层级组合,采用信息熵描述低层级特征图,采用区域平均的方法描述高层级特征图,最终构建具有较强表达能力的DHF特征.实验表明,相比已有特征,DHF特征优势明显,可以高效准确地完成图像匹配任务.  相似文献   

9.
由于符号型数据缺乏清晰的空间结构,很难构造一种合理的相似性度量,从而使诸多数值型聚类算法难以推广至符号型数据聚类.基于此种情况,文中引入一种空间结构表示方法,把符号型数据转化为数值型数据,能够在保持原符号型数据的结构特征的基础上重新构造样本之间的相似度.基于此方法,将仿射传播(AP)聚类算法迁移至符号数据聚类中,提出基于空间结构的符号数据AP算法(SBAP).在UCI数据集中若干符号型数据集上的实验表明,SBAP可以使AP算法有效处理符号型数据聚类问题,并且可以提升算法性能.  相似文献   

10.
机器学习、模式识别、数据挖掘等领域中的输入模式常常是高阶张量.文中首先从向量模式推广到张量模式,提出弹球支持张量机模型.然后给出求解弹球支持张量机模型的序贯最小优化算法(SMO).为了保持张量的自然结构信息,同时加速训练过程,采用张量的秩-1分解代替原始张量计算张量内积.在向量数据和张量数据上进行的大量实验表明:对于向量数据,相比经典的积极集法,SMO的计算速度更快;对于张量数据,相比弹球支持向量机,弹球支持张量机具有更快的训练速度和更好的泛化能力.  相似文献   

11.
基于神经网络的中文文本分类中的特征选择技术   总被引:5,自引:2,他引:3  
基于神经网络的中文文本分类需要解决的核心问题是特征的选择问题,特征选择涉及选择哪些特征和选择的特征维度两个问题。针对上述问题,提出了信息增益(IG)与主成分分析(PCA)相结合的特征选择方法。通过实验比较分析了不同特征选择方法与特征维度对分类性能的影响,证明了该特征选择方法在基于神经网络的中文文本分类中的优越性,并得出神经网络的特征输入维度在200左右的时候分类性能最佳。  相似文献   

12.
基于核的主成分分析(KPCA)方法能提取数据的非线性特征,但特征提取的效率却与训练样本集合的容量成反比.文中提出一种特征提取的自适应核特征子空间方法来快速有效地提取特征.该方法和KPCA方法在理论分析框架上是一致的,但通过自适应的选取核子空间的张成向量,能在提高特征提取效率的同时不影响特征提取的精度.针对模拟数据和MNIST数据的实验结果表明文中方法优于经典KPCA方法和参考方法.  相似文献   

13.
在分析已有不完备信息熵的基础上,提出一种基于相似关系的不完备信息熵,并证明该信息熵的若干性质.给出一个不完备数据特征选择算法,算法以改进的不完备信息熵作为特征选择准则,直接对不完备数据的特征进行熵值分析,并采用顺序前向浮动选择方法解决特征间的相关性问题.最后在UCI实测数据集上的实验表明,文中算法具有更高的准确率和更快的特征选择速度.  相似文献   

14.
基于数据挖掘的入侵特征选择与构造的新方法   总被引:2,自引:0,他引:2  
入侵检测问题实际上是一个分类问题, 特征选择的好坏直接决定了分类模型的性能。针对计算机安全问题是事后于计算机系统设计、没有标准的审计机制和专门的数据格式用于入侵检测分析用途的现状, 讨论了通过扩展数据挖掘基本算法来对分析数据源进行特征选择, 同时比较挖掘出来的正常模式和异常模式, 构造新的特征, 以加强入侵检测准确率和实时性。  相似文献   

15.
该文详细的介绍了独立元分析方法(Independent Component Analysis,ICA)的基本背景、原理,以及各种独立元分析算法及其特点。同时考虑到在视频分割中,视频图像的内容丰富,物体复杂多样,但是前景物体和背景图像基本上保持相对独立的特点,利用盲信号分离的思想,尝试着把独立元分析方法用于视频分割,以获得相对独立的背景和前景图像。文中用摄像头采集的连续几帧图像做实验,取得了比较满意的效果。  相似文献   

16.
针对网络流量特征属性选择的寻优和效率问题,提出了一种PCA结合禁忌搜索的网络流量特征选择方法。该方法通过PCA对高维特征属性空间进行特征约减,并利用禁忌搜索得到全局最优特征子集。实验证明,相比流行的遗传算法(GA)和粒子群寻优算法(PSO-SVM),PCA和禁忌搜索方法具有更好的处理效率和特征选择精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号