首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
属性规约是应对“维数灾难”的有效技术,分形属性规约FDR(Fractal Dimensionality Reduction)是近年来出现的一种无监督属性选择技术,令人遗憾的是其需要多遍扫描数据集,因而难于应对高维数据集情况;基于遗传算法的属性规约技术对于高维数据而言优越于传统属性选择技术,但其无法应用于无监督学习领域。为此,结合遗传算法内在随机并行寻优机制及分形属性选择的无监督特点,设计并实现了基于遗传算法的无监督分形属性子集选择算法GABUFSS(Genetic Algorithm Based Unsupervised Feature Subset Selection)。基于合成与实际数据集的实验对比分析了GABUFSS算法与FDR算法的性能,结果表明GABUFSS相对优于FDR算法,并具有发现等价结果属性子集的特点。  相似文献   

2.
属性选择在机器学习和数据挖掘领域起着重要作用,通常作为一个主要的预处理步骤.本文提出一种利用分形维数和蚁群算法进行属性选择的方法.在该方法中分形维数作为属性选择的评价机制,利用蚁群算法的正反馈机制加速属性选择的过程.为了分析结果的有效性,利用SVM分类算法和K-fold交叉验证相结合的方法对4个数据集属性选择前后的分类性能进行测试.实验结果表明该方法具有较好的性能,它能在较短的时间里找到较优的属性子集,并大大降低了数据集的维数.  相似文献   

3.
分形维数的高效求解是分形理论应用与实践的关键问题,传统分形维数计算方法由于时空复杂性高已成为当前分形技术应用的一个主要瓶颈。借鉴Z-ordering索引技术的思想,设计并实现了一种改进的多重分形维数计算方法ZBMFD(Z-ordering Based Multifractal dimension Algorithm),该方法扫描数据集一遍建立底层网格结构,通过动态修改网格坐标编码递推实现低层网格到高层网格之间的动态映射并计算数据集的分形维数。在实际数据集的实验表明算法在保持O(N×logN)时间复杂性的基础上,降低了分形维数算法的空间复杂性,且计算结果精度与已有算法相当,拓广了分形技术在当前高维、海量数据处理等领域的应用。  相似文献   

4.
属性选择是一种有效的数据预处理方法,可同时保留多变量时间序列重要变量的时序关系及其实际物理意义。针对很多实际数据无类别信息的问题,文中提出一种无监督属性选择算法并分析其复杂度。首先设计一种无需进行相空间重构的多变量时间序列分形维数计算方法,并将分形维数视为其本质维,利用属性子集的分形维数及其属性数目的变化作为子集优劣的评价标准。再优化离散粒子群算法以解决高维属性空间搜索的“组合爆炸”问题。最后利用典型混沌动力学系统所产生的多变量时间序列和UCI数据库的5组数据集进行仿真计算,结果表明该算法可在较短时间内找到较优的属性子集,具有较优的整体性能。  相似文献   

5.
基于分形维数的属性约简   总被引:1,自引:0,他引:1  
关于属性约简的算法已经提出了许多,基于粗糙集的属性约简算法就是其中的一类。但该类算法执行效率低且不一定得到最小约简。本文讨论了基于可辨识矩阵的属性频度算法(BDMF)并提出了基于分形维数的向后剔除属性约简算法(FDR)。仿真实验表明FDR比BDMF的运行效率高,且约简的效果更好。  相似文献   

6.
为了解决声纳图像分类较困难的问题,提出一种基于分形理论的声纳图像识别方法.针对传统的分形维数作为图像纹理特征表示时缺少图像分布特征的不足,引入了多重分形的概念和广义维数,并对原图像和灰度差分图像重新提取了图像的纹理特征.通过对声纳图像的分类实验,结果证实该方法行之有效.  相似文献   

7.
基于分形理论的声纳图像识别   总被引:1,自引:0,他引:1  
为了解决声纳图像分类较困难的问题,提出一种基于分形理论的声纳图像识别方法。针对传统的分形维数作为图像纹理特征表示时缺少图像分布特征的不足,引入了多重分形的概念和广义维数,并对原图像和灰度差分图像重新提取了图像的纹理特征。通过对声纳图像的分类实验,结果证实该方法行之有效。  相似文献   

8.
基于分形维数的数据挖掘技术研究综述   总被引:1,自引:1,他引:1  
分形维数在数据挖掘领域起着非常特殊的作用,它能有效地描述数据集,能反映复杂数据集中隐藏的规律性,基于分形维数的数据挖掘技术研究越来越受到人们的广泛关注.本文首先介绍了数据集的分形维数,进而在此基础上重点介绍了几种基于分形维数的数据挖掘技术,并对每种技术的特点进行了阐述,最后指出今后的发展方向.  相似文献   

9.
属性选择是数据挖掘领域中数据预处理的一个重要方法。文中提出一种融合离散型萤火虫群优化算法(DGSO)与分形维数的属性选择方法。该方法以分形维数作为属性子集的评估度量准则,以DGSO作为搜索策略。为分析该方法的可行性和有效性,采用6个UCI数据集进行实验。结合10-fold交叉验证和SVM对属性选择前后的分类准确率进行分析,并进行搜索策略和评估度量准则间的性能对比及详细的参数分析。结果表明该方法具有较高的可行性和有效性。  相似文献   

10.
属性选择通常作为一个主要的预处理步骤,在机器学习和数据挖掘领域有着广泛的应用。选择出能够表征数据集分形特征的属性子集,对研究数据集的分形规律具有重要的价值。根据数据集的分形特征,引入了密度分析方法,指出了当前基于分形维数的属性选择方法的不足,提出了一种基于分形和邻接空间密度变化的属性选择方法。为了分析实验结果的有效性,利用SVM分类算法和K-fold交叉验证相结合的方法对3个数据集属性选择前后的分类性能进行了测试。实验证明该方法在属性选择方面有较好的性能,能够得到较优的属性子集。  相似文献   

11.
针对图像数据的72维HSV颜色特征,对数据集的本征维概念进行了有意义的扩展,在此基础上提出了一个新的降维机制.实验证明,该降维算法是行之有效的.  相似文献   

12.
近年来,高维数据算法在诸如机器学习领域以及模式识别当中有着十分广泛的应用.降维算法的目的是为了揭示出在高维数据空间中样本数据的固有的组成特性,关注于寻找原始数据集特征表示中有价值的信息.相邻区域选择问题对流形学习降维算法的性能改进至关重要.因此,该文提出一种流形学习降维算法中的新动态邻域选择方法Mod-HLLE(mod...  相似文献   

13.
高维数据降维的DCT变换   总被引:3,自引:0,他引:3  
DCT(离散余弦变换)变换是图像压缩中常用的方法之一。基于它的“能量聚集特性”和变换的保距特性,把它用作高维数据降维的预处理手段,主要作用有两个:(1)大幅度降低后续降维的处理维数,减少运算量;(2)降低噪声对数据结构的影响。文中的试验结果表明,对高维数据,尤其是超高维数据的降维加入DCT变换后不但降低了后续降维的计算复杂度,同时也纠正了由于噪声的影响造成的数据结构的破坏。  相似文献   

14.
一种有效的的时间序列维数约简方法   总被引:3,自引:0,他引:3  
提出了一种用于相似性查询的时间序列维数约简的有效方法 .该方法采用快速小波变换将时间序列分解成不同频率的子带 ,用经过多分辨分解后得到的低频逼近信号重新表示原始序列 .这样将一个高维的时间序列映射到一个低维空间 .这种方法支持欧几理德距离标准和 L -平移欧几理德距离标准 .该算法的时间复杂性为 O(n) .  相似文献   

15.
针对LLE算法在数据密度变化较大时很难降维的问题,提出一种基于密度刻画的降维算法。采用cam分布寻找数据点的近邻,并在低维局部重建时对数据点加入密度信息。对手写体数字图像进行字符特征的降维,再对降维后的特征进行分类识别。实验结果表明,该方法能区分字符,具有较好的识别率,能够发现高维空间的低维嵌入流形。  相似文献   

16.
基于再生核Hilbert空间PCA的属性约简   总被引:1,自引:0,他引:1       下载免费PDF全文
传统的核主成分分析方法通过不明确的实值函数把原始数据投影到高维空间进行属性约简,增加了搜索分类超平面的时间,降低了分类准确率。为此,提出一种基于再生核Hilbert空间主成分分析的属性约简方法,把原始数据通过明确的连续值函数投影到高维或无限维的再生核空间再进行属性约简。真实数据集实验结果显示,该方法能有效提高分类准确率并减少运行时间。  相似文献   

17.
基于分形理论的离群点检测   总被引:2,自引:0,他引:2       下载免费PDF全文
现有离群点数据挖掘算法在高维空间效率比较低,针对上述不足,从离群点对数据集有序性的影响角度出发,在界定分形离群点含义的基础上,利用分形理论将离群数据挖掘作为一个优化分割问题进行处理。采用推广的G-P算法计算数据集的多重分形广义维数,利用贪婪算法的思想设计FDOM算法用于求解离群数据挖掘优化问题。实验结果证明,该算法能有效地解决离群点检测问题。  相似文献   

18.
高维图像特征数据不利于图像数据挖掘。为了降低图像特征数据维数,提出了基于概念格的降维算法,该算法将图像的HSV颜色特征转换为图像形式背景,再对背景的概念格进行属性约简。实验结果表明,该降维方法比较有效,并且较主成分分析具有明显的优势。  相似文献   

19.
宋欣  叶世伟 《计算机工程》2008,34(8):205-207
高维非线性数据的降维处理对于计算机完成高复杂度的数据源分析是非常重要的。从拓扑学角度分析,维数约简的过程是挖掘嵌入在高维数据中的低维线性或非线性的流形。该文在局部嵌入思想的流形学习算法的基础上,提出直接估计梯度值的方法,从而达到局部线性误差逼近最小化,实现高维非线性数据的维数约简,并在Swiss roll曲线上采样测试取得了良好的降维效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号