首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于近邻方法的高维数据可视化聚类发现   总被引:2,自引:0,他引:2  
提出了一种新颖的基于近邻方法的高维数据可经聚类方法,并实现了一个近邻可视化聚类发现系统VisNN。已有的解决高维数据可视化聚类方法主要是通过降维把维数据投影到二维或三维空间上,从而达到可视化目的。  相似文献   

2.
已有的二维流场可视化中,鞍点等临界点是最重要的特征之一.文中从一个新的角度提出一种基于流线聚类的二维向量场可视化方法.首先生成采样流线集合,然后将流线聚类,最后引入共轭法向量场和流线密度矩阵对同一个类的流线进行加速排序.在此基础上,提出3种可视化应用:抽取每一类的代表流线进行向量场的流线简洁表达;根据流线之间距离进行多分辨率均匀流线表达;生成权值图,增强基于纹理的向量场可视化.实验结果表明,该方法具有良好的鲁棒性,可视化效果优于已有的方法.  相似文献   

3.
针对Isomap算法在处理一些有局部扭曲和不均匀采样的流形就难以得到好的结果的情况提出一种利用聚类算法和核函数来改进点之间距离的C-Isomap降维算法.实验中分别使用Swiss Roll和S-Curve两个数据集测试C-Isomap算法的性能.通过跟Isomap和S-Isomap算法的比较,C-Isomap算法取得了较好的效果.  相似文献   

4.
社团结构划分对研究复杂网络有重要作用,由于该问题的复杂性,复杂网络中的社团划分问题成为近期的一个研究热点.从经典数据分析的角度研究了复杂网络的社团结构,首先依据网络的拓扑信息,将网络节点投影成高维空间的点,使得一个网络对应到高维空间中的一个点分布;接着使用主分量分析方法PCA对高维点分布降维,保留点群分布的主要结构信息;再通过K-m eans聚类结果来推断网络的社团结构.基于2-mode数据和1-mode网络数据实验表明,该方法可以快速、可靠地找出网络的社团.将经典数据分析的聚类方法应用到网络分析中,验证了该思路的有效性,为网络社团分析提供一个新视角.  相似文献   

5.
针对基于功能核磁共振(fMRI)重构的脑网络状态观测矩阵维数过高且无特征表现的问题,提出一种基于谱特征嵌入(Spectral Embedding)的降维方法。该方法首先计算样本间相似性度量并构造拉普拉斯矩阵;然后对拉普拉斯矩阵进行特征分解,选取前两个主要的特征向量构建2维特征向量空间以达到数据集由高维向低维映射(降维)的目的。应用该方法对脑网络状态观测矩阵进行降维并可视化在二维空间平面,通过量化类别有效性指标对可视化结果进行评价。实验结果表明,与主成分分析(PCA)、局部线性嵌入(LLE)、等距映射(Isomap)等降维算法相比,使用该方法得到的脑网络状态观测矩阵低维空间的映射点有明显的类别意义表现,且在类别有效性指标上与多维尺度分析(MDS)和t分布随机邻域嵌入(t-SNE)降维算法相比,同一类样本间平均距离Di指数分别降低了87.1%和65.2%,不同类样本间平均距离Do指数分别提高了351.3%和25.5%;在多个样本上的降维可视化结果均有一定的规律性体现,该方法的有效性和普适性得以验证。  相似文献   

6.
文本聚类中,文本特征向量的高维性使得对样本统计特征的评估十分困难,所以有必要进行有效的维数约简。ISOMAP是一类新近出现的非线性维数约简方法,可以有效地对文本特征空间进行降维处理,该方法改进了样本向量之间的距离度量,用测地距离代替传统的欧式距离,将高维的文本特征数据映射到2~3维的低维可视化空间上,达到数据降维目的,实现文本数据特征可视化,并在一定程度上解决聚类数问题。最后通过实例,验证了方法的可行性。  相似文献   

7.
基于高斯分布的簇间距离计算方法   总被引:2,自引:0,他引:2  
凝聚的层次聚类算法是一种性能优越的聚类算法,该算法通过不断合并距离相近的簇最终将数据集合划分为用户指定的若干个类别。在聚类的过程中簇间距离计算的准确性是影响算法性能的重要因素。本文提出一种新的基于高斯分布的簇间距离的计算方法,该方法通过簇自身的大小、密度分布等因素改进算法的计算准确性,在不同文本集合上与现有的簇间距离计算方法进行了对比实验,实验结果表明该方法有效地改进了层次聚类算法的性能。  相似文献   

8.
随着现代网络通信和社会媒体等技术的飞速发展,网络化的大数据由于缺少高效可用的节点表示而难以应用。将高维稀疏难于应用的网络数据转化为低维、紧凑、易于应用的节点表示的网络嵌入方法受到广泛关注。然而已有网络嵌入方法得到节点低维特征向量后,再将其作为其他应用(节点分类、社区发现、链接预测、可视化等)的输入来作进一步分析,没有针对具体应用构建模型,难以取得满意的结果。针对网络社区发现这一具体应用,提出结合社区结构优化进行节点低维特征表示的深度自编码聚类模型CADNE。首先基于深度自编码模型,通过保持网络局部及全局链接的拓扑特性来学习节点的低维表示,然后利用网络聚类结构对节点低维表示进一步优化。该方法同时学习节点的低维表示和节点所属社区的指示向量,使节点的低维表示不仅能保持原始网络结构中的拓扑结构特性,而且能保持节点的聚类特性。与已有的经典网络嵌入方法进行对比,结果显示CADNE模型在Citeseer和Cora上取得最优聚类结果,在20NewsGroup上准确率提升最高达0.525;分类性能在Blogcatalog、Citeseer数据集上取得最好结果,在Blogcatalog上训练比例20%时比基线方法提升最高达0.512;并且CADNE模型在可视化对比中能够得到类边界更加清晰的节点低维表示,验证了所提方法具有较好的节点低维表示能力。  相似文献   

9.
针对K平均( K-means)、期望最大化( EM)等传统聚类算法在网络社团挖掘中存在的聚类结果不合理、容易陷入局部最小值等问题,以最小化社团间的连接权值为优化目标,基于节点间交互次数归一化结果建立节点间的相似矩阵,求出此矩阵对应的拉普拉斯矩阵,以拉普拉斯矩阵的前k个最小特征值对应的特征向量为基建立新的特征空间,将相似矩阵向新的特征空间做投影,在投影后的特征空间中运用K-means算法进行社团挖掘,实现目标函数的最小化。通过仿真实验对比,说明了该基于拉普拉斯矩阵的聚类方法( LMBC)比传统聚类方法更有效地解决聚类节点分布不均衡的问题,及非凸、高维数据集在保持原有几何结构的同时有效降维的问题。 LMBC从数据集相似矩阵的角度进行聚类分析,进一步丰富了流形学习的理论与方法,可广泛应用于社交网络分析及图像识别等领域。  相似文献   

10.
提出了一种基于遗传算法的高维数据模糊聚类方法。引入了一个模糊非相似矩阵来表示高维样本之间的非相似程度,并将高维样本初始化到二维平面。利用遗传算法进行迭代优化二维样本的坐标值,实现二维样本之间的欧氏距离向样本间的模糊非相似度的趋近,使高维样本映射到二维平面。最后将得到的最优的二维样本利用模糊C-均值聚类(FCM)算法聚类,克服了聚类有效性对高维样本空间分布的依赖。实验仿真表明利用该方法有较好的聚类效果,且比用FCM算法直接聚类收敛速度快。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号