首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
为了解决传统聚类方法在多维数据集中聚类效果不佳的问题,提出了将网络社团划分的方法,并应用到多维数据聚类分析中。对于一个多维数据集,首先对分析对象进行特征提取,构建出每个对象的特征向量,通过计算皮尔森相关系数来度量不同特征向量之间的相似性,从而构建出一个相似性网络,采用Blondel算法对该网络进行社团划分达到聚类的效果。实验结果表明该方法可以在多维数据聚类中得到较好的聚类结果,准确率达到92.5%,优于K-means算法的75%。  相似文献   

2.
吴君 《信息与电脑》2023,(11):112-114
现有的信息数据整合方法的数据冗余较高,因此文章引入模糊聚类算法,以绿地园林养护信息数据为例,提出了基于模糊聚类算法的数据整合模型研究。首先,清洗处理信息数据;其次,建立信息数据整合模型;最后,利用模糊聚类算法,全方位地整合模型内的信息数据。实验分析可知,提出模型应用后,整合信息数据冗余比明显较低,整合效果优势显著。  相似文献   

3.
梁壮 《信息与电脑》2023,(12):207-209
为实时监测网络信息传输中安全态势,设计了一种针对网络信息传输的安全监测方法。首先,利用大数据技术进行网络信息安全因素的模糊等价处理,实现基于大数据技术的网络信息安全因素关联分析;其次,标记网络信息的传输节点,聚类节点安全行为;再次,通过分析与对比聚类后节点之间关联程度,判断网络信息在传输中是否存在异常行为,实现信息传输安全监测;最后,经对比实验结果表明,设计的方法应用效果良好,有效提高了监测结果的可靠度。  相似文献   

4.
模糊c-均值算法改进及其对卫星遥感数据聚类的对比   总被引:4,自引:0,他引:4  
提出的改进的模糊c-均值聚类方法采用基于标准协方差矩阵的Mahalanobis距离,即椭球体聚类方法,这种聚类算法更接近遥感数据散点图的实际情况,从而可以显著提高聚类效果。对北京卫星ASTER数据的聚类分析实验表明,改进的模糊c-均值聚类方法的聚类效果要优于K-均值聚类方法和常规的模糊c-均值聚类方法。  相似文献   

5.
近些年来,全世界范围内的移动互联网以及云计算技术都得到了飞速发展,网络上随时随地都会出现诸多的各方面数据,在这大数据时代背景下,有必要加强对于分布式隐私保护聚类挖掘算法展开深入分析。本文简略介绍了大数据挖掘安全技术以及隐私数据保护技术,并对基于大数据的分布式隐私保护聚类挖掘算法展开了全面探索,旨在提升数据隐私保护水平的同时,还能达到高精确度的大数据聚类挖掘效果。  相似文献   

6.
张晓博  杨燕  李天瑞  陆凡  彭莉兰 《计算机应用》2005,40(10):3088-3094
针对多发于老龄人群的帕金森病(PD)的早期智能化诊断的问题,提出基于医疗检测文本信息数据的聚类技术来对PD进行分析预测。首先,对原始数据集进行预处理以获取有效特征信息,并通过主成分分析(PCA)方法将原始特征分别降维到8个不同维度的维度空间;然后,应用5个传统的经典聚类模型和3种不同的聚类集成方法分别对8个维度空间的数据进行聚类;最后,采用4个聚类性能指标来预测数据集中的多巴胺异常PD患者、健康体和无多巴胺缺失(SWEDD) PD患者。仿真结果显示,PCA特征维度值取30时,高斯混合模型(GMM)的聚类准确度达到89.12%;PCA特征维度值取70时,谱聚类(SC)的聚类准确度达到61.41%;PCA特征维度值取80时,元聚类算法(MCLA)的聚类准确度达到59.62%。对比实验结果表明,5种经典聚类方法中,PCA的特征维度值小于40时,高斯混合模型聚类效果最佳;3种聚类集成方法中,对于不同的特征维度,MCLA的聚类性能均表现优异,进而为PD的早期智能化辅助诊断提供了技术和理论支撑。  相似文献   

7.
聚类分析技术能使人脸识别系统了解人脸特征数据的分布方式,并为人脸数据库建立适当的索引结构.目前缺乏对真实人脸数据进行聚类分析的工作,为弥补不足,此文探索了Cure聚类算法在人脸识别中的应用.在分析过各种影响聚类效果的因素,如高维人脸特征数据对聚类效果的影响、Cure算法的缺点等,对Cure算法提出了若干改进.  相似文献   

8.
汤颖  钟南江  孙康高  秦大康  周伟华 《计算机科学》2017,44(Z11):385-390, 427
随着社交网络的流行,从各种各样的社交网络数据中提取出有效信息并进行清晰直观的可视化分析,从而为用户提供有价值的潜在知识,显得尤为重要。聚类分析是数据挖掘中的重要分析手段,传统的面向社交网络数据的用户聚类分析大都仅考虑网络的拓扑链接结构,未考虑用户的兴趣相似度。文中基于贝叶斯概率模型来计算用户兴趣相似度并进行聚类,进一步设计交互可视化方式来展示上述聚类结果。具体地,针对社交网络中的用户评分数据 建立潜在语义模型来提取表示每个用户兴趣特点的特征向量;基于用户的特征向量对用户进行聚类,得到具有不同特征的人群,并通过实验和热度图选择合适的人群聚类数;最后提出了基于层次气泡图的可视化展现和分析方案,将用户、电影类型、电影等多维信息在图形中交互展示,支持用户从全局概览到局部细节的推进式探索,从多角度可视化人群特征。对豆瓣网用户和电影评分数据进行了实验和分析,结果验证了所提方法的有效性。  相似文献   

9.
为了研究数据挖掘技术在过程工业数据中的应用,采用基于Bayes原理的AutoClass聚类算法,对炼油厂常减压装置实际生产数据进行了聚类分析处理。结果表明,经过聚类分析可以从历史数据记录中提取清晰的类别信息,其中包含有用的知识。同时还通过对比实验,分析了多个聚类参数对结果的影响及原因。最后分析了聚类结果,讨论了应用该结果的方法。  相似文献   

10.
面对增量式增长的聚类数据,受云计算并行化处理模式的启发,文中对一种网格化聚类算法进行了MapReduce并行化研究。该算法首先利用网格处理技术对数据进行预处理,用网格预处理后所得单元的重心点取代该单元中保存的所有点,然后在MapReduce框架下将各个单元的重心点作为聚类分析的基本数据单元,进行聚类分析。实验结果表明,该算法MapReduce并行化后部署在Hadoop集群上运行,具有与原来相同的聚类效果,并能节省聚类分析的时间和降低计算的复杂度,适合用于高纬度、增量式的海量数据的分析和挖掘。  相似文献   

11.
基因表达数据的聚类分析研究进展   总被引:4,自引:1,他引:3  
基因表达数据的爆炸性增长迫切需求自动、有效的数据分析工具. 目前聚类分析已成为分析基因表达数据获取生物学信息的有力工具. 为了更好地挖掘基因表达数据, 近年来提出了许多改进的传统聚类算法和新聚类算法. 本文首先简单介绍了基因表达数据的获取和表示, 之后系统地介绍了近年来应用在基因表达数据分析中的聚类算法. 根据聚类目标的不同将算法分为基于基因的聚类、基于样本的聚类和两路聚类, 并对每类算法介绍了其生物学的含义及其难点, 详细讨论了各种算法的基本原理及优缺点. 最后总结了当前的基因表达数据的聚类分析方法,并对发展趋势作了进一步的展望.  相似文献   

12.
大数据分类挖掘过程中所涉及的数据量较大,导致大数据挖掘结果的查全率、查准率以及分类正确率下降。为解决以上问题,设计了基于云计算的大数据分类挖掘算法。利用云计算技术设计大数据采集架构,在此基础上,利用改进随机森林算法分类处理采集的大数据,通过并行化聚类算法聚类数据,实现大数据分类挖掘。实验结果表明,本文算法的查全率与查准率、分类正确率较高,实际应用效果好。  相似文献   

13.
针对非充分数据集及噪声对聚类分析的干扰,基于模糊C均值(FCM)框架下的聚类技术,即一般化的增强模糊划分聚类算法(GIFP-FCM),探讨具有迁移学习能力的聚类方法--融入迁移学习机制的GIFP-FCM算法(T-GIFP-FCM)。该算法通过有效利用历史相关场景(域)总结得到的知识来指导当前场景(域)中信息不足时的聚类任务,从而提高聚类效果。通过在模拟数据集及真实数据集上的仿真实验,结果显示文中算法较之传统算法在处理信息不足任务时具有更佳的性能。  相似文献   

14.
提出了一种利用模糊集理论进行聚类的技术,详细阐述了在关系数据库中利用此技术实现聚类的方法和过程,并给出了程序流程和程序实现;经过聚类后的数据对象,既可以从中获取分类知识和信息,也可以为下一步的关联规则挖掘提供低噪声的数据源。  相似文献   

15.
分析了网络数据维数和检测准确度之间的关系,介绍了常用于入侵检测的聚类分析方法及其优缺点。在此基础上,提出一种以戴维森堡丁指数(DBI)为聚类准则、基于划分和密度方法的聚类算法(DBI-PD)。该方法通过信息增益率(IGR)提取网络数据中对检测攻击最有用的"特征",并以DBI准则确定最优聚类个数、划分和密度两种聚类分析方法结合使用用于异常检测。提出的基于DBI-PD的异常检测机制能有效避免聚类分析在入侵检测中的"维数灾难"问题、避免无用数据特征干扰,还能改善聚类质量,从而提高检测准确度。  相似文献   

16.
利用空间聚类方法探索城市整体区域信息分布的研究逐渐成为热点。当前许多聚类算法在给定的局部范围内进行分析,体现较好的抗噪性和聚类效果;而在全局搜索和聚类分析中,数据的准确性受到影响,不能正确地反映出所需的聚类信息。提出基于角度的全局聚类算法,考虑数据的全局性分布结构,在全局搜索过程中研究角度变化的关系、角度均值计算和判定参考阈值设定。通过公式推导证明在单个要素的判定和整体判定阈值都比基于角度的局部聚类算法具有更好的抗噪性。采用乐山市城区的数据进行高价值商业圈聚类分析测试,证明了该算法在全局范围内进行聚类分析,聚类的效果稳定性好,异常数据小,聚类簇间区别明显,能够准确甄别出核心区域数据。  相似文献   

17.
函数型聚类分析是探索函数型数据的重要工具,现有的函数型聚类方法大多属于无监督学习,没有考虑到数据的标签信息.针对目前函数型聚类方法的无监督特性,以及函数型数据通常具备的非负性特征,提出了一种非负半监督函数型聚类方法(SSNFC),用于处理带有少量标签信息的非负函数型数据的聚类问题.首先,通过引入约束非负矩阵分解(CNMF)技术,将标签信息融入函数型聚类过程中,构建了曲线拟合、非负约束和函数型聚类相统一的一步法模型.其次,给出了模型的迭代更新求解算法,证明了算法的局部收敛性,并分析了算法的时间复杂度.最后,在随机模拟数据、Growth数据和TIMIT语音数据的实验结果表明,与无监督函数型聚类方法相比较,提出的非负半监督函数型聚类方法SSNFC有助于提高聚类性能.  相似文献   

18.
1.引言聚类分析已广泛应用于模式识别、质量判定、统计物理学、成组技术、天气预报等很多领域.聚类分析的方法主要有以下四个方面:1)系统聚类法;2)动态聚类法;3)图论方法;4)数学规划法.上述四类方法都是以内部聚类准则作为评价指标的.系统聚类法是以样本为结点,根据样本之间的相似性确定相应的树状图(dendogram),由不同的接纳水平(阀值)确定合理的分类.图论在聚类分析中的应用,是以样本间的距离数据为依据,建立不同的网络模型.图论方法与一般聚类方法有所不同的是,它不但指出了类内样本的组成,而且指出了类内样本的…  相似文献   

19.
针对聚类问题中的非随机性缺失数据, 本文基于高斯混合聚类模型, 分析了删失型数据期望最大化算法的有效性, 并揭示了删失数据似然函数对模型算法的作用机制. 从赤池弘次信息准则、信息散度等指标, 比较了所提出方法与标准的期望最大化算法的优劣性. 通过删失数据划分及指示变量, 推导了聚类模型参数后验概率及似然函数, 调整了参数截尾正态函数的一阶和二阶估计量. 并根据估计算法的有效性理论, 通过关于得分向量期望的方程得出算法估计的最优参数. 对于同一删失数据集, 所提出的聚类算法对数据聚类中心估计更精准. 实验结果证实了所提出算法在高斯混合聚类的性能上优于标准的随机性缺失数据期望最大化算法.  相似文献   

20.
目前随着信息检索技术的不断深入,信息检索技术中的聚类分析也得到了不断的发展,特别是随着各种数据源的大量涌现,如图像数据,文本数据,DNA数据,时间序列数据,Web数据等等,聚类分析越来越受到重视,对聚类的研究已经成为信息检索领域中一个非常活跃的研究课题。论文以聚类分析方法为理论基础,利用面向对象编程技术完成了一个聚类软件,应用该聚类软件,可对信息实现快速检索,具有实用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号