首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
大规模数据集的多层聚类算法   总被引:1,自引:0,他引:1  
针对大多谱聚类算法由于计算复杂度高而不适于大规模数据的问题,提出了一种能处理大规模数据集的多层算法。该算法把海量数据根据一定的相关性逐级分组成小数据集,再对分组后的小数据集用谱聚类算法进行聚类,最后利用权核K均值聚类逐级微调,完成全部数据的聚类。通过对UCI数据库中的数据集和图像分割的仿真实验,结果表明该算法的聚类效果很好。  相似文献   

2.
基于最大熵模糊聚类的快速数据关联算法   总被引:7,自引:0,他引:7  
提出了一种新颖的快速数据关联算法,减少了滤波中关联概率的计算量.该算法利用多个并行改进的最大熵模糊聚类对各个目标的有效观测进行聚类,采用聚类得到的模糊隶属度来重建滤波中的联合关联概率,并在联合关联概率中引入了比例因子避免航迹的合并;此外,分析了算法中差异因子的特性,考虑了杂波密度对它的影响,使得能够有效剔除无效观测,进一步减少计算量.仿真实验结果表明,提出的方法是一种有效的快速数据关联算法,跟踪性能要优于现有的数据关联算法.  相似文献   

3.
基于特征加权理论的数据聚类算法   总被引:1,自引:0,他引:1  
针对数据挖掘过程中数据聚类操作的初始聚类数目和初始聚类中心确定困难的问题,提出了一种软子空间结合竞争合并机制的模糊加权聚类算法.通过对软子空间聚类算法的目标函数进行改写,并结合数据簇势的大小对各数据簇进行竞争与合并操作,实现了对数据的聚类处理.结果表明,该算法能够准确地对数据样本进行聚类,并且聚类结果与初始数据簇数目和初始聚类中心无关,能够满足对高维数据聚类处理的需要,具有较好的实际应用价值.  相似文献   

4.
基于数据划分最大信息的聚类有效性函数   总被引:7,自引:0,他引:7  
基于样本最大分类信息的改进划分系数仅仅利用了数据的模糊分类信息,为了将数据分类的几何结构信息考虑进去,结合数据分类的最大内变差,提出一个聚类有效性标准。实验结果表明,该方法具有良好的分类性能。  相似文献   

5.
在数据聚类的过程中,由于样本数据空间分布的复杂性,相似度度量过程中的重复性以及算法的自适应性等问题,聚类算法往往无法得到正确的聚类结果.为了解决样本数据空间分布复杂的问题,提出叠加信息熵数据游走聚类算法.该算法通过在数值空间构建样本叠加信息熵场,并通过数据游走进行数据分割实现聚类.实验结果表明,该算法不仅可以获得较好的聚类效果,同时具有较高的数据自适应性.  相似文献   

6.
随着对实验精确度要求的不断提高,聚类分析中的不确定性数据聚类也越来越受到关注.然而经典的不确定数据聚类通常假设其概率密度函数(PDF)等信息是已知的,而现实过程中,这些指标并没有那么轻易就能获取.考虑到这些情况,可以利用三角模糊数来恰当有效地表示多维不确定性数据,并采用基于三角模糊数的低计算复杂度的距离计算方法,结合K-means基础聚类方法形成一种被命名为UTDK-means(Uncertain triangular fuzzy number data K-means)的聚类方法,而它是基于三角模糊数的.实验结果表明:基于三角模糊数的不确定数据聚类是可行的,具有一定的研究价值.  相似文献   

7.
针对原始谱聚类算法初始化敏感的缺点,提出了一种基于联合模型的初始化独立谱聚类算法并将其用于图像分割.通过引入联合模型可以充分利用待聚类数据所包含的空间邻近信息和特征相似性信息,得到更精确的聚类结果;通过引入K-调和平均算法克服了原始谱聚类算法对初始化的敏感性,从而得到更稳定的聚类性能.最后,通过对纹理图像和合成孔径雷达图像分割验证了新算法的有效性.  相似文献   

8.
采用属性聚类的高维子空间聚类算法   总被引:3,自引:1,他引:3  
为了解决现有子空间聚类算法时间复杂度偏高以及对输入参数敏感的问题,提出了一种基于属性聚类方法的高效子空间聚类算法.算法首先通过计算每个属性的基尼值来过滤冗余属性,而后通过基于二维联合基尼值的关系函数建立非冗余属性的关系矩阵,以衡量任意两个非冗余属性的相关度, 进而在关系矩阵上应用可产生交叠的聚类算法,聚类结果即为所有兴趣度子空间的候选集合,最后调用聚类算法得到所有存在于这些子空间内的簇.在人工数据集和真实数据集上的实验表明,新算法不仅在时间复杂度和子空间簇的寻找能力方面均有较优表现,而且对输入参数的取值不甚敏感.  相似文献   

9.
针对移动型数据与静态型数据同时存在的混合数据聚类问题,提出了混合数据聚类MMPSP算法.首先分析了包含静态型数据集与只有一个移动型数据的混合数据聚类问题,再扩展到包含静态型数据集与移动型数据集的混合数据聚类问题.混合数据聚类研究中对两种类型的数据分别进行聚类处理,即对静态型数据聚类处理得到静态簇,对移动型数据聚类处理得...  相似文献   

10.
基于FCM算法提出一种结合减法聚类与聚类有效性评判的模糊c均值聚类算法Sub_FCM,该算法能自动确定合理划分类数并初始化聚类原型,建立一种基于交替优化策略的无监督机器学习自动分类模型,并详细阐述了该模型在怀柔交叉路口流量段自动划分中的具体应用.实例分析表明,该算法能很好地反映路口交通流数据的内在结构,自动划分出合理流量段,为进一步实施合理的控制算法奠定基础.  相似文献   

11.
解决数字校园建设中存在的大量异构数据集成问题是目前教育信息化过程中的关键.针对异构数据导致的信息与资源分散,管理成本高,决策支持弱,网络基础服务平台与应用系统脱节等问题,提出了一种数字校园的异构数据集成方案一数字校园公共平台.然后根据数字校园公共平台的体系结构,详细描述了分层设计的体系结构的各层内容,给出了全局数据库模型建立、数字校园公共平台架构和统一数据访问等关键技术的实现.  相似文献   

12.
基于XML的异构数据源共享技术的研究   总被引:7,自引:0,他引:7  
选用以XML作为异构数据源的中介,实现异构数据源的共享,详细分析了基于XML的异构数据源的数据存取、交换、存储、表现等技术细节,探讨了XML在异构数据集成领域的应用前景。  相似文献   

13.
To construct mediators for data integration systems that integrate structured and semi-structured data,and to facilitate the reformulation and decomposition of the query,the presented system uses the XML processing language(XPL)for the mediator.With XPL,it is easy to construct mediators for data integration based on XML,and it can accelerate the work in the mediator.  相似文献   

14.
针对虚拟样机应用集成中的数据交换问题,考虑到产品模型的表达方式,提出了基于语义的异构模型间映射描述方法;该方法将异构数据交换问题,从应用具体实现代码中隔离,以一定形式抽象地表示,在元模型层与数据实例层准确地定义数据模型间的对应关系;最后,给出了实际采用此方法交换数据的典型事例。  相似文献   

15.
社交关系在生活中扮演着重要角色,用户通常会受到其好友偏好的影响,更容易选择好友购买过的物品.为了解决推荐系统冷启动问题,对融合社交关系的推荐系统进行了研究,提出了贝叶斯个性化排序评论评分社交模型和可扩展的贝叶斯个性化排序评论评分社交模型,将评分、评论、社交关系等多源异构数据从数据源层面进行了融合,通过用户好友信任度模型将社交关系引入到推荐系统中,用基于段向量的分布式词袋模型处理评论,用全连接神经网络处理评分,用改进的贝叶斯个性化排序模型对排序结果进行优化.实验在Yelp公开数据集上进行了实验,实验结果表明,所提出的2种模型的推荐准确度均优于其他推荐模型.  相似文献   

16.
异构数据源集成系统的查询重写技术研究   总被引:1,自引:0,他引:1  
Web环境下的异构数据源集成系统中,数据源或者是结构化很强的关系型,或者是半结构化型的以及无结构型的。文中提出了一种查询重写查找算法,利用视图将用户查询重写为直接面向数据源的各个子查询。理论分析表明,该算法较好地降低了查询代价。  相似文献   

17.
数字校园下异构数据库数据交换的研究   总被引:4,自引:0,他引:4  
数字校园的建设必然涉及到各种数据资源的整合、集成与交换。讨论了数字校园下的“信息孤岛”现象,采用目前使用广泛的XML技术来解决异构数据库间的数据交换。在此基础上研究了数据库与XML间的模式映射和基于矩阵的数据类型映射,并提出了利用交换规则解决异构数据交换中的逻辑异构问题,从而较好地解决了数字校园建设中的“信息孤岛”问题。  相似文献   

18.
现代制造业对产品性能要求越来越高,因此零件成型精度与打印质量成为三维打印技术研究的关键问题. 本文基于空间微四面体异质材料零件建模,提出了异质材料切片数据插补算法,编写程序并仿真实验结果. 在课题组研发的三维打印成型系统上进行异质材料零件的成型实验,验证了所提算法的正确性. 该方法实现了异质材料零件色彩连续渐变,提高了异质材料零件成型精度和打印质量.  相似文献   

19.
为了精确核算外埠进京货运车辆污染物,通过对多源数据质量分析评估,获取北京市交通流量和车辆定位信息监测数据等底层大数据,根据既有宏观污染物排放模型输入要求,通过建立异构大数据交叉匹配方法得到结构化模型输入数据,大幅提升了模型输入数据的准确性.同时,根据政策评估需求核算了北京市外埠进京货车污染物排放强度,量化了外埠货车对北京市域污染物排放的分担率,为北京市外埠货运车辆污染物排放控制的科学决策提供支持.  相似文献   

20.
如何利用信息化手段加强城市供热管理工作,实现对供热企业运行情况的实时监测,确保广大人民群众温暖过冬是省、市供热数字化监管平台建设中需要考虑的重点问题.在分析供热数据集成面临问题的基础上,借鉴已有数据集成方法,提出了基于战略数据规划方法建立全局数据模型、基于星型网络结构实现数据交换、基于ETL实现数据采集的设计思路。有效实现了分布式异构供热数据源的集成.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号