排序方式: 共有27条查询结果,搜索用时 0 毫秒
1.
基于k均值分区的数据流离群点检测算法 总被引:10,自引:0,他引:10
离群知识发现是数据挖掘研究的一个重要方面,数据流离群点挖掘更因其挖掘对象具有动态性、不可复读性、数据量大等特点而成为离群知识发现研究的一个难点.提出一种基于k均值分区的流数据离群点发现算法,先对数据流进行分区做k均值聚类生成中间聚类结果(均值参考点集),随后在这些均值参考点中,根据离群点的定义找出可能存在的离群点.理论分析和实验结果表明,算法可以有效解决数据流离群点检测问题,算法是有效可行的. 相似文献
2.
基于k均值分区的流数据高效密度聚类算法 总被引:2,自引:0,他引:2
数据流聚类是数据流挖掘研究的一个重要内容,已有的数据流聚类算法大多采用k中心点(均值)方法对数据进行聚类,不能对数据分布不规则以及高维空间数据流进行有效聚类.论文提出一种基于k均值分区的流数据密度聚类算法,先对数据流进行分区做k均值聚类生成中间聚类结果(均值参考点集),随后对这些均值参考点进行密度聚类,理论分析和实验结果表明算法可以有效解决数据分布不规则以及高维空间数据流聚类问题,算法是有效可行的. 相似文献
3.
信息网络互联互通是城市信息化的主要内容。本文通过讨论分析Internet网络结构、网络协议和路由策略,提出适合我国中小城市建立信息网络互联中心的系统结构和网络模型。并在此基础上,给出了CIX的组网方案和管理设想。 相似文献
4.
快速挖掘全局最大频繁项目集 总被引:18,自引:1,他引:18
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题.现行可用的最大频繁项目集挖掘算法大多基于单机环境,针对分布式环境下的全局最大频繁项目集挖掘尚不多见.若将基于单机环境的最大频繁项目集挖掘算法运用于分布式环境,或运用分布式环境下的全局频繁项目集挖掘算法来挖掘全局最大频繁项目集,均会产生大量的候选频繁项目集,且网络通信代价高.为此,提出了快速挖掘全局最大频繁项目集算法FMGMFI(fast mining global maximum frequent itemsets),该算法采用FP-tree存储结构,可方便地从各局部FP-tree的相关路径中得到项目集的频度,同时采用自顶向下和自底向上的双向搜索策略,可有效地降低网络通信代价.实验结果表明,FMGMF算法是有效、可行的. 相似文献
5.
本重点研究分析了基于Internet的风上在线数据库的开发和应用,讨论了Web数据库的远程数据传输和修改、删除以及添加等操作,提出了确保数据库安全的措施。介绍了大型网上数据库中国纸业的结构和设计思想。 相似文献
6.
7.
8.
9.
通过对瓷釉膨胀特性的分析及对膨胀曲线上特征点的讨论,以了解瓷釉在受热膨胀及冷却收缩过程中的变化,分析探讨瓷釉与基体金属的相互配合,以减少因两者膨胀系数不同而造成的缺陷。 相似文献
10.
基于局部信息熵的加权子空间离群点检测算法 总被引:7,自引:0,他引:7
离群点检测作为数据挖掘的一个重要研究方向,可以从大量数据中发现少量与多数数据有明显区别的数据对象.“维度灾殃”现象的存在使得很多已有的离群点检测算法对高维数据不再有效.针对这一问题,提出基于局部信息熵的加权子空间离群点检测算法SPOD.通过对数据对象在各维进行邻域信息熵分析,生成数据对象相应的离群子空间和属性权向量,对离群子空间中的属性赋以较高的权值,进一步提出子空间加权距离等概念.采用基于密度离群点检测的思想,分析计算数据对象的子空间离群影响因子,判断是否为离群点.算法能够有效地适应于高维数据离群点检测,理论分析和实验结果表明算法是有效可行的. 相似文献