首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
文章研究和分析了数据流上几种典型的聚类分析算法,分析了这几种算法的优点和不足。研究了现在数据流聚类分析的现状,指出未来发展方向。  相似文献   

3.
相对于传统的频繁模式挖掘,加权频繁模式挖掘能发现更有价值的模式信息.针对数据流中的数据只能一次扫描,本文提出了一种基于滑动窗口模型的数据流加权频繁模式挖掘方法WFP-SW(Sliding Window based Weighted Frequent Pattern minig),算法采用WE-tree(Weighted Enumeration Tree)存储模式和事务信息,利用虚权支持度维持模式的向下闭合特性,同时获取临界频繁模式.对临界频繁模式进一步计算其加权支持度获取加权频繁模式,使得计算更新模式更加便捷.实验结果显示算法具有较高的挖掘效率并且所需的内存更少.  相似文献   

4.
马孟 《电子设计工程》2024,(6):91-94+99
基于工业物联网敏感数据流高维、多变导致挖掘结果不理想的问题,设计面向工业物联网的敏感数据流动态挖掘系统。通过计算敏感数据间距离,使用数据流挖掘引擎,设计数据流动态管理机构,构建敏感数据流特征响应函数,聚类分析敏感数据流动态挖掘特征。通过CAN-tree子树剪枝操作,实现敏感数据流的动态挖掘。实验结果表明,该系统聚类程度与理想效果基本一致,且挖掘数据量与实际数据存在最大为4 bit的误差,说明使用该系统挖掘效果较好。  相似文献   

5.
基于Web的文本挖掘研究   总被引:4,自引:6,他引:4  
基于Web的文本挖掘是数据挖掘的重要组成部分,文章重点对文本特征提取、文本分类、文本聚类等Web文本挖掘关键实现技术做了介绍,最后讨论了Web文本挖掘的价值及其对Web发展的重要性。  相似文献   

6.
数据流上基于K-median聚类的算法研究   总被引:1,自引:0,他引:1  
文章研究和分析了数据流上的K-median聚类算法技术,包括:(1)流模型和K-median问题定义;(2)基于流的K-median聚类基本决策和内在机理;(3)理论上有性能保证的流算法。对于每一特征,这种技术能在没有实际保留任何数据流对象的情形下有效地确定聚类点。它通过一个聚类块的一分为二或相邻聚类块的合二为一来动态地生成聚类点,从而实现上述目标。作为结果,这种技术所确定的聚类点将比其他常规方法更准确。在数据流环境中,这种技术能够在产生高质量聚类结果的同时非常有效地执行。  相似文献   

7.
针对数据流上的聚类任务受到时间、空间限制等问题,该文提出一种基于权值衰减的数据流模糊微簇聚类算法(WDSMC)。该算法使用改进的带权值的模糊C均值算法进行处理,并采用微簇结构和权值时间衰减结构提高聚类质量。实验表明,相对于现有的数据流加权模糊C均值聚类(SWFCM)算法和StreamKM++算法而言,WDSMC算法具有更好的聚类精度。  相似文献   

8.
9.
基于电力设备数据流的复杂特性,首先以双层滑动窗口进行数据的预处理,其次以聚类分析作为数据流挖掘技术,进行电力设备异常数据的分类识别,最后以M电力企业的变压器故障数据作为测试集,将双层窗口的数据流分类风险识别算法、Euclidean cluster算法和LS-SVM算法进行性能对比.从算法计算时间、准确率和有效数据误删除...  相似文献   

10.
分布式数据流上的连续异常检测   总被引:1,自引:1,他引:0  
近年来,数据流异常检测在决策支持和监测等领域有着广泛的应用前景,并成为数据管理与挖掘的研究热点.针对该问题提出了相应的异常定义及检测算法,理论分析表明:与现有异常检测算法相比较,提出的算法具有良好的性能和效率,更适合于数据流应用.  相似文献   

11.
一种流数据立方体分析挖掘框架   总被引:1,自引:0,他引:1  
流数据是目前一种重要的数据展现形式,对流数据进行OLAM(联机分析挖掘)操作可为分析人员提供多层次的数据视图。但OLAM要求在不同粒度中实现对数据的聚合操作,而流式数据内含时态特性和持续到达特性,使得数据无法被多次重复操作。使用传统OLAP(联机分析处理)方法无法生成部分物化视图且流数据规模宏大,受限于存储空间大小而无法保存全部数据单元信息。针对上述问题,提出了一种基于概要技术的流数据OLAM框架——sketch cube(概要立方体),该框架把任意维度组合映射成唯一自然数,根据上下限单调原则对维度组合裁剪,在类线性空间中保存有效数据单元信息,并构建时间序列索引提高检索效率。通过理论分析给出使用sketch cube的前提条件,同时通过真实海量流数据实验分析表明,sketch sube在有效性、存储空间效率和正确率上可以满足实时挖掘的需求。  相似文献   

12.
流数据挖掘(Stream Data Mining)在监测和控制领域已经得到广泛应用,其产生的大量原始数据,采用常规的数值分析方法,由于其数据量大,处理能力的问题,不能很好地适应。通过流数据分析方法可以更有效地应对。本文通过电机监测的实际工程案例,将监测系统中的数据分析方法提升到完整的数值分析与流数据分析方法相结合的方式,提供更为完备的传感数据流的数据分析方法。  相似文献   

13.
Scheduling procedures implemented in wireless networks consists of varied workflows such as resource allocation, channel gain improvement, and reduction in packet arrival delay. Among these techniques, Long term evolution (LTE) scheduling is most preferable due to its high speed communication and low bandwidth consumption. LTE allocates resources to the workflow based on time and frequency domains. Normally, the information gathered prior to scheduling increases the processing time since each attributes of the users have to be verified. In order to solve this issue, parallel processing via data mining is analyzed in recent research studies. The label that is assigned to the user attributes contributes primarily on scheduling time slots effectively. The label assignment and parallel processing via data mining reduces the delay and increases the throughput respectively. Additionally, the matched data extraction from the library and the prediction of available channels with fewer dimensions posed major challenges in the LTE scheduling. This paper surveys about various LTE scheduling algorithms, dimensionality reduction techniques, optimal feature selection techniques, multi-level classification techniques, and data mining combined with LTE techniques. A brief survey illustrates the impact of each technique on 3G/4G networks, channel availability prediction, scheduling of time slots in detail. A brief comparison of the techniques involved in the respective LTE processes via tabular form reveals that the verification of channel and user availability are the primary functions of the LTE scheduling. The survey of this paper identifies the limitations such as computational complexity and poor scheduling performance in the existing systems and encourages researchers to develop novel algorithms for LTE scheduling.  相似文献   

14.
Web数据挖掘研究   总被引:3,自引:0,他引:3  
Web数据挖掘是数据挖掘技术与Web的结合。介绍了Web数据挖掘的概念、Web数据挖掘的流程、Web数据挖掘的分类以及3类Web数据挖掘的应用问题。  相似文献   

15.
并行数据挖掘算法综述   总被引:2,自引:0,他引:2  
数据挖掘在工业和商业领域中发挥着越来越重要的作用.随着数据量的增加,挖掘算法处理海量数据的能力问题日益突出.研究并行算法,是解决这一问题的有效途径.该文对常用的数据挖掘算法C4.5,SLIQ,SPRINT,关联规则,K-平均值,K-最近邻,贝叶斯网络,人工神经网络,遗传算法及并行性进行了研究探讨,为数据挖掘研究者提供借鉴.  相似文献   

16.
为保证网络上传输的多媒体数据的安全,对多媒体数据进行加密是常用的手段.文章介绍了直接加密的方法、选择性加密方法、将加密过程和压缩编码过程相结合的方法这三类对多媒体数据进行加密方法,对其优缺点进行了比较,讨论了其各自的适用环境.对基于混沌序列的多媒体加密技术的原理、特点、常用方法及存在的问题进行了阐述.最后讨论了目前多媒体数据加密算法有待解决的问题,并探讨了其可能的发展方向.  相似文献   

17.
朱参世  李响 《现代电子技术》2010,33(10):63-65,68
在网络的许多应用中数据是以流的形式存在的,例如网络流、传感器数据,以及网页点击流等,分析和挖掘这类数据,可以发现某中有价值的信息。在此,针对数据流挖掘算法中出现的一些问题(如概念漂移问题),提出了一种自适应模糊决策树的优化算法。该算法对于解决处理数据流概念中的漂移问题有较好的效果。  相似文献   

18.
基于虚拟数据仓库的数据挖掘技术研究   总被引:1,自引:1,他引:1  
文章介绍了虚拟数据仓库技术,分析了虚拟数据仓库系统的一些主要特点,提出了一个集数据仓库、知识库、数据挖掘系统、MAS于一体的框架结构,并对这种框架结构的特点及实现技术进行了分析与探讨。  相似文献   

19.
数据挖掘分类技术研究与分析   总被引:1,自引:0,他引:1  
分类技术是数据挖掘中的核心和基础技术,在此就数据挖掘分类技术的主要算法进行了对比分析研究。对目前研究比较多的基于决策树、贝叶斯和人工神经网络的分类方法做了详细的讨论,对其他新提出的几种算法做了简要分析,论述了每种分类算法的优缺点,并给出了相应的应用领域,最后对分类技术的研究重点和发展趋势做了展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号