共查询到20条相似文献,搜索用时 58 毫秒
1.
2.
3.
许多应用程序会产生大量的流数据,如网络流、web点击流、视频流、事件流和语义概念流。数据流挖掘已成为热点问题,其目标是从连续不断的流数据中提取隐藏的知识/模式。聚类作为数据流挖掘领域的一个重要问题,在近期被广泛研究。不同于传统的静态数据聚类问题,数据流聚类面临有限内存、一遍扫描、实时响应和概念漂移等许多约束。本文对数据流挖掘中的各种聚类算法进行了总结。首先介绍了数据流挖掘的约束;随后给出了数据流聚类的一般模型,并描述了其与传统数据聚类之间的关联;最后提出数据流聚类领域中进一步的研究热点和研究方向。 相似文献
4.
5.
6.
数据流具有数据量无限且流速快等特点,使得传统的聚类算法不能直接应用于数据流聚类问题。针对该问题,提出了一种基于概率密度的数据流聚类算法。此方法不需要存储全部的历史数据,只需要存储新到达的数据并对其应用EM算法,利用高斯混合模型增量式地更新概率密度函数。实验表明,该算法对于解决数据流聚类问题非常有效。 相似文献
7.
随着传感器数据、互联网数据、金融数据(股票价格等)、在线拍卖以及事务日志(网站访问日志、电话记录日志)等的不断产生,数据流成为了主要的数据形式。流挖掘是数据库领域的研究热点,有很大的应用前景。本文首先简单介绍了数据流与聚类分析的概念,阐述了数据流中的聚类分析及其要求,详细说明了主要传统聚类方法的演变及各自代表性流数据聚类算法,并对其进行总结。在本文的最后,对流数据挖掘的前景做出展望。 相似文献
8.
为了防止敏感信息的泄漏,保护用户隐私,常采用概化和抑制等技术在共享数据前对其准标识符进行匿名化。与静态数据集不同,数据流具有潜在无限、高度动态等特性,使得数据流匿名需要解决更加复杂的问题,不能直接应用静态数据集的匿名方法。在分析现有数据流匿名方法的基础上,提出一种采用聚类思想进行数据流匿名的方法,通过单遍扫描数据识别和重用满足匿名条件的簇,以实现数据流的快速匿名。真实数据集上的实验结果表明,该方法在满足匿名要求的同时能够降低概化和抑制处理带来的信息损失,并且具有较低的时间和空间复杂度。 相似文献
9.
针对分布式数据流中数据有交叠、不完整的情况和聚类需要较低通信代价的要求,提出了密度和模型聚类思想相结合的分布式数据流聚类算法DAM-Distream。该算法利用混合高斯模型描述数据流的分布概况,可以有效压缩数据量并能较好的反映分布数据流间的交叠性。由于获得模型参数的EM算法对初值敏感,应用Hoeffding界理论和基于密度的算法对数据流进行初聚类,得到比较准确的初始参数,最后采用合并近似模型策略获得全局模型。仿真实验结果表明,DAM-Distream能有效克服EM算法的缺点,获得的模型参数性能更优,在降低系统的通信代价的同时能提高分布式环境下数据流的聚类质量。 相似文献
10.
基于概率数据流的有效聚类算法 总被引:6,自引:0,他引:6
提出一种在概率数据流上进行聚类的有效方法P-Stream.P-Stream针对数据流上的概率元组提出强簇、过渡簇和弱簇的概念,设计一种有效的在线候选簇选择策略,为每个不断到达的数据元组合理地找到可能归属的簇,并在每个检查点存储微簇快照,以便离线进一步高层聚类和演化分析.最后设计一个“积极”的二层聚类模型来判断现有的第1层聚类模型是否还适应数据流中最近到达的概率元组.实验采用KDD-CUP’98和KDD-CUP’99真实数据集以及变换高斯分布的人工数据集构造概率数据流.实验结果表明,P-Stream具有良好的聚类质量、较快的处理速度,能够有效地适应数据演化情况. 相似文献
11.
12.
通过研究基于口令的身份认证系统,设计了基于手机短信平台的一次一用动态口令系统方案.系统由控制中心、用户数据库、口令生成模块、短信模块和应用服务模块等5个部分构成.论述了方案的组成原理、工作流程,分析了系统的安全性.分析表明,方案具有安全性高、适用面广、用户使用方便和实现成本低的特点. 相似文献
13.
讨论了在多个不同的应用之间利用MSMQ(微软消息队列)技术实现相互通信的一种异步传输模式。将MSMQ作为中间件应用于SP(信息服务提供商)的短信业务处理平台,克服了以后台数据库作为中间件、以邮件服务器作为中间件、以Java Servlet作为中间件的不足,提高了系统稳定性和短信息的处理速度。 相似文献
14.
选择一组具有良好区分度的方向构建了CMAS坐标系,又根据初始簇的分布特性,构造出各个坐标轴的重新标度函数以提高聚类决策的有效性。其算法CMAS以迭代的方式收敛得到了最终解。CMAS算法的时间复杂度与K-Means保持在同一量级上。实验结果表明,CMAS算法有较好的聚类质量。 相似文献
15.
基于手机短信服务的网上选课系统设计 总被引:1,自引:0,他引:1
为使选课系统更加灵活、便于使用,提出了基于手机短信服务的选课方式,对采用这种方式的选课系统进行了功能规划和软硬件设计.这种选课系统应可以通过Web浏览器和手机收发短信进行选课、查询,并具有监控、报表功能.硬件设计着重介绍了利用单片机、M22手机模块和串口扩展芯片GM8125搭建的嵌入式短消息处理器.软件设计着重介绍了基于AT指令和C51语言的手机模块控制程序.这种选课方式作为网上选课方式的补充,受到的限制更少,因而具有较好的应有前景. 相似文献
16.
17.
基于消息队列的多进程数据处理系统 总被引:1,自引:0,他引:1
针对当前数据库中海量数据的处理问题,提出了多进程的处理方式,设计并实现了一个基于消息队列的多进程数据处理系统.介绍了该系统的原理,给出了系统的总体构架,并在Unix操作系统下实现了系统功能.该系统将消息队列作为进程间通信的手段,同时提供了对各进程状态进行监控的用户界面.采用的建造者设计模式在功能上具有较好的扩展性.通过实验结果表明,该系统相比串行的处理模式大幅减少了系统运行时间,为数据库中数据的处理提供了可行的解决途径. 相似文献
18.
19.
随着北斗短报文在航空飞行器跟踪监视的应用中,通信成功率直接决定了飞行器的实时跟踪监视效果;由于飞行器在飞行过程中可能会遇到各种复杂电磁信号干扰,北斗短报文通信成功率会随着电磁环境的变化而变化;为了提高通信成功率,利用北斗短报文接收和兼收两种通道进行了数据接收效果对比,并比较了两者之间的内容差异;基于信息融合理论的Dasarathy模型中的融合概念,使用北斗短报文的数据接收和数据兼收两种数据,提出了基于数据和特征组合的数据处理融合算法;该算法针对短报文数据特征进行融合,有效提高了北斗短报文的通信成功率,试验效果显著。 相似文献