共查询到20条相似文献,搜索用时 15 毫秒
1.
《信息技术》2017,(4):129-131
数据信息交流和社交方式在互联网+时代都呈现了新的发展态势,自媒体等新的数据产生方式让大数据时代来临。海量数据在大数据时代需要新的技术手段和方法,对数据存储、处理、检索和计算进行新的设计,尤其在数据挖掘领域,面临很多新的课题和挑战。当前,很多的传统数据挖掘算法只能在数据量较小的情况下适用,在串行的小规模输入数据环境下,算法还能适应。当数据量规模增大甚至呈指数形式增长时,时间复杂度和计算量也同步增长,需要对算法进行适应大数据的改进。云计算和云平台的使用为存储和分析海量数据提供可靠的实现手段,对数据挖掘算法的改进提供了高效的解决方案。文中在Hadoop、MapReduce框架下开展并行的SLIQ算法改进方案,改进算法很好地适应了云平台环境和海量数据,提高了运行效率。 相似文献
2.
3.
基于划分的数据挖掘K-means聚类算法分析 总被引:1,自引:0,他引:1
《现代电子技术》2020,(3):14-17
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。 相似文献
4.
随着高速网络环境的发展,传统的网络入侵检测技术已经无法满足互联网安全需求。在这一背景下,本文提出了将数据挖掘中的K-means算法应用于网络入侵检测中,实现基于应用的检测,在原来基础上提高了监测的速度。实验测试表明系统能够对吉比特以太网进行有效高速的检测。 相似文献
5.
6.
7.
8.
9.
为促进数据挖掘开发和商业应用,通过将云计算技术、领域工程和数据挖掘相结合,从领域驱动设计和云计算框架出发,提出了一种面向领域的数据挖掘云平台框架,阐述了云计算环境下面向领域的数据挖掘服务的机理,并给出了面向领域的数据挖掘云平台服务开发模式,从软件开发生命周期的角度定义了面向领域的数据挖掘服务开发过程. 相似文献
10.
11.
为解决点云特征区域分割过程中的过分割和欠分割问题,提出一种多聚类混合数据分割算法。算法首先利用改进的K-means聚类将散乱点云模型划分出平坦区域与特征区域;再利用基于高斯球的Mean-shift聚类对特征区域进行细分割,接着使用区域生长对细分割后的结果进行调整,最终实现点云数据的准确分割。并用该算法与K-mans、Mean-shift算法对相同模型在相同参设下进行分割实验,其结果表明,该算法能有效、准确地根据点云特征类型实现数据分割,同时有效避免特征的过分割和欠分割现象。 相似文献
12.
13.
随着数据挖掘技术的成熟,其中关联规则在大规模数据中的应用成为了目前的热点.为了提高在大规模数据下进行数据挖掘的效率,在MapReduce中通过引入归并函数Fusion来提高执行剪枝任务的效率并进行了优化研究,提出了一种基于云理论的关联规则Apriori算法,详细论述了实现的过程以及关键技术.通过实验表明,该方法取得了良好的实验效果,克服了Apriori算法耗时多、识别率低下等问题,是实现在大规模数据进行数据挖掘的实用工具. 相似文献
14.
15.
本文首先对智慧校园数据挖掘的意义进行研究和分析,提出了基于Spark技术的智慧校园数据挖掘平台,将数据挖掘技术与Spark计算框架相结合,该平台采用HDFS作为数据存储,上层的Spark平台作为智慧校园数据挖掘算法的运行环境.针对与学生相关的数据挖掘,构建了学生分析子系统. 相似文献
16.
提出一种适用于大型数据集的分布式聚类算法。该算法以传统的K-means算法为基础进行合理的改进,使之更适用于分布式环境,并从算法的复杂度分析,将该算法与传统的集中式K-means算法及其他分布式算法进行比较。实验表明,该算法在保持了集中式K-means算法所有必要特性的同时,提高了数据处理速度。 相似文献
17.
18.
19.
20.
尚秋明 《电子技术与软件工程》2021,(4):164-165
本文为了研究K-means算法在互联网有害信息挖掘中应用价值。首先分析了K-means算法核心原理,该算法是将相似的数据分类聚集在一起。其次研究了K-means算法在舆情监管中应用,结果表明K-means算法应用到舆情监测领域比较广,但是需要解决K-means算法局部最优问题。最后分析了K-means算法在互联网有害信息监管应用,拓展了K-means算法应用领域。 相似文献