首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 421 毫秒
1.
当前,信息化正面临着一个全新的阶段,即以数据的深度挖掘和整合应用为核心的智慧化阶段,智慧校园已成为当前高校信息化建设的重要内容。分析高校信息化建设现状和常用数据挖掘模型的原理及应用,并重点根据FP-growth算法、K-means聚类、真实爛、分类和回归等模型对智慧校园学生综合测评系统的数据挖掘进行综述,旨在为数据挖掘技术与智慧校园的深度融合提供方案。  相似文献   

2.
针对近年来学生异常行为增多问题,以一卡通为基础对校园大数据进行了挖掘与并对挖掘结果进行可视化展示。采用ARIMA时间序列预测模型对校园热点区域人流量分布进行预测,通过基于最小方差和余弦相似度的K-means改进聚类算法归纳了校园消费分布特征,对特征进行聚类,并对每类人群的特点进行了总结分析。实验结果表明,ARIMA时间序列预测模型的预测结果与真实结果的标准误差为23.46,预测结果较为理想;而改进的K-means聚类算法则通过最小方差提高初始质心的代表性,最终模型聚类结果与预期结果基本一致。通过预测和聚类结果,校园管理者可以了解学生群体特征,对学生个性特征、行为规律进行深入分析,预测学生行为,防微杜渐。  相似文献   

3.
校园一卡通系统通过对各种信息、资源的有效集成、整合和优化,能够实现学校对信息的有效配置和充分利用。采用数据挖掘技术针对学生校园消费、学习活动的管理分析方面进行深入研究,首先,通过数据预处理技术提取相关特征。然后,采用K-means聚类算法针对学生消费行为进行消费习惯聚类分析,并采用决策树算法评估聚类结果;再采用Apriori关联规则算法针对学生学习行为进行学习行为关联度分析,所得结果用于高校学生工作人员分门别类的进行学生管理。  相似文献   

4.
随着信息化技术的快速发展与广泛应用,数据挖掘在教育大数据中得到越来越多的重视。目前尚无利用一卡通数据对学生活动规律性进行量化评价的研究。本文以某高校13575名本科生为研究对象,利用其一学年的790万条校园一卡通消费记录,定义了活动熵,提出衡量学生活动规律性的时空加权活动熵算法,计算并量化每个学生的活动规律值。基于活动熵对学生进行聚类,并结合部分学生的成绩数据、图书借阅数据以及消费特征,运用Apriori关联算法分析学生群体和个体行为,挖掘出隐含的关联规则。分析结果与心理学科的研究结果有较高的一致性,对于多元评价学生及智慧校园管理具有科学的指导作用。  相似文献   

5.
提出一种新的基于聚类挖掘的入侵检测方法。通过将入侵检测方法中的协议分析技术应用于数据清洗中,使得聚类数据挖掘理论与入侵检测实践更加贴近。此外,它还对聚类数据挖掘中的一些经典算法进行了扩展,以增强入侵检测的决策分析的能力。  相似文献   

6.
项响琴  汪彩梅 《微机发展》2010,(1):124-127,131
离群数据挖掘是数据挖掘领域的一个研究分支,而聚类算法分析则是进行离群数据挖掘的重要研究方法之一。文中首先分析研究离群数据挖掘方法,对多个离群数据挖掘算法进行分析比较,讨论各自的优点和不足,同时针对高维空间数据的特点,分析挖掘高维空间数据中的离群点方法。其次对聚类分析算法进行讨论,分析一种基于网格和基于密度的聚类方法——聚类高维空间算法(CLIQUE算法),运用它可以更好地挖掘高维空间中的离群数据。提出了CLIQUE算法的有待改进的思想,为以后的研究指明方向。  相似文献   

7.
基于聚类高维空间算法的离群数据挖掘技术研究   总被引:3,自引:1,他引:2  
离群数据挖掘是数据挖掘领域的一个研究分支,而聚类算法分析则是进行离群数据挖掘的重要研究方法之一。文中首先分析研究离群数据挖掘方法,对多个离群数据挖掘算法进行分析比较,讨论各自的优点和不足,同时针对高维空间数据的特点,分析挖掘高维空间数据中的离群点方法。其次对聚类分析算法进行讨论,分析一种基于网格和基于密度的聚类方法——聚类高维空间算法(CLIQUE算法),运用它可以更好地挖掘高维空间中的离群数据。提出了CLIQUE算法的有待改进的思想,为以后的研究指明方向。  相似文献   

8.
论文按照Oracle数据挖掘流程,利用数据挖掘工具Oracle Data Miner ,采用Oracle数据挖掘专有的正交分割聚类算法,介绍了如何将O racle数据挖掘技术应用于为了促进能源的节能降耗而建设的城市能源计量数据平台,以达到对服务平台采集的能耗数据的充分利用。最终确定将该技术应用于福建某公司的煤耗数据研究,通过对正交分割聚类算法应用所取得的数据挖掘结果进行分析和知识说明,为煤炭行业的节能降耗提供科学决策依据。  相似文献   

9.
数据挖掘中聚类方法比较研究   总被引:4,自引:0,他引:4  
王鑫  王洪国  王珺  王金枝 《微机发展》2006,16(10):20-22
数据挖掘是近年来信息产业界非常热门的研究方向,聚类分析是数据挖掘中的核心技术。聚类算法已被广泛深入地研究,其间产生了许多不同的适用于数据挖掘的聚类算法,但这些算法仅适用于特定的问题及用户。为了更好地使用这些算法,文中对数据挖掘领域的聚类分析方法及代表算法进行了分析,提出了数据挖掘对聚类的典型要求,并基于这些要求对数据挖掘中常用的聚类算法作了比较,以便于人们更容易、更快速地选择一种适用于具体问题的聚类算法。  相似文献   

10.
数据挖掘中聚类方法比较研究   总被引:5,自引:1,他引:5  
数据挖掘是近年来信息产业界非常热门的研究方向,聚类分析是数据挖掘中的核心技术。聚类算法已被广泛深入地研究,其间产生了许多不同的适用于数据挖掘的聚类算法,但这些算法仅适用于特定的问题及用户。为了更好地使用这些算法,文中对数据挖掘领域的聚类分析方法及代表算法进行了分析,提出了数据挖掘对聚类的典型要求,并基于这些要求对数据挖掘中常用的聚类算法作了比较,以便于人们更容易、更快速地选择一种适用于具体问题的聚类算法。  相似文献   

11.
随着信息技术的不断发展,数据挖掘在我们的工作和生活中的应用也越来越广泛,目前聚类算法在数据挖掘中则是一个热点研究领域。本文深入研究了现阶段比较成熟的几种聚类算法,总结了这些算法的优缺点以及适用范围,提出用来评价聚类算法性能优劣的指标,也是今后聚类算法研究的出发点。  相似文献   

12.
该文介绍了数据挖掘中两种重要的算法:1)发现数据分布和隐含模式的聚类算法;2)应用最为广泛的挖掘方法之一关联规则挖掘算法,并就它们在应用型院校本科教学评估中的应用进行了研究。  相似文献   

13.
从多角度分析现有聚类算法   总被引:51,自引:3,他引:51  
钱卫宁  周傲英 《软件学报》2002,13(8):1382-1394
聚类是数据挖掘中研究的重要问题之一.聚类分析就是把数据集分成簇,以使得簇内数据尽量相似,簇间数据尽量不同.不同的聚类方法采用不同的相似测度和技术.从以下3个角度分析现有流行聚类算法: (1)聚类尺度; (2)算法框架; (3)簇的表示.在此基础上,分析了一些综合或概括了一些其他方法的算法.由于分析从3个角度进行,所提出的方法能够涵盖,并区分绝大多数现有聚类算法.所做的工作是自调节聚类方法以及聚类基准测试研究的基础.  相似文献   

14.
校园卡系统是高校信息化建设的重要组成部分,使用校园卡可以在校内任意商户进行消费,通过对学生消费数据的分析研究可以得出学生的真实消费水平.通过对学生校园卡消费数据的分析,根据主成分分析确定学生消费中的决定性指标,并基于K-means聚类算法将学生消费水平分为四类,通过判别分析建立学生消费水平判别模型,可以判别出学生的消费水平情况,对学校决策及贫困生资助等工作提供了数据支持和决策辅助.  相似文献   

15.
数据挖掘常用聚类算法研究   总被引:2,自引:0,他引:2  
信息社会的发展,使数据量以前所未有的速度在增长,因此从海量数据中获取有用的知识和信息就变得越来越重要。数据挖掘是一种综合多领域知识而形成的数据分析技术,能够从大量数据中获取有价值的知识并为决策提供支持。聚类分析算法是数据挖掘中的一个核心内容,也是目前研究的一个热点。该文首先讲述了基于划分的聚类算法、基于分层的聚类算法、基于密度的聚类算法和基于网格的聚类算法等常用的聚类分析算法,并分析了其特点;然后通过举例详细描述了最近邻聚类算法的操作过程。聚类算法的总结,对聚类的研究和发展具有积极意义。  相似文献   

16.
迄今为止,在数据挖掘领域,人们已经实现了多种聚类算法,其中使用最广泛的当属K-means聚类算法.然而,在数据挖掘中,K-means算法面临的一个主要问题就是初始中心点选择问题.本文提出了一种结合关系矩阵和度中心性(Degree Centrality)的分析方法,从而确定K-means算法初始的k个中心点.与传统方法相比,本文算法可得到更加优质的聚类结果.实验结果表明该算法的有效性和可行性.  相似文献   

17.
聚类是数据挖掘的主要问题之一,聚类算法能够在没有任何数据先验知识的情况下对数据进行分群,从而找到数据中的有价值的信息,近年来数据挖掘在电信领域的应用越来越广泛,但是由于数据量、数据类型、计算复杂度等原因,聚类算法应用的却不多.提出一种新的适合于分布式计算的最小生成树算法,结合适合的相似度度量,设计了一种用于解决海量数据...  相似文献   

18.
聚类分析是数据挖掘中应用最多的一种技术,它在许多领域都有重要应用。模糊h-prototypes算法是当前聚类分析中最有效算法之一,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于量子遗传算法和FKP算法的混合聚类算法,首先利用量子遗传算法确定FKP的初始聚类中心,再将量子遗传算法聚类结果作为后续FKP算法的初始值。实验结果显示,算法具有良好的收敛性和稳定性,聚类效果优于单一使用FKP算法和相关改进的算法。  相似文献   

19.
一种混合属性数据流聚类算法   总被引:5,自引:0,他引:5  
杨春宇  周杰 《计算机学报》2007,30(8):1364-1371
数据流聚类是数据流挖掘中的重要问题.现实世界中的数据流往往同时具有连续属性和标称属性,但现有算法局限于仅处理其中一种属性,而对另一种采取简单舍弃的办法.目前还没有能在算法层次上进行混合属性数据流聚类的算法.文中提出了一种针对混合属性数据流的聚类算法;建立了数据流到达的泊松过程模型;用频度直方图对离散属性进行了描述;给出了混合属性条件下微聚类生成、更新、合并和删除算法.在公共数据集上的实验表明,文中提出的算法具有鲁棒的性能.  相似文献   

20.
BIRCH混合属性数据聚类方法   总被引:2,自引:1,他引:1       下载免费PDF全文
数据聚类是数据挖掘中的重要研究内容。现实世界中的数据往往同时具有连续属性和离散属性,但现有大多数算法局限于仅处理其中一种属性,而对另一种采取简单舍弃的办法丢失聚类信息和降低聚类质量。一些能处理混合属性的算法又往往处理的属性过多,导致计算量的大增。提出了一种基于BIRCH算法的混合属性数据的聚类算法;在UCI数据集上的实验表明,文中提出的算法具有较好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号