首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
《现代电子技术》2020,(1):93-98
针对教育领域特定应用场景,利用数据挖掘技术处理教育数据是目前热点研究问题之一。课程成绩预测指对一门课程学生的期末成绩进行预测,其关键问题是通过选取合适的学生特征和确定最优的预测算法来构建预测准确率高的模型。针对大学基础课的特点,从主客观两方面选择特征,对比了4个效果最优的课程成绩预测分类算法,以准确率较高的算法构成加权投票集成算法,发现加权投票集成算法的预测准确率和AP值最高,为利用数据挖掘技术实现课程成绩预测提供了一种有效的方法。  相似文献   

2.
本文研究可视化技术在分类算法中的应用.通过将数据进行预处理成为符合要求的数据后,然后调用数据挖掘中分类算法选择不同的可视化方法展示不同的可视化模型结果.通过采用不同的可视化技术,可以从不同角度分析数据挖掘的结果,对其有深刻直观的理解,从而打破传统挖掘算法的黑盒子模式,对数据挖掘的应用度显著提高.  相似文献   

3.
数据挖掘算法是神经网络算法中的有效算法,数据挖掘算法主要包括快速聚类、决策树、关联规则、Kohonen神经网络等算法,其研究的内容是算法模型、参数设置及相应的数据处理方法过程。通过利用数据挖掘算法,对电路实验数据的统计分析挖掘技术进行研究。目前,在电路数据分析方面数据挖掘算法的应用还是一种尝试,希望通过这种算法应用的研究,发现在电路实验数据中的有内部规律和价值的信息,从而为电路实验提供有益的帮助和指导。  相似文献   

4.
文本聚类是数据挖掘的核心技术,能帮助用户有效地导航、总结和组织文本信息。本文通过对文本聚类的应用研究,探讨了几种聚类算法的原理与特点,提出并分析了K-means算法与层次凝聚算法的具体实现步骤。  相似文献   

5.
文中研究基于模糊层次聚类的大学生就业数据分类存储系统,在总体设计上,通过模糊层次聚类技术构建系统框架,设计4个功能模块对应就业信息分类存储模式,满足大学生就业信息流转形式;以一一对应关系设置大学生就业信息数据分类存储结构,基于所属关系关联大学生的基本信息。在详细设计中,按照数据存储表和字典表两个类型构建大学生就业信息数据库;选择模糊层次聚类算法计算数据隶属值,设定信息数据聚类流程,实现大学生就业信息数据的分类存储,完成系统设计。实验结果表明:以多个专业的大学生就业人数作为数据样本,新系统即可实现不同专业类型大学生就业数据的精准存储,且分类存储时间能够保证在10 s之内,该系统具有很好的实际应用价值。  相似文献   

6.
《现代电子技术》2020,(3):177-182
在大数据的数据挖掘模型中,普遍采用模糊聚类算法进行数据分析。常用的模糊C均值聚类算法即FCM聚类算法,具有较多明显缺点,如抗噪性偏低、收敛速度慢、聚类数目无法自动确定等。常用的增量式模糊聚类方法通常在原有的以一个中心点为集群代表的基础上,改为选取多中心点进行增量式聚类算法的分析。但是,通过这样的算法进行数据分析也存在一定的问题,主要表现在其中心点选择是固定的,灵活性很差。基于以上原因,文中将对原有基础算法做出改进,主要对大数据中数据挖掘模型的增量型模糊聚类算法做出分析,经实践验证,改进后算法切实可行,普适性较强。  相似文献   

7.
本文将介绍K-means算法的一般执行流程、云环境下K-means算法的实现、以及云环境下K-means算法的改进方法,还将从云计算环境下的数据挖掘算法、数据存储和管理技术、数据预处理技术、分类、聚类、关联规则挖掘和时序数据挖掘算法等方面进行探讨。  相似文献   

8.
《现代电子技术》2015,(22):80-83
为实现视频监控设备对雾天天气现象的自动识别,提出了基于K均值聚类算法的雾天天气现象自动识别方法。该方法通过分析雾天天气现象对视频图像采集的影响,提取图像饱和度的均值、方差为特征参数,并利用K均值聚类算法对训练图像进行分类,得到不同图像类别的聚类中心,测试阶段计算不同图像与聚类中心的相异度即可完成分类。实验结果表明,该方法简洁高效,易于实现对大规模图像数据的处理,并能实现图像分类后类别的标注,对雾天的识别率高于90%。  相似文献   

9.
为了在三维地理信息系统中实现NEMP毁伤效应的可视化,利用空间聚类技术对毁伤数据进行分析,得到毁伤数据的空间聚类检验指数;利用多分辨率建模技术的聚合-解聚方法和自适应算法,对毁伤目标空间进行剖分,得到MRRTP模型;该模型与传统的TEN模型混合,实现了NEMP毁伤效应的三维空间数据模型构建;为高效、完整地实现NEMP毁伤效应的三维表达以及空间分析提供了技术支持。  相似文献   

10.
朴素贝叶斯分类算法由于其计算高效在生活中应用广泛。本文根据集成算法的差异性特征,聚类算法聚类点的选择方式的可变性,提出了基于K-medoids聚类技术的贝叶斯集成算法,朴素贝叶斯的泛化性能得到了提升。首先,通过样本集训练出多个朴素贝叶斯基分类器模型;然后,为了增大基分类器之间的差异性,利用K-medoids算法对基分类器在验证集上的预测结果进行聚类;最后,从每个聚类簇中选择泛化性能最佳的基分类器进行集成学习,最终结果由简单投票法得出。将该算法应用于UCI数据集,并与其他类似算法进行比较可得,本文提出的基于K-medoids聚类的贝叶斯集成算法(NBKME)提高了数据集的分类准确率。  相似文献   

11.
针对电力线路线损故障的诊断与预测问题,基于大数据分析,运用数据挖掘技术,提出线损故障分析判定规则。通过对IEEE 33节点的10 kV配电网进行仿真实验,采用K均值(K-means)聚类和局部离群因子等算法,实现对电力线路线损异常诊断。实验表明,通过对疑似线损异常的3天数据进行深入分析,能够精准判别线损异常,验证了该算法在电力系统中对线损异常诊断与预测的可靠性。  相似文献   

12.
传统负荷预测算法通常仅以单一的数据源为基础进行计算,因此在面对动态随机特性较强的场景时难以准确预测。针对这一问题,提出了一种负荷分解后再聚类融合的短期用电负荷预测算法。该算法根据负荷行为按时间顺序分类及分解客户负载,并进行负荷数据的聚类融合,再基于贝叶斯时空高斯过程模型描述不同用电区域间的相关性。同时利用深度学习负荷数据中存在的时空相关性来表征电力消费行为特征,从而实现短期用电负荷的精准预测。在对公开数据集进行的预测实验结果表明,与现有方法相比,所提算法的误差较低,且预测性能显著提高。  相似文献   

13.
为了给企业快速、低成本构建客户管理系统、CRM系统、数据挖掘应用系统提供参考与借鉴,研究了常用数据挖掘算法。通过研究数据挖掘算法基本原理、适用范围及优点,得出可以使用不同的算法来执行同样的业务任务,每个算法会生成不同的结果。因此在一个数据挖掘解决方案中,可以使用一些算法来研究数据,然后使用其他算法,基于这些数据预测特定结果。  相似文献   

14.
针对当前技术辅助服务市场架构体系存在的技术弊端,提出新型的辅助服务市场架构体系,该系统包含资源库、数据层、链路层、服务平台等,实现了资源数据库的调取、分析与应用,构建出隐马尔可夫模型,实现输入异构数据的虚拟化建模和数据兼容性处理,并将处理后的数据信息通过K-means算法模型进行分类,大大提高了数据管理能力。试验表明,所构建的架构体系提高了电力市场的信息管理能力。  相似文献   

15.
基于概率主题模型的文档聚类   总被引:3,自引:0,他引:3       下载免费PDF全文
王李冬  魏宝刚  袁杰 《电子学报》2012,40(11):2346-2350
 为了实现普通文本语料库和数字图书语料库的有效聚类,分别提出基于传统LDA(Latent Dirichlet Allocation)模型和TC_LDA模型的聚类算法.TC_LDA模型在LDA模型基础上进行扩展,通过对图书文档的目录和正文信息联合进行主题建模.和传统方法不同,基于主题模型的聚类算法能将具备同一主题的文档聚为一类.实验结果表明从主题分析角度出发实现的聚类算法优于传统的聚类算法.  相似文献   

16.
为了快速在浩如烟海的网页里定位用户感兴趣的信息,提出基于Hadoop的网页文本聚类的算法,网页文本以key,value形式存储到分布式文件系统(HDFS),使用基于统计的方法进行分词操作,去噪,特征提取,构建向量空间模型,提出基于Map Reduce实现改进的k-means聚类算法。经实验验证,不同规模的数据集实现分布式计算,数据集越大,聚类效果越好。  相似文献   

17.
用于数据挖掘的聚类算法   总被引:27,自引:0,他引:27  
数据挖掘用于从超大规模数据库中提取感兴趣的信息。聚类是数据挖掘的重要工具,根据数据间的相似性将数据库分成多个类,每类中数据应尽可能相似。从机器学习的观点来看,类相当于隐藏模式,寻找类是无监督学习过程。目前已有应用于统计、模式识别、机器学习等不同领域的几十种聚类算法。该文对数据挖掘中的聚类算法进行了归纳和分类,总结了7类算法并分析了其性能特点。  相似文献   

18.
云计算从分布式存储和分布式计算两个方面为大数据处理提供了强力的支持,并逐渐成为大数据挖掘的主流平台。但是在处理云平台中的大规模数据集时典型聚类挖掘算法存在一定不足,因此,提出一种基于群智能算法的大数据K-means聚类挖掘算法。首先对云计算Hadoop框架的存储数据能力和采用的Map Reduce计算模型进行分析,然后采用群智能算法对传统数据挖掘K-means聚类算法进行改进,解决其容易陷入局部最优问题。实验结果表明,相比加权K-means聚类算法,提出的改进算法表现出更好的聚类精度和运行速度,可以适用于大规模数据的聚类挖掘。  相似文献   

19.
随着校园信息化建设的不断深入,校园内各应用系统逐渐增多,运用数据挖掘技术可以从海量的数据中提取潜在有用的信息用于分析高校学生的日常行为与成绩方面的相关性。对一卡通系统、图书馆管理系统、教务系统等多维数据进行采集,基于密度聚类算法,在初始聚类中心选择的基础上结合了距离的度量,重新定义核心点、孤立点、边界点等概念,构建一个改进的密度聚类算法进行数据挖掘分析,达到对学生学习成绩的预警,避免出现挂科、留级等严重的学业问题。  相似文献   

20.
聚类算法是数据挖掘的核心技术,根据评价聚类算法优劣的几个标准,对数据挖掘中常用聚类算法做了比较分析,根据各自特点,加以改进,并应用于武警部队数据挖掘项目中。通过运用改进型K-means算法,取得了较好的挖掘结果,为进一步信息的智能化检索、信息的过滤、分拣提供依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号