共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
本文研究可视化技术在分类算法中的应用.通过将数据进行预处理成为符合要求的数据后,然后调用数据挖掘中分类算法选择不同的可视化方法展示不同的可视化模型结果.通过采用不同的可视化技术,可以从不同角度分析数据挖掘的结果,对其有深刻直观的理解,从而打破传统挖掘算法的黑盒子模式,对数据挖掘的应用度显著提高. 相似文献
3.
数据挖掘算法是神经网络算法中的有效算法,数据挖掘算法主要包括快速聚类、决策树、关联规则、Kohonen神经网络等算法,其研究的内容是算法模型、参数设置及相应的数据处理方法过程。通过利用数据挖掘算法,对电路实验数据的统计分析挖掘技术进行研究。目前,在电路数据分析方面数据挖掘算法的应用还是一种尝试,希望通过这种算法应用的研究,发现在电路实验数据中的有内部规律和价值的信息,从而为电路实验提供有益的帮助和指导。 相似文献
4.
5.
文中研究基于模糊层次聚类的大学生就业数据分类存储系统,在总体设计上,通过模糊层次聚类技术构建系统框架,设计4个功能模块对应就业信息分类存储模式,满足大学生就业信息流转形式;以一一对应关系设置大学生就业信息数据分类存储结构,基于所属关系关联大学生的基本信息。在详细设计中,按照数据存储表和字典表两个类型构建大学生就业信息数据库;选择模糊层次聚类算法计算数据隶属值,设定信息数据聚类流程,实现大学生就业信息数据的分类存储,完成系统设计。实验结果表明:以多个专业的大学生就业人数作为数据样本,新系统即可实现不同专业类型大学生就业数据的精准存储,且分类存储时间能够保证在10 s之内,该系统具有很好的实际应用价值。 相似文献
6.
7.
石杰 《电子技术与软件工程》2023,(4):233-236
本文将介绍K-means算法的一般执行流程、云环境下K-means算法的实现、以及云环境下K-means算法的改进方法,还将从云计算环境下的数据挖掘算法、数据存储和管理技术、数据预处理技术、分类、聚类、关联规则挖掘和时序数据挖掘算法等方面进行探讨。 相似文献
8.
9.
10.
朴素贝叶斯分类算法由于其计算高效在生活中应用广泛。本文根据集成算法的差异性特征,聚类算法聚类点的选择方式的可变性,提出了基于K-medoids聚类技术的贝叶斯集成算法,朴素贝叶斯的泛化性能得到了提升。首先,通过样本集训练出多个朴素贝叶斯基分类器模型;然后,为了增大基分类器之间的差异性,利用K-medoids算法对基分类器在验证集上的预测结果进行聚类;最后,从每个聚类簇中选择泛化性能最佳的基分类器进行集成学习,最终结果由简单投票法得出。将该算法应用于UCI数据集,并与其他类似算法进行比较可得,本文提出的基于K-medoids聚类的贝叶斯集成算法(NBKME)提高了数据集的分类准确率。 相似文献
11.
针对电力线路线损故障的诊断与预测问题,基于大数据分析,运用数据挖掘技术,提出线损故障分析判定规则。通过对IEEE 33节点的10 kV配电网进行仿真实验,采用K均值(K-means)聚类和局部离群因子等算法,实现对电力线路线损异常诊断。实验表明,通过对疑似线损异常的3天数据进行深入分析,能够精准判别线损异常,验证了该算法在电力系统中对线损异常诊断与预测的可靠性。 相似文献
12.
传统负荷预测算法通常仅以单一的数据源为基础进行计算,因此在面对动态随机特性较强的场景时难以准确预测。针对这一问题,提出了一种负荷分解后再聚类融合的短期用电负荷预测算法。该算法根据负荷行为按时间顺序分类及分解客户负载,并进行负荷数据的聚类融合,再基于贝叶斯时空高斯过程模型描述不同用电区域间的相关性。同时利用深度学习负荷数据中存在的时空相关性来表征电力消费行为特征,从而实现短期用电负荷的精准预测。在对公开数据集进行的预测实验结果表明,与现有方法相比,所提算法的误差较低,且预测性能显著提高。 相似文献
13.
为了给企业快速、低成本构建客户管理系统、CRM系统、数据挖掘应用系统提供参考与借鉴,研究了常用数据挖掘算法。通过研究数据挖掘算法基本原理、适用范围及优点,得出可以使用不同的算法来执行同样的业务任务,每个算法会生成不同的结果。因此在一个数据挖掘解决方案中,可以使用一些算法来研究数据,然后使用其他算法,基于这些数据预测特定结果。 相似文献
14.
15.
16.
为了快速在浩如烟海的网页里定位用户感兴趣的信息,提出基于Hadoop的网页文本聚类的算法,网页文本以key,value形式存储到分布式文件系统(HDFS),使用基于统计的方法进行分词操作,去噪,特征提取,构建向量空间模型,提出基于Map Reduce实现改进的k-means聚类算法。经实验验证,不同规模的数据集实现分布式计算,数据集越大,聚类效果越好。 相似文献
17.
18.
19.
随着校园信息化建设的不断深入,校园内各应用系统逐渐增多,运用数据挖掘技术可以从海量的数据中提取潜在有用的信息用于分析高校学生的日常行为与成绩方面的相关性。对一卡通系统、图书馆管理系统、教务系统等多维数据进行采集,基于密度聚类算法,在初始聚类中心选择的基础上结合了距离的度量,重新定义核心点、孤立点、边界点等概念,构建一个改进的密度聚类算法进行数据挖掘分析,达到对学生学习成绩的预警,避免出现挂科、留级等严重的学业问题。 相似文献