首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 8 毫秒
1.
在信息技术飞速发展的今天,信息量与数据量增长速度惊人。大数据(BIGDATA),数据挖掘(DATA MINING)等概念被越来越多人重视。如何处理这些数据,从数据当中提取有价值的信息是一门复杂的工程。数据挖掘就是从数据库中提取隐含的、未知的和潜在的有用信息的过程,是数据库及相关领域研究中的一个极其重要而又具有广阔应用前景的新领域[1]。  相似文献   

2.
C4.5决策树改进算法研究   总被引:2,自引:0,他引:2  
决策树是数据挖掘分类算法中非常重要的一个算法分支。文章介绍了决策树算法中应用最广泛的典型算法-ID3和C4.5算法,并基于四个通用的数据集,针对这两个算法进行定量分析对比,研究两个算法的性能优劣。文章对C4.5算法中的连续属性离散化方法提出一些优化改进,并通过实际数据实验证实了优化的可行性。  相似文献   

3.
有效及时的处理客户信息,并挖掘出客户的消费倾向,实现精确营销成为电子商务时代企业的关注。本文主要阐述数据挖掘在电子商务环境下客户关系管理中的具体应用及应用步骤,用实例说明了电子商务客户关系管理中数据挖掘的应用价值。  相似文献   

4.
随着电力事业的发展和智能电表的普及,电力体系趋于完善,方便了电力行业的用电管理工作,然而窃电行为屡禁不止,窃电技术也日新月异.为了能够准确识别出存在的窃电用户,引入数据挖掘技术,使用C4.5算法构建用户窃电识别模型,能够更加准确有效地对用户的窃电行为进行分析.  相似文献   

5.
针对工程机械的特点,提出了将数据挖掘技术应用于挖掘机故障诊断中,利用粗糙集具有较强的处理不确定和不完备信息的能力,对决策表的条件属性进行约简处理;再利用C4.5决策树算法的高效性对约简后的决策表进行诊断规则提取;将产生的规则运用于挖掘机故障诊断中以实现快速故障诊断。最后,以实例介绍了利用该模型进行故障诊断的完整过程,可以看出该方案提高了挖掘机故障诊断的效率。  相似文献   

6.
蓝机满 《电子科技》2019,32(8):70-74
为了高效、快速地解决呈指数增长的数据处理问题,提高数据储存、运算能力,文中提出了基于云计算的数据挖掘系统的设计。该系统首先分析了主流云计算平台Spark的组件构成和运行机制,深入研究其计算架构的编程原理。同时利用Spark进行了C4.5算法和K-medoids聚类算法的并行化设计,有效提高算法的运行速度、收敛速度和结果的稳定性。测试表明,在进行海量数据的分析处理时,文中提出的云计算平台在分类误差内,可有效提高整体系统的运算速度,分类效率也大幅提高。  相似文献   

7.
在数据挖掘的过程中,使用到很多分类算法,可见分类算法在数据挖掘中占有非常重要的地位。数据分类算法有很多种,各有不同的优缺点,因此,通过对不同算法特性的研究,有助于后期对算法进行相应的改进,确保新的分类算法能够具备更好的实用性能。数据分类算法的性能优良,不仅可以提高数据挖掘的功能性和实用性,还可以确保使用者对算法具备更多的选择性,基于此,对数据挖掘中不同的数据分类算法进行了研究和分析。  相似文献   

8.
本文将数据挖掘技术应用于计算机文化基础等级考试中,通过使用ID3分类方法,分析最近几个学期计算机文化基础成绩,发现影响学生通过考试的因素在于学生自身学习意愿是否按时交作业是否做练习题,与任课教师的教学方法、其他科成绩、有无计算机基础等因素关系很大,为计算机文化基础教学提供有效的理论依据。  相似文献   

9.
数据挖掘分类技术研究与分析   总被引:1,自引:0,他引:1  
分类技术是数据挖掘中的核心和基础技术,在此就数据挖掘分类技术的主要算法进行了对比分析研究。对目前研究比较多的基于决策树、贝叶斯和人工神经网络的分类方法做了详细的讨论,对其他新提出的几种算法做了简要分析,论述了每种分类算法的优缺点,并给出了相应的应用领域,最后对分类技术的研究重点和发展趋势做了展望。  相似文献   

10.
当前已经进入大数据时代,数据挖掘是在大量的数据中提取有用的有价值的知识。本文结合高校学生心理测试产生的数据,采用ID3算法构造决策树分析预测大学生心理健康状况,为学校的心理辅导工作提供参考依据。  相似文献   

11.
介绍了利用数据挖掘技术处理移动通信业中的客户流失问题,包括建立客户流失预测模型的过程,对模型的评价及与营销活动的关系,其中针对传统ID3算法的不足,提出了一种加权熵的思想,对ID3算法进行了改进,并运用该改进的算法实现了整个建模过程。  相似文献   

12.
《现代电子技术》2017,(3):54-57
针对传统图像方法的分类精度难题,提出基于数据挖掘的图像分类算法。首先构建多媒体数据库中的图像检索信道模型,并进行向量量化编码,然后采用Harris角点检测算法提取图像特征点,并采用模糊C均值聚类算法实现图像分类。实验结果表明,该算法可以对图像内容信息进行准确的表达,提高了图像分类的精度,具有较强的鲁棒性。  相似文献   

13.
应用数据挖掘ID3算法对《大学计算机基础》课程成绩构建决策树,并进行了深度分析和研究,找出影响学生成绩的主导因素,更好地开展教育教学工作。  相似文献   

14.
提出了一种基于SVM特征选择和C4.5数据挖掘算法的高效入侵检测模型.通过使用该模型对经过特征提取后的攻击数据的训练学习,可以有效地识别各种入侵,并提高检测速度.在经典的KDD 1999入侵检测数据集上的测试说明:该数据挖掘模型能够高效地对攻击模式进行训练学习,能够采用选择的特征正确有效地检测网络攻击.  相似文献   

15.
本文运用了随机森林、SUV、Logistic回归、决策树、朴素贝叶斯、KNN、BP神经网络等机器学习算法对交通路况、环境情况进行分类预测,并从中对比得出分类预测的最优算法。综合考虑得到的景区客流量、交通路况以及环境情况等预测数据,提出对某一景点是否推荐假期出行的建议。  相似文献   

16.
概述了数据挖掘及其过程,可拓数据挖掘,决策树及其构造,ID3算法.利用数据挖掘技术,对大学英语四级考试条件结论情况进行数据挖掘.通过ID3算法,建立决策树,从而提取规则.切实反映大学英语四级考试条件结论情况,服务有意向通过大学英语四级考试同学的需求.  相似文献   

17.
数据挖掘中分类方法的研究   总被引:2,自引:0,他引:2  
分类是数据挖掘中的最重要的技术之一。目前实现分类的方法有统计方法、机器学习方法和人工智能方法等,常用的技术有决策树分类、贝叶斯分类、神经网络分类等。通过对当前具有代表性的分类算法原理进行分析、比较,总结出每种算法的性能特征,既便于使用者了解掌握各种分类算法、更好地选择合适的算法,又便于研究者对算法进行研究改进,提出性能更好的分类算法。  相似文献   

18.
19.
王源  王甜甜 《电子科技》2010,23(9):89-91,95
针对ID3算法倾向于取值较多的属性的特点,同时为避免特定领域主观属性影响分类结果,提出了一种改进的决策树算法。该方法利用决策树算法构造决策树,通过对分类结果中主客观属性进行标记并逻辑运算,最终得到较客观的决策信息,并进行实验验证。  相似文献   

20.
数据挖掘算法研究   总被引:1,自引:0,他引:1  
数据挖掘技术是一个不断发现知识的过程。阐述了目前三种流行的数据挖掘算法的理论模型及算法思想,并从算法时间复杂度、依赖条件和误差估计等方面进行了比较分析,说明了不同算法的优势和不足。指出了不同算法的应用前景,提出了一种将不同算法结合以减少误差率,提高算法效率的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号