首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 87 毫秒
1.
利用数据挖掘技术分析处理石油斜井抽油生产过程中产生的海量数据,可得到很多有用的价值和信息。线性回归算法是预测技术中的重要内容,通过线性回归算法可对斜井抽油中的数据进行分析、处理,达到预测井眼轨迹等重要应用。  相似文献   

2.
数据挖掘中聚类算法比较研究   总被引:8,自引:0,他引:8  
聚类算法是数据挖掘中的核心技术,虽然聚类算法已被广泛深入的研究,但其应用在数据挖掘领域时间不长,其间产生了许多不同的适用于数据挖掘的聚类算法,但这些算法仅适用于特定的问题及用户、为了更好的使用这些算法,综合提出了评价聚类算法好坏的5个标准,基于这5个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法。  相似文献   

3.
数据挖掘领域中的聚类方法   总被引:6,自引:0,他引:6  
聚类算法是数据挖掘中的核心技术,随着对聚类算法广泛深入的研究,产生了许多不同的适用于数据挖掘的聚类算法;文章从算法的角度论述了如何在数据挖掘中进行聚类分析,并通过基于评价聚类算法好坏的8个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法.  相似文献   

4.
数据挖掘中聚类算法的比较研究   总被引:6,自引:0,他引:6  
数据挖掘算法是数据挖掘的核心部分.对数据挖掘中的聚类算法进行了较详细的比较研究.  相似文献   

5.
数据挖掘中Fuzzy c—means的自适应聚类算法   总被引:2,自引:0,他引:2  
聚类算法是数据挖掘算法中的重要解决方法。针对现有聚类算法模糊c均值算法FCM中的不足,如需要预先确定聚类参数c,随机性较强、局部最优等弱点,对其算法结构加以改进,提出模糊c均值自适应算法(FCMA),增加聚类有效性问题的分析,在聚类过程中可动态调整聚类数目,这种方法可以避免在确定参数时的随机性和经验性,提高聚类算法的可靠程度。  相似文献   

6.
针对石油工程生产数据的处理问题,利用数据挖掘中层次分析聚类算法,探索处理工程数据的方法,分析数据之间的内在联系;同时针对油田生产中的悬点载荷问题进行具体分析,从实践的角度分析实验结果,实现通过数据分析体现生产过程的结论。  相似文献   

7.
数据挖掘中聚类算法的比较研究   总被引:6,自引:0,他引:6  
聚类是数据挖掘领域中的一个重要研究课题.本文首先综合提出评价聚类算法好坏的八个标准,然后在此标准基础上,对数据挖掘中的常用算法进行分类分析比较,并得出比较结果,以使人们在实际应用中能方便、快捷地找到最好的聚类算法以解决实际问题.  相似文献   

8.
将聚类分析技术应用于客户关系管理可以有效实现客户细分,改善客户关系。文章使用层次凝聚法和K—means算法实现了客户的自动聚类,并且在权衡算法效率和聚类精度的基础之上提出了改进的聚类距离公式和K—means算法。  相似文献   

9.
针对云计算环境中任务调度中存在的执行效率低的问题,提出了一种基于改进的基于密度的聚类算法(DB-SCAN)的云任务调度策略.首先使用改进的基于密度的聚类算法DBSCAN对云任务进行聚类,然后与已经分类的资源进行匹配,解决资源与任务匹配程度低的问题.实验结果表明,对任务进行聚类后进行任务调度,任务在终端上的平均执行时间减少了大约35.2%,任务的调度时间也有了明显减少.  相似文献   

10.
针对基于MPI环境的并行聚类算法需要手工配置数据,不利于调试程序等的不足,提出一个基于移动Agent的并行聚类算法模型.该模型以移动Agent为中心,负责系统性能数据的收集和计算任务的执行,可以实现数据的自动配置和计算.通过在基于移动Agent并行环境上的试验,该模型显示出良好的效率.  相似文献   

11.
利用数据挖掘可以优化有杆泵系统的生产管理方案,其数据挖掘目标值宜定为单井生产成本。挖掘数据应是包括油层基础数据、井眼轨迹数据、井下流体数据、井下工具数据、井下作业数据、地面设备数据、日常生产数据等7大类数据在内的所有相关数据。在数据预处理设计中,应进行数据的标准化处理、过滤噪声数据、数据单位的规范化处理、表达术语的统一化处理、成本量化处理等工作。  相似文献   

12.
遗传算法编码设计及其在数据挖掘中的应用   总被引:1,自引:0,他引:1  
数据挖掘就是从大量的数据中提取或者“挖掘”知识,从而实现对数据资源的有效利用.关联分析是数据挖掘诸多功能中应用最广泛的一种.关联分析用于发现关联规则,关联规则描述了给定数据集的项之间的有趣联系.提出了一种基于遗传算法的关联规则的挖掘算法.在关联规则的编码方面,提出了对个体进行变长编码的方法,从而在一定程度上减少了无效规则的数目;在适应度函数的构造方面也进行了一些改进;针对规则库的覆盖问题,采用标志位的方法,对挖掘过的规则设置标志,避免规则重复挖掘.  相似文献   

13.
一种混合聚类算法及其应用   总被引:1,自引:0,他引:1  
通过分析基于网格与基于密度的聚类算法特征,提出了一种基于网格和密度的混合聚类算法,通过分阶段聚类并选取代表单元中的种子对象来扩展类, 从而减少区域查询次数,实现快速聚类。该算法保持了基于密度的聚类算法可以发现任意形状的聚类和对噪声数据不敏感的优点,同时保持了基于网格的聚类算法的高效性,适合对大规模数据的挖掘。实验数据分析验证了算法的有效性,对数据挖掘应用于设备状态监测和故障诊断具有指导意义。  相似文献   

14.
如何精准地捕获读者的需求并分析客户的需求是设计个性化推荐系统的关键性问题。本文借鉴大型电子商务网站的个性化推荐技术,采用WEB挖掘的方式,采集海量的读者数据,运用CPM算法对读者及资源进行关联,根据读者的查询记录、借阅历史等信息实现智能推荐相关的书目,以满足读者个性化的服务需求。  相似文献   

15.
数据挖掘在医保系统中的应用   总被引:2,自引:2,他引:0  
随着计算机技术的不断发展,计算机管理已经逐渐步入各个行业,而职工福利待遇体系中十分重要的医疗保险行业则更为迫切的需要借助计算机对繁杂的日常事务进行处理。本文中的医疗保险系统就是计算机技术在医疗保险行业的一次应用,并且将模糊数据挖掘应用到该系统中,也是数据挖掘技术在医疗保险领域应用的一次尝试。  相似文献   

16.
数据挖掘是近年来数据库领域的研究热点之一,在电力系统中有很好的应用前景.文章首先分析了当前Apriori算法及主要的改进算法,在此基础上提出了一种快速产生候选频繁项集的新的Apriori改进算法,并就Apriori算法在电力系统数据挖掘中的应用进行了分析.  相似文献   

17.
为了使企业的管理层能够根据市场需求进行数据挖掘,并基于挖掘出来的规则做出决策,在数据仓库、粗糙集方法等理论的基础上提出了一种核心算法,应用于商业数据挖掘.核心算法从信息表开始,通过属性泛化、求核心属性、属性归约,最终得到由正确率表示的规则.在求核心属性的部分对粗糙集理论中求核心集的方法进行了改进,并给出了相应的证明.核心算法利用SQL语言的功能强大、容易开发、运行稳定等特点,通过SQL语言编程来实现.核心算法具有针对性强、可操作性强等优点.  相似文献   

18.
基于K-means聚类算法的分析及应用   总被引:7,自引:0,他引:7  
聚类分析能作为一个独立的工具来获得数据分布的情况,观察每一个簇的特点,集中对特定的某些簇作进一步的分析;本文主要介绍了传统聚类算法及其局限性,然后对直接K-means算法进行分析改进,着重分析了该算法的思想体系以及它的优缺点,针对它的缺点之一提出了一种基于距离的改进策略,并将该改进策略应用到对学生成绩的分析中,实验目的是应用该算法将学生划分为合理的簇(或类)以及对聚类结果进行分析,总之实验表明了该算法的灵活性以及在此应用中的适用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号