首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
图书馆积累了大量的历史数据,从这些数据中挖掘出潜在的知识对图书馆工作有很强的指导作用。通过结合具体实例说明了关联规则在数据分析中的应用,为数据挖掘在图书馆的应用提供了一些思路。  相似文献   

2.
全面论述了大数据分析技术的概念、现状、技术及应用,包括大数据基本概念及特点、大数据分析产生的时代背景、关键技术以及大数据带来的变革和挑战,在大数据分析的关键技术中重点对大数据的清洗与融合、大数据处理框架、大数据的建模与分析进行了介绍。  相似文献   

3.
随着我国互联网的不断发展,网络已经成为了人们生活中的必需品,网络也成为了一个信息产生和传输的重要阵地。在互联网平台上,用户登录或者浏览或者进行了其他的操作都会留下数据痕迹。大数据也是在互联网不断发展过程中的产物,通过大数据的分析和挖掘,能够对用户进行画像分析,同时大数据也能够用来判断一个人的关联风险,在商业中运用大数据对客户进行分析,可以有效地对客户存在的潜在风险进行分析。以银行业为例,对基于大数据的客户关联风险和挖掘进行了研究,利用大数据对银行客户分析的关键技术,对银行客户等重点业务运用领域展开了探讨。  相似文献   

4.
随着信息技术的不断创新,信息量的不断扩大,大数据已经成为了与日常生活息息相关的话题。挖掘大数据的价值已经炙手可热,如何能够更高效、更快速地分析大数据已经成为大数据发展的重要挑战之一。近年来,学术界与工业界就大数据的分析进行了研究,取得了一些研究成果,但针对大数据分析的研究还是非常有限。文中首先从传统数据仓库与大数据时代数据仓库作了对比,引入了大数据的分析流程框架,对分析流程框架的各个部分做了一一阐述,并通过实验验证分析了流程框架的可行性。  相似文献   

5.
动态数据库关联挖掘方法存在挖掘时运行时间长、内存使用量大、各节点任务分布不均等问题,因而提出了基于大数据集的动态数据库关联挖掘研究.采用大数据集中分布式计算,分布式存储动态数据库中的历史数据;针对其存储的数据序列,进行数据修剪重排分组和计算量预估与均衡化分组,形成动态数据库历史数据;更新动态数据库新增数据,分别挖掘动态...  相似文献   

6.
序列关联并行挖掘算法研究   总被引:1,自引:0,他引:1  
李庆华  赵峰 《计算机科学》2003,30(8):114-116
Ming sequential associations is becoming increasing essential in many scientific and commercial domains Developing parallel algorithm becomes quite challenging depending on enormous size of available dataset and possibly large number of mined associations ,the nature of input data and the timing constraints imposed on the desired associa-tions. In this paper , we discuss several different parallel algorithms that cater to various situations to speed up thecurrent mining process.  相似文献   

7.
数据挖掘是一种重要的数据分析方法,旨在发现庞大的数据中隐藏着的、先前未知的并潜在有用的模式和信息,以帮助人们正确理解和认识数据,进行科学决策。关联挖掘是数据挖掘中研究最早也是最活跃的领域,其中,频繁模式挖掘是关联挖掘的核心和基础。对关联挖掘算法的研究和发展进行综述,分析挖掘算法面临的主要挑战,概括最新研究进展。  相似文献   

8.
基于约束的关联规则挖掘是一种重要的关联挖掘,能按照用户给出的条件来实行有针对性的挖掘。大多数此类算法仅处理具有一种约束的挖掘,因而其应用受到一定程度的限制。提出一种新的基于约束的关联规则挖掘算法MCAL,它同时处理两种类型的约束:非单调性约束和单调性约束。算法包括3个步骤:第一步,挖掘当前数据集的频繁1项集;第二,应用约束的性质和有效剪枝策略来寻找约束点,同时生成频繁项的条件数据库;最后,递归地应用前面两步寻找条件数据库中频繁项的约束点,以生成满足约束的全部频繁项集。通过实验对比,无论从运行时间还是可扩展性来说,本算法均达到较好的效果。  相似文献   

9.
徐璐 《福建电脑》2007,(10):88-89
数据挖掘是从海量数据库中挖掘有效或重要信息的过程.普通的关联规则挖掘是数据挖掘的一种基本的方法,但随着时间的推移,挖掘数据库的规模会发生不断变化,人们对数据的需求也会有所不同,如何从扩展数据库中高效地对已经推导出的关联规则进行更新,然后再利用更新的关联规则进行数据挖掘,这就是增量式挖掘关联规则的方法.  相似文献   

10.
随着大型数据库系统在各行业普及,数据库中存储的数据量急剧增大,数据挖掘是从海量数据中挖掘有效或重要信息的过程。关联规则挖掘作为数据挖掘的重要研究课题,被广泛地应用。伴随挖掘数据库的规模不断发生变化,对数据的需求也会有所不同,如何从扩展数据库中高效地对已经推导出的关联规则进行更新具有非常重要的应用价值,这就是所谓的增量式挖掘关联规则的问题。  相似文献   

11.
为了解决具有密度高、关联复杂的异构大数据网络的数据挖掘效率低下问题,基于多维关联架构,结合细粒度控制提出了数据挖掘算法.首先,在异构大数据网络存储与转发、处理的数据个性特征和差异化的基础上,给出了异构大数据网络数据定义和多维关联模型.接着,基于大数据网络多维关联初始化进程,通过大数据单位重构、维度置换、细粒度化和粒度均衡等,提出了多维关联细粒度数据挖掘算法.最后,通过与粗粒度算法、线性化结构数据挖掘算法对比了在不同网络规模和数据规模下的执行效率.实验结果表明,所提算法具有更佳的执行效率.  相似文献   

12.
文中首先介绍了数据挖掘中关联规则的经典算法——Apriori算法。再从宽度、深度、划分、采样、增量式更新等几个角度对关联规则挖掘进行了分类讨论。然后运用文献查询和比较分析的方法对常见的关联规则挖掘算法进行了概述,主要包括FP—growth算法、DHP算法、Partition算法、FUP算法、CD算法等算法。最后对关联规则挖掘的发展远景进行了展望。  相似文献   

13.
文章主要论述了数据挖掘的概念、过程及应用前景,此外还重点介绍了数据挖掘中常用的一种算法-关联规则算法.  相似文献   

14.
针对某高校信息工程学院学生的学习状况和培养方案的改进需求,以2008-2014级信息工程学院本科生课程成绩为研究对象,提出一种基于改进K-means和引入兴趣度的Apriori的学生课程成绩分析方法。采用改进的K-means算法对成绩信息进行离散化处理,采用引入兴趣度的Apriori算法进行挖掘并根据得到的课程之间的关联规则绘制课程关系网络图,对课程间的关联关系、衔接关系以及课程的重要程度进行分析。应用所述方法进行挖掘能够减少大量没有意义的规则,提高了挖掘结果的准确性,挖掘所得到的结果不仅能够为教学方案的设计和改进提供一定的参考信息,还有助于提高学校的教学质量和学生的学习质量。  相似文献   

15.
随着图像获取和图像存储技术的迅猛发展,能够方便得到大量的图像数据。为了能充分从这些图像数据中分析并提取有用信息,研究了数据挖掘中的新型领域——图像数据挖掘技术。主要介绍了数据挖掘、图像数据挖掘及关联规则在图像数据挖掘中的应用。  相似文献   

16.
原始数据集中含有大量噪声数据,且数据的规模很大,直接进行关联规则挖掘会影响准确度和效率。文章提出了一种对原始数据先进行聚类,再提取关联规则的挖掘策略,可以在一定程度内减少噪声数据的干扰,消除数据对象中的冗余属性,提高规则挖掘的有效性。  相似文献   

17.
数据挖掘是基于数据仓库的知识发现技术,当数据仓库数据海量时,进行穷举搜索是不可行的,必须采取一种有效的搜索策略。遗传算法不仅具有很好的全局搜索能力,同时它能较好的处理数据库中不同属性之间的相互关系。该文论述了如何把遗传算法应用于数据挖掘领域。  相似文献   

18.
简要介绍数据挖掘中的关联规则算法,并将之运用到学生成绩的数据挖掘中,挖掘高数成绩与高考成绩之间的潜在关系。提出学生大学期间的高数成绩和高考成绩并没有直接的关系,大学生活是一个全新的里程碑,不要因为自己的高考成绩而妄自菲薄。  相似文献   

19.
基于数值属性的关联规则挖掘算法   总被引:7,自引:0,他引:7  
关联规则的挖掘是一个重要的数据挖掘问题。目前的算法主要是研究支持—信任框架理论的关联规则挖掘,基于支持—信任理论的关联规则挖掘布尔型描述的数据已经比较成熟,但是现实的数据库中有许多数值属性的数据,从这些数据中挖掘潜在的规则,经典的关联规则方法(Apriori)就显得力不从心了。这里介绍将数值数据映射到二维空间,利用基于密度分布函数的聚类分析方法将数值属性区间分段,并在此基础上挖掘容易理解并且具有概括性和有效的数值属性关联规则。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号