首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
关联规则算法的实现与改进   总被引:11,自引:0,他引:11  
关联规则作为一种数据挖掘的工具,它能够发现数据项集之间有趣的关联。在关联规则的算法中,Apriori算法是其中的关键算法之一。面对大量复杂的数据集,怎样选择数据结构,怎样优化处理过程,对于此算法的性能将会十分重要。该文首先介绍了关联规则的原理和Apriori算法的实现,然后提出了对该算法的若干改进,例如:采用树型结构存取频繁项集,使用三种缓存优化的方法等。这些优化都能够在整体上提高算法的效率。对于大数据项,试验显示,这些改进能够正确、有效、快速地实现Apriori算法。  相似文献   

2.
网络安全隐患数据具有海量化、复杂化、多元化的特点,因此在对网络安全隐患数据进行挖掘时存在执行时间长、挖全率低、内存消耗量大的问题。为了优化网络安全隐患数据挖掘效果,研究了基于关联规则算法的网络安全隐患数据挖掘模型。计算关联权值和平均值,由此获取数据项集关联度的准确性。通过判别关联程度,完成数据预处理。采用Apriori算法对预处理后的数据进行量化处理,抽取、挖掘、记录可应用数据信息。利用亲和度函数建立目标函数,以获取隐患数据。建立关联规则,以确保隐患数据差异。以可信度结果为基础,构建网络安全隐患数据挖掘模型,实现网络安全隐患数据挖掘。试验结果表明,采用此模型后,执行时间较短、挖全率较高、数据挖掘过程中占用的内存较少。该研究可为网络安全隐患数据挖掘系统设计提供有效支持。  相似文献   

3.
数据挖掘的关联规则建立与算法改进   总被引:4,自引:0,他引:4  
关联规则作为一种数据挖掘的工具,能够发现数据项集之间有趣的关联。在关联规则的算法中,Apriori算法是其中的关键算法之一。本文提出利用频繁K-项集导出关联规则后得到的有用信息指导频繁(K 1)一项集产生的方法,通过矩阵、事务剪枝和分区查找有效的提高了Apriori算法的效率。  相似文献   

4.
数据挖掘当下已成为十分热门的话题,人们对它将随之带来长远的经济社会效益清晰可见。面对现今要处理如此庞大的数据量,高效、准确地挖掘出数据中的有效信息十分必要。在数据挖掘领域中,关联规则旨在找出数据集中项与项之间未知的关系,进而可以从挖掘出的数据对象信息中得到我们需要的信息。Apriori算法是关联规则里的一项基本算法,也是数据挖掘领域十大经典算法之一,可以利用它挖掘数据集中数据项间的潜在关系。  相似文献   

5.
对于高校就业管理信息系统中积累的大量数据,运用数据挖掘算法中的决策村方法挖掘出潜在的有用的信息,为高校开展就业工作提供决策支持.根据就业数据的特点,采用C4.5决策树算法,对就业数据进行预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别.挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析.  相似文献   

6.
教育考试数据挖掘的研究与实现   总被引:1,自引:0,他引:1  
进行教育考试数据挖掘与分析研究,有利于充分发掘教育考试数据的潜在价值,更好地为教育管理、教育决策提供科学的依据。分析了教育考试数据资源现状与特点,构建了高考数据集市雪花模型,采用Apriori算法生成频繁数据项集,并以最小置信度75%为条件,挖掘出考生4科高考成绩之间的关联规则。  相似文献   

7.
传统的学生信息管理中不能有效地利用数据对决策者提供有利的信息,使用数据挖掘可以找出学生信息中隐藏的数据关联。在学生各类信息的基础上采用数据采集、预处理,并使用Apriori算法对学生信息进行挖掘,为学校决策提供依据。  相似文献   

8.
数据挖掘是致力于数据分析和理解、揭示数据内部潜在联系的技术,关联规则是数据挖掘中最活跃的研究方法之一。高校教学管理者从诸多方面对教师教学业绩进行考核,该文针对某高校教师教学业绩考核数据集,采用关联规则中的Apriori算法,挖出数据集中某些数据项之间的关联规则,通过对关联规则的分析找出它们之间隐藏的信息,为高校教学管理者提供决策支持,同时指导教师的教学。  相似文献   

9.
提出了采用关联规则Apriori算法对煤矿生产调度子系统进行频繁模式数据挖掘的方案,详细描述了对煤矿生产数据进行预处理以及运用Apriori算法对预处理后的数据挖掘频繁项集的过程,分析了频繁项集中关联规则的含义,并提出了进一步提高数据挖掘功能的方案。  相似文献   

10.
XML以其诸多优点,迅速成为不同领域间信息表示与交换的标准;大量XML数据的出现给数据挖掘带来了新的挑战;挖掘XML数据关联规则的大部分工作都是基于Apriori算法的研究;对Apriori算法的基本方法与效率进行了分析,指出其不足,并提出了改进的XApriori算法,该算法基于新的数据结构,利用Hash表的存储技术以及对Apriori算法的优化来提高查找频繁项集的效率;对Apriori算法和XApriori算法进行了比较,实验结果表明改进的XApriori算法优于Apriori算法。  相似文献   

11.
基于数据挖掘的网络信息安全策略研究   总被引:1,自引:0,他引:1  
随着网络应用越来越普及,网络数据越来越庞大,网络信息安全问题日益严重,面对庞大的互联网数据安全提出了基于数据挖掘的网络信息安全策略,并对网络信息安全数据挖掘方法、挖掘对象、实施过程、挖掘算法进行论述,设计了网络安全分析模型,对静态和动态流量数据进行分析,给出了基于数据挖掘的网络信息安全分析算法的静态网络安全数据分析模型算法和动态流量数据及态势分析算法。  相似文献   

12.
以地物识别和分类为目标的高光谱数据挖掘   总被引:45,自引:0,他引:45       下载免费PDF全文
高光谱信息挖掘技术是高光谱数据应用延拓与深入的重要环节,其核心在于光谱信息的挖掘,基于高光谱遥感信息的特点,探讨分析以地物识别与分类目标的高光谱数据挖掘技术,包括基于模式识别的高光说诺于光谱波形特征的挖掘技术,以及亚象元光谱挖掘。  相似文献   

13.
数据挖掘中聚类分析的技术方法   总被引:1,自引:0,他引:1  
数据挖掘是信息产业界近年来非常热门的研究方向,聚类分析是数据挖掘中的核心技术。对各种聚类算法进行了分类,对代表算法作了详细的分析,并对这些算法从多个方面进行了比较,从而为研究和在不同领域使用这些算法提供了参考。同时还阐述了聚类分析在数据挖掘中的应用。  相似文献   

14.
苏毅娟  钟智 《计算机工程》2009,35(17):92-93,9
缺失数据填充效果会对学习算法和挖掘算法的后续处理过程产生影响。针对代价敏感决策树方法没有同时考虑填充顺序和填充代价的问题,提出一种有序填充缺失数据的算法,综合考虑经济因素和建立填充器所需的有效信息。实验结果表明其预测准确率和分类准确率高于现有算法。  相似文献   

15.
数据挖掘常用聚类算法研究   总被引:2,自引:0,他引:2  
信息社会的发展,使数据量以前所未有的速度在增长,因此从海量数据中获取有用的知识和信息就变得越来越重要。数据挖掘是一种综合多领域知识而形成的数据分析技术,能够从大量数据中获取有价值的知识并为决策提供支持。聚类分析算法是数据挖掘中的一个核心内容,也是目前研究的一个热点。该文首先讲述了基于划分的聚类算法、基于分层的聚类算法、基于密度的聚类算法和基于网格的聚类算法等常用的聚类分析算法,并分析了其特点;然后通过举例详细描述了最近邻聚类算法的操作过程。聚类算法的总结,对聚类的研究和发展具有积极意义。  相似文献   

16.
基于遗传BP神经网络的数据挖掘技术   总被引:2,自引:0,他引:2  
数据挖掘技术是从大量数据中挖掘知识的有效的工具。BP神经网络和遗传算法是运用在数据挖掘中的两种新兴算法,神经网络的结构复杂、网络训练时间长、收敛速度慢,但其具有较高的正确率,把BP神经网络与遗传算法相结合,可以提高收敛速度,并在有限步内达到较高的精度要求,因此本文提出了一种遗传算法和BP神经网络相互结合的新算法,并把算法运用在数据挖掘技术中。  相似文献   

17.
完全加权数据模型的特点是其项目权值分布在各个事务记录中,随着事务记录的不同而变化。现有的加权负关联规则挖掘算法不能适用于完全加权数据模型。该文提出一种新颖的基于概率比和兴趣度的完全加权正负关联规则的挖掘算法,探讨了算法在教育信息化数据中的应用。算法以概率比代替传统的置信度,采用支持度-概率比-兴趣度架构衡量完全加权正负关联规则,获得很好的挖掘效果。以真实的教育数据和文本数据为实验测试集,与现有正负关联规则挖掘算法比较,该文提出的算法更有效、更合理,具有较高的理论价值和应用前景。  相似文献   

18.
小数据集条件下基于数据再利用的BN参数学习   总被引:1,自引:0,他引:1  
杨宇  高晓光  郭志高 《自动化学报》2015,41(12):2058-2071
着重研究了小数据集条件下结合凸约束的离散贝叶斯网络(Bayesian network, BN)参数学习问题, 主要任务是用先验知识弥补数据的不足以提高参数学习精度. 已有成果认为数据和先验知识是独立的, 在参数学习算法中仅将二者机械结合. 经过理论研究后, 本文认为数据和先验知识并不独立, 原有算法浪费了这部分有用信息. 本文立足于数据信息分类, 深入挖掘数据和先验知识之间的约束信息来提高参数学习精度, 提出了新的BN 参数学习算法 --凸约束条件下基于数据再利用的贝叶斯估计. 通过仿真实验展示了所提算法在精度和其他性能上的优势, 进一步证明数据和先验知识不独立思想的合理性.  相似文献   

19.
随着信息技术的不断发展,数据挖掘在我们的工作和生活中的应用也越来越广泛,目前聚类算法在数据挖掘中则是一个热点研究领域。本文深入研究了现阶段比较成熟的几种聚类算法,总结了这些算法的优缺点以及适用范围,提出用来评价聚类算法性能优劣的指标,也是今后聚类算法研究的出发点。  相似文献   

20.
随着网络安全问题受到越来越多的关注,在数据挖掘中做好隐私保护已成为当前的研究热点。如何在挖掘过程中不泄露私有信息或敏感数据,同时能得到比较准确的挖掘效果,是数据挖掘研究中的一个热点课题。本文从数据分布方式结合挖掘算法对当前几种关键的隐私保护方法进行分析,并给出算法的评估,最后提出隐私保护数据挖掘方法的未来研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号