首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 132 毫秒
1.
关联规则挖掘是数据挖掘领域中最重要的研究问题之一。Apriori是关联规则挖掘的一种经典算法,它使用候选项集产生测试机制来找出所有满足用户最小支持度的项集,但它需要多次扫描数据库,会产生大量的候选项集。针对Apriori算法的不足,提出了一种基于混合型新的优化算法:Apriori—Mend算法。该算法从优化产生2项集、事务压缩等几个方面对Apriori算法进行优化,将散列技术应用于产生1项集和2项集,采用库优化策略和混合型存储结构,以节省空间和运算时间。实验结果表明,Apriori—Mend算法运行速度比Apriori算法有明显的提高。  相似文献   

2.
为了发现隐藏在生产过程数据中的关联关系,提出基于Apriori算法的改进算法Apriori Mask。该算法针对Apriori算法在处理生产过程数据时的性能瓶颈问题,结合生产过程数据特点,在由一阶频繁集生成二阶频繁侯选集的时候进行优化,去除不必要的"连接",以此减少二阶频繁侯选集的数量,提高算法效率。经对比分析显示,Apriori Mask在处理生产过程数据条件下具有较好的性能。  相似文献   

3.
关联规则挖掘是数据挖掘领域中最重要的研究问题之一。Apriori是关联规则挖掘的一种经典算法,它使用候选项集产生测试机制来找出所有满足用户最小支持度的项集,但它需要多次扫描数据库,会产生大量的候选项集。针对Apriori算法的不足,提出了一种基于混合型新的优化算法:Apriori-Mend算法。该算法从优化产生2项集、事务压缩等几个方面对Apriori算法进行优化,将散列技术应用于产生1项集和2项集,采用库优化策略和混合型存储结构,以节省空间和运算时间。实验结果表明,Apriori-Mend算法运行速度比Apriori算法有明显的提高。  相似文献   

4.
当使用关联规则进行数据挖掘时,使用者为了达到一定的挖掘效果,经常需要不断地改变关联规则的支持度阈值(support)。在这篇文章中我们提出了一种从大型数据库中挖掘关联规则的快速算法,该算法以经典的Apriori算法为基础,可以在提出新的支持度后直接在首次挖掘的基础上进行再一次挖掘。结果表明,它较Apriori算法的实现速度有明显的提高。  相似文献   

5.
基于Apriori算法,研究了参数化模型间包含性关系,结合包含性关系在数据库中的隐藏形式,利用一种可以克服经典Apriori算法两个瓶颈的事务数据库构建方法,减少了扫描事务数据集的次数,并通过对频繁项集置信度的比对,输出了包含性关系的结果。以高中压阀门产品为数据对象,应用Weka数据挖掘软件的Explorer模块进行实例验证,输出了阀门各个参数化模型间的包含性关系。  相似文献   

6.
本文对数据挖掘中关联规则和序列模式的概念和作用进行了研究,论述了在关联规则中寻找大项集的Apriori算法的实现,以及在序列模式基础上对Apriori算法的结果进行了改进和优化,使数据的关联规则与时间和序列之间建立了密切的联系,从而更好的实现了对于大规模数据库中有用信息的挖掘和利用。  相似文献   

7.
吴卫华  袁宁 《山东机械》2003,(5):44-46,64
本文对数据挖掘中关联规则和序列模式的概念和作用进行了研究,论述了在关联规则中寻找大项集的Apriori算法的实现,以及在序列模式基础上对Apriori算法的结果进行了改进和优化,使数据的关联规则与时间和序列之间建立了密切的联系,从而更好的实现了对于大规模数据库中有用信息的挖掘和利用.  相似文献   

8.
为了更好的利用与产品参数方面的客户需求数据,提出了一种基于布尔矩阵改进的Apriori算法对客户需求数据信息进行分析。首先,针对Apriori算法在每次由低维度连接生成高维度的候选频繁项集时都需要扫描整个数据库非常耗时的缺陷,利用布尔矩阵对其进行改进,把客户需求数据映射成布尔矩阵;其次,采用迭代和剪枝的方式,利用改进后的算法对客户需求数据进行分析,计算出满足设定支持度的最高维度的频繁项集,挖掘出客户需求信息之间的不确定性联系,为设计制造出满足客户需求的产品提供参考。通过分析,改进后的算法在计算的时间复杂度和空间复杂度方面更优;最后以某企业针对冰箱产品开展的客户需求调查结果为例,说明该方法的具体实施过程。  相似文献   

9.
在数据挖掘中,关联规则挖掘发现大量事务项之间有趣的关联关系的研究是一个重要的课题.Apriori算法则是数据挖掘中,搜索关联规则频繁项目集最有影响的算法.本文通过一个实例对Apriori算法在布尔型关联规则领域的应用进行了探讨.根据Apriori算法实现了计算机程序的实例验证.  相似文献   

10.
挖掘最大频繁项集的算法多基于局部数据库,为此提出了一种基于频繁模式树的快速挖掘全局最大频繁项集算法.该算法首先挖掘出所有全局频繁项目组成集合,然后各个节点根据该集合构建局部频繁模式树,最后将该集合作为全局最大频繁候选项集,采用自顶向下策略挖掘出所有的全局最大频繁项集.与类Apriori算法相比,该算法采用的频繁模式树结构能大幅度降低数据库扫描次数和运行时间;自顶向下的策略能大幅度减少候选项集数和通信量.实验结果表明,该算法是快速和高效的.  相似文献   

11.
一种模糊加权关联规则算法及其在流程工业中的应用   总被引:3,自引:0,他引:3  
采用模糊加权关联规则对流程工业中的大量运行数据进行了分析。阐述了模糊理论和关联规则的内容和性质,在证明模糊关联规则也具有“频繁项集的所有非空子集也必须都是频繁的”基础上,借鉴加权关联规则算法的特点,提出了模糊加权关联规则Fuzzy_WedApriori算法流程,针对不同情况采用不同隶属函数对实际数据进行模糊化,根据此算法的步骤对模糊化的参数点进行处理,得到了有价值的模糊加权规则,为流程工业的生产优化提供了理论依据。  相似文献   

12.
存储过程在ERP系统中的研究与应用   总被引:2,自引:0,他引:2  
由于ERP系统是大型的管理信息系统,其数据库的安套巨以及企业业务逻辑规则的保密性要求很高,基于这方面的考虑,分析了MSSQL存储过程的特性,研究了如何利用存储过程编写业务规则,以提高系统的安全性和运行效率。  相似文献   

13.
基于数据挖掘的电子商务推荐系统,通过使用关联规则算法来对客户的事务执行购物篮分析,知道那些产品比较热销,以及一个特定商品与另一个商品被一起购买的可能性有多大。从而通过商品的推荐和捆绑销售,为客户提供个性化服务,同时实现利益的最大化。在总结前人挖掘模型的基础上,设计了基于Apriori算法的电子商务推荐系统。Apriori算法作为最有影响的挖掘布尔关联规则频繁项集的算法,简单可靠,适合于机器学习。  相似文献   

14.
大数据时代信息技术的飞速发展,使得应用数据挖掘分析技术对体育教学评价数据进行分析成为了可能,从而进一步提高教学质量。本文结合传统的Apriori算法的优势,并采用数据分片的模式解决全库扫描本身存在的性能问题,提出了改进的O-Apriori算法,核心在于减少扫描数据库及生成候选集的数量,引入关联度值解决原始算法在获取数据的关联规则不准确的问题,找出体育教学质量评价与教学内容方法KPI因素的关联关系,从而准确定位提升教学质量的关键点,使教师可以有的放矢的调整内容,为改善体育教学提供强有力的数据支撑。  相似文献   

15.
持久对象标识的生成方法   总被引:1,自引:0,他引:1  
在对象持久化过程中,利用对象标识管理器为对象生成唯一标识,并与对象关联被存储在后台关系数据库中,对象标识的引入使维护对象之间关系变得更加容易,便于对持久对象的查询.对象标识管理器的设计,主要是对对象标识生成策略的封装.分析对象标识生成的若干种方法,并对各种方法进行了分析,设计持久层时,可以根据实际需要选择合适的对象标识生成策略.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号