首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
基于关联规则挖掘的生化企业数据分析及其应用研究   总被引:1,自引:0,他引:1  
生物化工产品的工业生产,要求有合适的生产环境,由于生产过程的复杂性,掌握适宜的生产环境较为困难.数据挖掘是从现有数据中找规律,可以从历史数据中,找出关联模式,从而获取对决策目标有利的生产环境条件.本文针对生物化工(生化)企业生产的数据特征,基于关联规则挖掘,分析生化企业生产数据,同时结合目前大多数关联规则挖掘算法的数据模型要求,重点论述了环境因子和环境因子数据项的关系,提出将原始数据指标分割成数据项,及分割后的数据项合并为决策目标的方法.由于生化企业生产决策目标的确定性,提出了具有确定性决策项时关联规则挖掘的优化算法,可快速地挖掘感兴趣的频繁数据项集.在此基础上,开发了具有数据预处理(环境指标分割)、关联知识发现、结果生成的应用系统,对系统做了初步试验和分析,从系统输出的结果中,可以辅助企业进行生产环境的优化.研究表明,用关联规则挖掘分析生化企业数据是有效的.  相似文献   

2.
鉴于现行数据隐私问题日益严重,如何防止数据挖掘过程中隐私信息的泄漏,将是一个重要的研究议题。该文主要针对关联规则挖掘技术,从安全多方计算方面探讨隐私信息的保护,提出适用于挖掘水平分割数据的保护机制。方法设计采用集中式挖掘,过程中加入信息安全技术以确保参与单位的数据隐私,以求在隐私保护和知识获取间取得一个平衡。  相似文献   

3.
语义Web环境下的关联规则挖掘是数据挖掘领域新的研究热点.本文针对SWRL数据集的特征,建立新的数据挖掘形式背景,将FCA用于关系型关联规则的挖掘,提出了基于搜索空间分割的关联规则挖掘方法.采用FCA作为频繁模式的压缩表示方式,从生成的闭查询导出的关联规则,可有效控制冗余规则的产生.将搜索空间进行划分可减小问题的规模,充分利用已有的挖掘过程的中间结果所提供的信息,减少了计算量.由于采用了分而治之的策略,本文的方法易于扩展到对海量语义Web数据的并行处理.  相似文献   

4.
基于时序数据的延迟关联规则的挖掘   总被引:5,自引:0,他引:5  
时序数据是一种常见的数据类型,也是数据挖掘的重要研究内容。采用关联规则挖掘时序数据是较新的研究领域。明确提出挖掘延迟关联规则的模型,根据延迟规则的定义提出两种挖掘方法,并针对两种算法进行了相关的对比分析。  相似文献   

5.
在约束关联规则挖掘过程中,影响交互的制约因素是挖掘算法的执行时间。为了提高挖掘过程的交互性,文章提出一种基于两阶段的约束关联规则挖掘算法。算法利用已挖掘的关联规则,实现约束关联规则的挖掘过程。在算法实现的过程中对关联规则集存储结构进行了优化,并扩展了类SQL查询语句。实验结果表明,由于在约束条件挖掘的过程中不需要再对数据库进行挖掘处理,节省了大量的用户时间,因此算法是有效的。  相似文献   

6.
一种新的关联规则增量式挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
张健沛  杨悦  刘卓 《计算机工程》2006,32(23):43-44,6
针对数据库不断更新变化及现实生活中大多只对近期数据感兴趣的特点,该文提出了一种基于滑动窗口过滤器的关联规则增量式挖掘算法(SWFAI算法)。该算法通过分组及时舍弃挖掘过程中生成的非频繁项目集,有效降低主存压力,减少对数据库的扫描次数,能够对时变数据库进行高效地关联规则挖掘。通过实验证明了该算法能够有效地进行关联规则的挖掘,并在效率上有较大提高。  相似文献   

7.
针对通信网络告警预测中预测精度不高、模型训练效率较低等缺陷,提出告警权值确定方法和基于自然序树(Can-tree)的加权增量关联规则挖掘的通信网络告警预测方案。首先,对告警数据进行预处理,确定告警数据权值并压缩到Can-tree结构中;其次,应用增量关联规则挖掘算法对Can-tree进行挖掘,生成告警关联规则;最后,使用模式匹配的方法对实时告警信息进行预测,并对结果进行优化整理。实验结果表明,基于Can-tree的加权增量关联规则挖掘算法是高效的,利用前次挖掘的结果和信息提高了挖掘的效率,网络告警数据的权值分配方案能够合理地区分告警数据的重要程度,有助于将重要程度高的告警关联规则挖掘出来,并加快过时告警关联规则的淘汰,提高预测的准确度和精度。  相似文献   

8.
云计算环境下数据弱关联挖掘模型的仿真   总被引:1,自引:0,他引:1  
在对云计算环境下海量数据进行挖掘的过程中,容易出现大量冗余数据,造成数据间关联性降低,导致传统的基于模糊神经网络的云计算环境下海量数据中弱关联.由于容易陷入局部最小,无法有效完成弱关联的挖掘,提出一种采用弱聚类算法的云计算环境下海量数据中弱关联挖掘方法,通过数据的描述特征对数据特征进行分解,依据数据特征,对全部数据进行融合.基于关联决策概率将云计算环境下海量数据进行有效划分,完成所有数据特征关联概率的计算,通过弱聚类方法对属性元素进行分类,将数量型元素转换成类别型,通过弱化关联规则方法,对经聚类处理后的数据进行挖掘.实验结果表明,所提方法具有很高的高效性及有效性.  相似文献   

9.
一种新的动态频繁项集挖掘方法   总被引:1,自引:0,他引:1  
频繁项集挖掘是关联规则挖掘的重要步骤。在数据动态变化的环境下进行关联规则挖掘具有重要的现实意义。提出一种动态频繁项集挖掘算法,该算法建立在前一阶段挖掘的基础上,能避免过多地扫描数据库而影响挖掘性能,在最后生成全局频繁项集时,不需要全程扫描数据库,根据之前挖掘结果有选择地扫描相关的事务子集。实验表明,该算法挖掘性能远远优于Apriori算法,能有效地实现在数据动态变化环境下的挖掘频繁项集。  相似文献   

10.
关联规则挖掘作为数据挖掘的一个重要方法,在许多数据挖掘领域得到应用。本文阐述了关联规则挖掘以及其关键算法,并针对具体的实例,描述了数据挖掘工具weka挖掘关联规则的过程。  相似文献   

11.
针对经典概念格基于完备形式背景,在缺值形式背景下不能很好的获取关联规则知识的问题,在偏小近似形式背景的基础上,提出了一种τ-近似概念格来解决信息不完备背景下的知识发现问题,利用它能够获取精度和可信度较高的关联规则知识。文章对τ-近似概念格的构建及其关联规则提取过程进行了详细描述,并将其与偏小近似概念格和偏大近似概念格这两种解决策略进行了案例分析对比,验证了它的可行性和有效性。  相似文献   

12.
数据库中加权关联规则的发现   总被引:66,自引:0,他引:66  
关联规则发现是数据库中知识发现研究中的热点课题,有着广泛的应用领域.在现有的研究中,数据库中的各个项目是按平等一致的方式加以处理的.然而,在现实世界数据库中却并非如此,不同的项目往往有着不同的重要性.为了将它们反映出来,对项目引入权值,从而提出了新的加权关联规则问题.由于项目权值的引入,频繁项目集的子集不再一定是频繁的.为此,又提出了项目的k-支持期望概念,并由此提出了加权关联规则的发现算法.  相似文献   

13.
适合于高效更新的关联规则挖掘算法   总被引:6,自引:0,他引:6  
实用的关联规则挖掘算法,为了发现事先未知的关联规则,用户需要通过对最小支持度和最小可信度这两个阈值的不断调整来逐步聚焦到那些真正令其感兴趣的关联规则上去,这将是一个动态的交互过程,因此,迫切需要高效的更新算法来满足用户对较快的响应时间的需求,基于这种思想,并深入分析了已有的诸关联规则挖掘与更新算法且指出其共同存在的问题与不足,在此基础上,提出一种当数据库数据不变时,仅扫描数据库一次,即可反复调整最小支持度和最小可信度进行关联规则挖掘与更新的高效、实用的算法,特别在对关联规则进行更新时,该算法对最初和前次挖掘过程中所得到的信息加以充分的利用,从而对关联规则进行更新时算法的执行效率得到进一步的提高,并对算法进行了分析与讨论.  相似文献   

14.
Sequential Association Rule Mining with Time Lags   总被引:5,自引:0,他引:5  
This paper presents MOWCATL, an efficient method for mining frequent association rules from multiple sequential data sets. Our goal is to find patterns in one or more sequences that precede the occurrence of patterns in other sequences. Recent work has highlighted the importance of using constraints to focus the mining process on the association rules relevant to the user. To refine the data mining process, this approach introduces the use of separate antecedent and consequent inclusion constraints, in addition to the traditional frequency and support constraints in sequential data mining. Moreover, separate antecedent and consequent maximum window widths are used to specify the antecedent and consequent patterns that are separated by either a maximal width time lag or a fixed width time lag.Multiple time series drought risk management data are used to show that our approach can be effectively employed in real-life problems. This approach is compared to existing methods to show how they complement each other to discover associations in the drought risk management domain. The experimental results validate the superior performance of our method for efficiently finding relationships between global climatic episodes and local drought conditions. Both the maximal and fixed width time lags are shown to be useful when finding interesting associations.  相似文献   

15.
随着市场竞争不断加剧,企业创新成为现代企业生存的重要一环。首先,将用于解决技术性发明创造而建立的TRIZ理论引入到企业创新研究之中;通过计算机知识发现和数据挖掘技术与TRIZ理论中的矛盾思想相结合,并根据德国弗朗克协会提出的企业创新九个领域,将其细分为相应若干指标器;在此基础上,提出使用指标器间关联规则替代TRIZ创新原理。最后,使用这些关联性与九个创新领域,得到了一种适合描述企业创新的矛盾矩阵构成方法,为解决企业创新提供了分析依据。  相似文献   

16.
向量空间模型中完全加权关联规则的挖掘   总被引:9,自引:1,他引:9  
项目加权关联规则挖掘是通过对具体项目赋予一定的权值来挖掘人们更加感兴趣的关联规则,其中具体项目的权值在数据库中是固定不变的。但现实数据库中,存在着所有项目权值会发生变化的问题。针对此类问题,文章提出新的加权关联规则模型,并提出了完全加权关联规则的挖掘算法。实验结果表明该算法是有效的。  相似文献   

17.
We consider the problem of finding association rules in a database with binary attributes. Most algorithms for finding such rules assume that all the data is available at the start of the data mining session. In practice, the data in the database may change over time, with records being added and deleted. At any given time, the rules for the current set of data are of interest. The naive, and highly inefficient, solution would be to rerun the association generation algorithm from scratch following the arrival of each new batch of data. This paper describes the Borders algorithm, which provides an efficient method for generating associations incrementally, from dynamically changing databases. Experimental results show an improved performance of the new algorithm when compared with previous solutions to the problem.  相似文献   

18.
概念指导的关联规则的挖掘   总被引:4,自引:0,他引:4  
关联规则是数据依赖关系泊有效描述方法,是知识发现研究的重要内容,传统的关联规则挖掘算法缺少挖掘的针对性,挖掘速度慢,挖掘效果难于理解,挖掘析数量巨大,需要进行大量的筛选以便抽取出有用规则,文中提出了将概念融入挖掘过程中,提高挖掘的效率和挖掘的针对性的方法,给出了概念指导的关联规则挖掘算法CGARM和大数据库中概念的交互式生成方法。算法CGARM是对基于分类的挖掘算法的拓展。实验结果表明,算法CGA  相似文献   

19.
电力调度数据挖掘后处理方法的研究   总被引:1,自引:0,他引:1  
关联规则是数据依赖关系的有效描述方法,是知识发现研究的重要内容.然而,随着所挖掘数据库规模的增大,由传统数据挖掘算法所生成的大量关联规则常常令用户的使用与分析十分困难.文中提出了一种新方法来解决这个问题并将其运用到电力调度数据挖掘系统中.实验结果表明,该方法消除了大量冗余规则,并且使用户可以从整体上把握整个规则集,提高了关联规则挖掘的准确性和易用性.  相似文献   

20.
CAPP环境下关联规则挖掘技术的应用研究   总被引:2,自引:0,他引:2  
CAPP系统的数据库中存储了大量的工艺设计资料,如何充分利用这些宝贵的数据和信息是一项非常有意义的研究工作。通过对数据挖掘技术的深入分析,提出了将数据挖掘技术应用于CAPP数据库中,采用关联规则挖掘方法发现基本工艺单元。详细讨论了关联规则的定义和挖掘算法,并给出了具体的挖掘实例,以期为提高CAPP系统的应用效率提供有力的技术支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号