首页 | 本学科首页   官方微博 | 高级检索  
 共查询到20条相似文献,搜索用时 15 毫秒
In many data mining applications, the objective is to select data cases of a target class. For example, in direct marketing, marketers want to select likely buyers of a particular product for promotion. In such applications, it is often too difficult to predict who will definitely be in the target class (e.g., the buyer class) because the data used for modeling is often very noisy and has a highly imbalanced class distribution. Traditionally, classification systems are used to solve this problem. Instead of classifying each data case to a definite class (e.g., buyer or non-buyer), a classification system is modified to produce a class probability estimate (or a score) for the data case to indicate the likelihood that the data case belongs to the target class (e.g., the buyer class). However, existing classification systems only aim to find a subset of the regularities or rules that exist in data. This subset of rules only gives a partial picture of the domain. In this paper, we show that the target selection problem can be mapped to association rule mining to provide a more powerful solution to the problem. Since association rule mining aims to find all rules in data, it is thus able to give a complete picture of the underlying relationships in the domain. The complete set of rules enables us to assign a more accurate class probability estimate to each data case. This paper proposes an effective and efficient technique to compute class probability estimates using association rules. Experiment results using public domain data and real-life application data show that in general the new technique performs markedly better than the state-of-the-art classification system C4.5, boosted C4.5, and the Naïve Bayesian system.  相似文献   

以高校教学评价数据为基础,采用数据挖掘中的关联规则,寻找教学评价数据背后隐含的有价值的信息。从教学评价表中挖掘出教师特征因素(学历、职称、教龄)与教学评价质量等级的关联,从而为教学管理部门和授课教师提供决策参考。  相似文献   

本文从Apriori算法出发,提出基于XQuery应用的XML关联关系的挖掘算法。  相似文献   

用数据查询语言实现关联规则采掘   总被引:2,自引:1,他引:2  
关联规则采掘具有广阔的应用前景。文章讨论了关联规则的用途、内涵,分析了关联规则采掘的算法,给出了在DBMS平台上用数据查询语言实现关联规则采掘的程序。测试表明,实现的算法对关联规则采掘十分有效。  相似文献   

文章主要论述了数据挖掘的概念、过程及应用前景,此外还重点介绍了数据挖掘中常用的一种算法-关联规则算法.  相似文献   

关联规则挖掘可以发现大量数据中项集之间相关联系的知识,这些重要信息是关于这些数据的整体特征描述以及对其发展趋势的预测,对决策的制定有着重要的参考价值。主要介绍了数据挖掘和关联规则挖掘的概念,并对数据挖掘经典算法Apriori的进行了分析与改进,算法的改进可以有效地减少对数据库的扫描次数,使挖掘的效率更好更快。  相似文献   

一种新的关联规则挖掘思想   总被引:3,自引:0,他引:3  
提出的新的关联规则挖掘思想(以下称为“记录加权型关联规则挖掘”)是为每一条历史记录加上相应的权重值,以反映“不同记录对挖掘结果贡献不同”这一数据挖掘的实际要求。在此基础上,还对支持度、可信度和挖掘算法作了相应的修正,提出了RWApriori-Tid算法。  相似文献   

Discovering Dispatching Rules Using Data Mining   总被引:1,自引:0,他引:1  
This paper introduces a novel methodology for generating scheduling rules using a data-driven approach. We show how to use data mining to discover previously unknown dispatching rules by applying the learning algorithms directly to production data. This approach involves preprocessing of historic scheduling data into an appropriate data file, discovery of key scheduling concepts, and representation of the data mining results in a way that enables its use for job scheduling. We also consider how by using this new approach unexpected knowledge and insights can be obtained, in a manner that would not be possible if an explicit model of the system or the basic scheduling rules had to be obtained beforehand. All of our results are illustrated via numerical examples and experiments on simulated data.  相似文献   

关联规则在图像数据挖掘中的应用   总被引:1,自引:1,他引:0  
首先分析传统用在挖掘结构化数据关联规则的基本思想,然后分析图像数据的特征,找出图像数据与传统结构化数据的区别,最后结合图像数据的特性将传统的关联规则进行改进,并将它应用在图像数据挖掘中,挖掘出图像数据的相关性.  相似文献   

关联规则在医疗数据分析中的应用   总被引:20,自引:0,他引:20  
李虹  蔡之华 《微机发展》2003,13(6):94-97
介绍了从医疗数据中发现关联规则的方法,分析了医疗数据的特点,并以心脏疾病诊断的数据集为例,阐述了把医疗数据转换成事务数据格式的方法,描述了关联规则挖掘在医疗数据分析中应用所遇到的难题,针对这些难题给出了一种改进的Apriori算法,并用数据进行测试。结果表明,此算法优于Apriori算法,它可以减少产生的规则的数量,从而能快速发现有趣的医疗关联规则。  相似文献   

关联规则数据挖掘方法的研究   总被引:3,自引:0,他引:3  
首先简要地介绍数据挖掘和关联规则的概念、关联规则的基本原理及种类。然后详细地介绍了关联规则挖掘研究现状,讨论了Apriori算法的基本原理,同时也指出了Apfiofi算法的一些不足。针对这些不足提出了解决方法,描述了几种改进算法。最后对关联规则挖掘下一步的研究方向进行了展望。  相似文献   

深入研究关联规则算法, 针对Apriori算法瓶颈问题提出了一种改进算法, 该算法在构建向量矩阵的基础上, 只需要扫描一次事务数据库, 通过优化连接和剪枝, 提高了算法的运行效率. 研究和实验表明, 改进后的算法在大规模的事务数据库中, 较Apriori算法有明显的优势.  相似文献   

大数据下关联规则算法的改进及应用   总被引:1,自引:0,他引:1  
大数据时代对数据挖掘的技术和应用提出了更高的要求,关联规则算法作为数据挖掘的一个主要方向,能够在大量数据中发现频繁项集和关联知识。Apriori算法是关联规则的经典算法,本文对其在大数据下应用的缺点提出改进的方法,并结合用户收视行为的海量数据对改进后的算法进行应用,提高了数据挖掘的效率并得到较好的挖掘结果,同时为后续的应用提出了新的课题。  相似文献   

介绍空间数据关联规则挖掘的理论及其在研究上的应用,综述空间数据关联规则挖掘算法的应用成果,指出其应用前景和存在的问题.  相似文献   

关联规则挖掘算法在分类中的应用研究   总被引:1,自引:0,他引:1  
提出了一个基于关联规则挖掘算法的医疗数据分类方法。介绍了关联规则的理论基础、关联规则挖掘算法及其在医疗数据挖掘中的应用方法,并利用介绍的算法对乳腺癌数据进行挖掘。获得了分类的实验结果,该模型系统达到了较高的分类准确率,证明了数据挖掘在辅助医疗诊断中有着广泛的应用前景。  相似文献   

朴素贝叶斯分类是一种简单而高效的分类模型,然而条件独立性假设在现实中很少出现,致使其性能有所下降。通过引入关联规则,从两方面来改善朴素贝叶斯分类的性能。一方面,通过对关联规则的挖掘,发现条件属性之间的关联关系,并且利用这种关联关系弱化朴素贝叶斯的独立性假设;另一方面,通过关联规则的置信度,给朴素贝叶斯加权。  相似文献   

介绍了从医疗数据中发现关联规则的方法,分析了医疗数据的特点,并以心脏疾病诊断的数据集为例,阐述了把医疗数据转换成事务数据格式的方法,描述了关联规则挖掘在医疗数据分析中应用所遇到的难题,针对这些难题给出了一种改进的Apriori算法,并用数据进行测试.结果表明,此算法优于Apriori算法,它可以减少产生的规则的数量,从而能快速发现有趣的医疗关联规则.  相似文献   

关联规则在空间数据挖掘中的研究   总被引:2,自引:0,他引:2  
在智能化、集成化的空间数据应用领域中,空间数据挖掘是一门很重要的技术,而关联规则分析是空间数据挖掘的主要方法之一。文章基于数据挖掘中的关联规则分析方法,提出不同于一般数据挖掘的算法,设定兴趣度量,并通过将项的概念泛化为空间谓词,事务的概念泛化为邻域,关联规则的概念泛化为同位规则,发现多种形式的有效规则,并用逻辑语言或类SQL语言方式描述规则,以使空间数据挖掘趋于规范化和工程化。最后进行了实评。  相似文献   

Being a highly significant and complex function of management, decision making requires methods and techniques that simplify the process of selecting one choice among all available options. Decision making is therefore selection of that particular choice over any of several alternatives. Because of the process complexity, a continuous research and improvement of the methods and techniques modern decision making involves is required. One of many modern business challenges is to discover any possible improvement in the decision-making process managers shall use in making the right decision. Any decision made by managers directly impacts the realized profit, business, and company’s position on the market. The fact is that mankind faces the decision-making problem in each phase of its social development, which has resulted in increased need for learning more about it. In this work, both the significance and application of association rules will be analyzed on an example of car sales business. The research was conducted on a sample of 1728 transactions in order to recognize and establish the association rules and then determine their impact on the sales and profit. For the purpose of this research, a large car sales database was used as a source of information, which is also described in this work. Once these association rules were established, they were then used to create a better and more complete market supply. The main contribution of the paper is providing business intelligence model for performing association rules in real-term business settings.  相似文献   

针对关联数据集合呈现出的大数据特性和蕴含的语义信息,提出了首先建立关联数据集的模式级链接,再进行关联规则挖掘的方法。在同领域RDF数据集上定义RDF数据项模式并提出数据项模式的产生规则;利用RDF数据查询技术从数据项模式获得RDF数据项集合,进而再推导出特定领域内的关联规则。提出的基于关联数据RDF数据项模式的关联规则挖掘方法将关联规则挖掘扩展到同一领域内的数据集合而不再局限于单一数据集,同时给出了基于Hadoop的大规模RDF数据集上的关联规则挖掘的实现方案。实验结果验证了模式级链接对于关联规则挖掘的价值和所提方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号