共查询到20条相似文献,搜索用时 0 毫秒
1.
关联规则挖掘快速更新算法的研究和实现 总被引:2,自引:0,他引:2
关联规则挖掘是数据挖掘的主要方式之一,它可以分解为“大项集的生成”和发现关联规则两个子问题。分别针对以上两个子问题,文章提出了它们的快速更新算法。最后对算法的运行状况进行比较和性能分析。 相似文献
2.
Yonatan Aumann Ronen Feldman Orly Lipshtat Heikki Manilla 《Journal of Intelligent Information Systems》1999,12(1):61-73
We consider the problem of finding association rules in a database with binary attributes. Most algorithms for finding such rules assume that all the data is available at the start of the data mining session. In practice, the data in the database may change over time, with records being added and deleted. At any given time, the rules for the current set of data are of interest. The naive, and highly inefficient, solution would be to rerun the association generation algorithm from scratch following the arrival of each new batch of data. This paper describes the Borders algorithm, which provides an efficient method for generating associations incrementally, from dynamically changing databases. Experimental results show an improved performance of the new algorithm when compared with previous solutions to the problem. 相似文献
3.
因果关联规则是知识库中一类重要的知识类型,具有重要的应用价值。首先对因果关系的特殊性质进行了分析,然后基于语言场和广义归纳逻辑因果模型,从表示、挖掘、评价和应用几方面,对因果关联规则的研究进行了详细论述。并在此基础上提出了隐含因果关联规则的概念。通过语言场和推理机制的运用,使因果关联规则这一重要知识形式的挖掘和评价过程具有良好的逻辑性和扩张性。 相似文献
4.
随着数据挖掘技术的发展,其应用领域也越来越广。介绍了数据挖掘技术的概念,并将数据挖掘技术应用到雅姿美容美体中心,具体阐述使用关联规则分析对顾客所选择的服务进行挖掘,发现顾客同时选择的多种服务间的关联关系,这样有利于将多种服务组合起来进行促销,对雅姿美容美体中心及其他美容美体中心的运营具有重要指导意义。 相似文献
5.
电力调度数据挖掘后处理方法的研究 总被引:1,自引:0,他引:1
关联规则是数据依赖关系的有效描述方法,是知识发现研究的重要内容.然而,随着所挖掘数据库规模的增大,由传统数据挖掘算法所生成的大量关联规则常常令用户的使用与分析十分困难.文中提出了一种新方法来解决这个问题并将其运用到电力调度数据挖掘系统中.实验结果表明,该方法消除了大量冗余规则,并且使用户可以从整体上把握整个规则集,提高了关联规则挖掘的准确性和易用性. 相似文献
6.
7.
8.
一种改进的相联规则提取算法 总被引:3,自引:1,他引:3
相联规则的提取是数据挖掘的一个重要方面。Apriori算法是提取相联规则的经典算法,效率较高。AprioriPro算法是对Apriori算法的改进,它利用大项集生成过程中的中间结果对数据库进行过滤,从而加快候选项集的计数速度,提高了整个算法的效率。该文在AprioriPro算法的基础上,首先对其基本理论进行扩展并加以证明,提出了AprioriPro2算法。该算法相对于AprioriPro算法能更多地去掉数据库中的无效元组,从而进一步提高了算法的效率。 相似文献
9.
关联规则分析在电信交叉销售中的应用研究 总被引:3,自引:0,他引:3
在阐述电信运营企业市场竞争和营销活动中存在的问题的基础上,结合电信企业的特点,分析了在该行业营销领域采用交叉销售策略的必要性,并将数据挖掘中的关联规则分析法应用于交叉销售分析中.详细介绍了关联规则分析法中的Apriori算法原理,并用该算法对电信业务数据进行了分析,给出了业务之间的关联,为企业实施交叉销售提供了有力的数据支持. 相似文献
10.
11.
利用时态关联规则的分析,可以得到一系列相关性的项目集合,从而为决策提供更加有利的帮助和支持。在研究了传统的静态关联规则的基础上,提出了一种以交易规模的变化率为处理对象,即考虑各类项目交易量的变动状况的时态关联规则的表述与挖掘方法,并对其表述形式及算法实现进行了探讨。 相似文献
12.
数据过时是影响数据质量的重要因素,因此判定数据时效性对于提高数据质量至关重要.当前判定数据时效性的方法可分为两类:基于时间戳的方法和基于规则的方法.基于时间戳的方法要求精确完整的时间戳,但这样的时间戳在很多应用中不存在.基于规则的方法不要求时间戳,但现有方法均依赖于冗余元组,且不能对数据时效性做出定量判定.同时,这些方法均基于确定规则,无法表达不确定的领域知识.针对上述问题,提出不确定时效规则及相应的数据时效性模型.基于该模型,进一步给出了两个可定量地判定数据时效性的算法.同时,还给出了时效规则的学习算法.真实数据上的实验结果验证了算法的有效性. 相似文献
13.
14.
关联规则挖掘常常会产生大量的规则,这使得用户分析和利用这些规则变得十分困难。为了帮助用户做探索式分析,提出了一种基于距离的相关性关联规则优化方法,该方法从数学分析关联规则相关性概念公式的值的特点出发,通过根据关联规则结构上的相关性差别来挖掘出包括正负两种关联规则在内的更多潜在的相关规则,实验结果表明该方法有效且可靠。 相似文献
15.
介绍了关联规则的常用理论,研究了关联规则中的标准Apriori算法,针对其不足进行了有益的改进,提出了一种新的加权关联规则挖掘算法,并分析了其主要特点。通过把该算法用于电子商务数据挖掘中,并与标准Apriori算法的对比分析,证明了这种新的加权关联规则挖掘算法的有效性。 相似文献
16.
挖掘最大频繁模式的新方法 总被引:11,自引:0,他引:11
由于其内在的计算复杂性,挖掘密集型数据集的频繁模式完全集非常困难,解决方案之一是挖掘最大频繁模式集.该文在频繁模式完全集挖掘算法Opportune Project基础上,提出了挖掘最大频繁模式的新算法MOP.它采用宽度与深度优先相结合的混合搜索策略,能恰当地选择不同的支持集表示和投影方法,将闭合性剪裁和一般性剪裁相结合,并适时前窥,实现搜索与剪裁效率最优化.实验表明,MOP效率是MaxMiner的2~8倍,比MAFIA高2个数量级以上. 相似文献
17.
在关系数据库中,数据丢失现象常常是不可避免的。在不完全数据库中挖掘关联规则的关键问题是如何估算关联规则的支持度和置信度。给出了不完全数据库中关联规则挖掘的两种求估方法,并进行了简单的比较。 相似文献
18.
R. S. Michalski L. Kerschberg K. A. Kaufman J. S. Ribeiro 《Journal of Intelligent Information Systems》1992,1(1):85-113
The architecture of an intelligent multistrategy assistant for knowledge discovery from facts, INLEN, is described and illustrated by an exploratory application. INLEN integrates a database, a knowledge base, and machine learning methods within a uniform user-oriented framework. A variety of machine learning programs are incorporated into the system to serve as high-levelknowledge generation operators (KGOs). These operators can generate diverse kinds of knowledge about the properties and regularities existing in the data. For example, they can hypothesize general rules from facts, optimize the rules according to problem-dependent criteria, determine differences and similarities among groups of facts, propose new variables, create conceptual classifications, determine equations governing numeric variables and the conditions under which the equations apply, deriving statistical properties and using them for qualitative evaluations, etc. The initial implementation of the system, INLEN 1b, is described, and its performance is illustrated by applying it to a database of scientific publications. 相似文献
19.
20.
一种新的关联规则发现算法及应用研究 总被引:3,自引:0,他引:3
毛秉毅 《计算机工程与应用》2002,38(22):201-202
文章对关联规则发现中应用较多的Apriori算法和DHP算法进行了分析,提出了一种新的关联规则发现算法。为了计算项目集的支持度,提出了数据库特征矩阵和特征矢量的概念。该算法通过对特征矢量求内积得出项目集(item-set)的支持度,只需遍历数据库一次,大大减少了对数据库的操作,提高了算法的效率。算法分析和实例证明验证了算法的快速性和高效性。 相似文献