首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
徐佳 《信息与电脑》2022,(24):69-71
大数据集中挖掘正负关联规则是关联规则挖掘的重要研究内容。负关联规则挖掘存在挖掘关联规则数量多、难度大等问题,因此针对大数据集中挖掘正负关联规则提出一种基于OpenMP的Gibbs抽样正负关联规则挖掘算法。该算法通过Gibbs抽样从原始数据集中挖掘得到重要的关联规则,并在Gibbs抽样的转移概率计算部分利用OpenMP并行技术进行加速。在只挖掘重要正负关联规则的同时,缩短挖掘时间,有效提高正负关联规则挖掘的效率。在UCI蘑菇数据集中使用该算法,实验结果显示该算法在大数据集中具有较好的表现。  相似文献   

2.
夏英  刘婉蓉 《计算机应用》2008,28(12):3224-3226
现有的关联规则算法大多都致力于解决增量式更新问题,需要多次扫描数据集,无法对海量数据进行有效处理。针对此问题,提出了基于滑动窗口的关联规则增量式更新算法(SWIUA),利用滑动窗口进行数据更新,挖掘出用户感兴趣的关联规则。该算法只需要扫描原始数据集和更新的数据各一遍,降低了I/O时间;并采用优化策略对候选项集过滤和删除,提高了关联规则的挖掘性能,能有效处理大量新增数据。  相似文献   

3.
一种有效的隐私保护关联规则挖掘方法   总被引:23,自引:3,他引:23  
隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法.首先将数据干扰和查询限制这两种隐私保护的基本策略相结合,提出了一种新的数据随机处理方法,即部分隐藏的随机化回答(randomized response with partial hiding,简称RRPH)方法,以对原始数据进行变换和隐藏.然后以此为基础,针对经过RRPH方法处理后的数据,给出了一种简单而又高效的频繁项集生成算法,进而实现了隐私保护的关联规则挖掘.理论分析和实验结果均表明,基于RRPH的隐私保护关联规则挖掘方法具有很好的隐私性、准确性、高效性和适用性.  相似文献   

4.
针对分组无关问题模型存在隐私泄露的问题,提出一种改进的分组无关问题模型,采用随机响应的方法,通过对原始数据进行伪装变换处理,实现具有隐私保护的关联规则挖掘。实验结果表明,改进后的模型在伪装变换后的数据集上挖掘出的规则与原始数据规则相比,保证了低误差,具有较好的隐私保护性。  相似文献   

5.
阚莹莹  曹天杰 《计算机工程》2010,36(5):79-80,83
针对分组无关问题模型存在隐私泄露的问题,提出一种改进的分组无关问题模型,采用随机响应的方法,通过对原始数据进行伪装变换处理,实现具有隐私保护的关联规则挖掘。实验结果表明,改进后的模型在伪装变换后的数据集上挖掘出的规则与原始数据规则相比,保证了低误差,具有较好的隐私保护性。  相似文献   

6.
水平分布数据集的隐私保护关联挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
研究水平分布数据集的隐私保护关联规则挖掘算法。针对现有算法需要多次扫描数据集的缺点,提出一种只须对数据集进行2次扫描、基于分布式FP—tree的隐私保护挖掘算法。该算法可以有效降低通信量,能在保证准确度的同时保护原始数据。  相似文献   

7.
一种结合关联规则技术在数据库中挖掘分类规则的方法   总被引:3,自引:0,他引:3  
在数据库中发现分类规则是数据挖掘的一个重要内容,由于数据集往往由不精确数据组成,所以数据集不能截然划分为正例集和反倒集,因而无法直接采用示例学习的方法发现分类规则。本文结合关联规则技术,将原始数据集转换为决策表,使决策表具有无噪声和代表性高的特点,通过对决策表进行示例学习便可以挖掘出分类规则。  相似文献   

8.
对垂直分布于不同站点的数据进行联合关联规则挖掘是一个重要的研究方向,然而已有的算法挖掘得到的都是全局单维关联规则,不能处理多维数据集并得到全局多维关联规则。针对此问题提出一种数据两方垂直分布条件下的多维关联规则挖掘算法TDDM(Two Part Vertically Distributed Data Mining),该算法结合数据立方体技术,直接在垂直分布于两方的数据上进行挖掘,得到多维关联规则。理论分析和实验结果表明,该算法可以有效挖掘数据两方垂直分布条件下的多维关联规则。  相似文献   

9.
梁循 《微机发展》2006,16(3):1-4
提出了一种基于关联规则挖掘的聚类方法。首先,通讯行业客户行为的原始数据经过数据预处理转变为地区间的“距离”数据。其次,由于地区是“漂浮”的,不再是“刚体”,而是一种抽象的“柔性”距离,使用关联规则进行挖掘成为一种好的选择。文中对通讯行业客户行为进行了基于关联规则的建模,较好地嵌入了关联规则的框架。在数据实验后,提炼出了知识,发现东南亚客户聚成一类,以此为模式,得出了“在南美发展业务是错误的”的结论,该结论在挖掘之前是没有意料到的。实践上,该结论阻止了相应公司的南美发展计划,为公司度过后来的硅谷经济萧条时期省下了上百万美元的“战略储备”资金。  相似文献   

10.
基于基集与概念格的关联规则挖掘算法   总被引:2,自引:0,他引:2       下载免费PDF全文
陈湘  吴跃 《计算机工程》2010,36(19):34-36
传统关联规则挖掘算法的挖掘效率较低,且挖掘结果中存在大量冗余。针对该问题,提出一种基于概念格与基集的关联规则挖掘算法。利用规定种子项分布范围的基集代替原始数据库以缩小挖掘源规模,从而建立概念格快速求解出关联规则。实验结果表明,该算法在时间效率方面优于Base和Apriori算法。  相似文献   

11.
关联规则挖掘是经典的数据挖掘方法,越来越多的企业都把它看作是必不可少的战略分析工具。当前关联规则挖掘方法得到的规则过多,令用户在运用时难以理解,因此研究关联规则集的约简方法具有应用价值。研究了数据库模式中关键字包含的主属性对基于Apriori算法的关联规则挖掘产生的关联规则的影响,即部分函数依赖会导致关联规则挖掘的数据集中冗余信息的频繁出现,并产生没有实际价值的关联规则,识别并消除这样的规则就能实现规则集的约简。求全部主属性如同求所有候选关键字问题都是NP难题,因此提出了一种基于一个候选关键字进行验证的算法来判定主属性,从而完成基于主属性判定的关联规则挖掘约简算法的设计与实现,并在最后的实验中验证了该算法的有效性。   相似文献   

12.
模糊聚类在数量型关联规则提取中的应用   总被引:1,自引:0,他引:1  
王越  曹长修 《计算机仿真》2003,20(11):64-66,69
关系数据库中数量属性的关联规则挖掘问题是经常要遇到的问题。该文利用改进的FCM进行模糊聚类,主要是解决FCM算法的局部极小问题。利用聚类的结果可以使数量型属性关联规则向类别型属性转换,类别型属性再转化为布尔型属性,这样,便可以从许多关联规则的挖掘方法中找出有意义的规则。  相似文献   

13.
关系数据库中数量属性的关联规则挖掘问题是关联规则挖掘中经常要遇到的问题。该文利用遗传算法解决FCM模糊聚类问题主要是为了避免FCM算法的局部极小问题。利用聚类的结果可以使数量型属性关联规则转换成类别型属性,类别型属性再转化为布尔型属性,这样,即可以使用许多已有关联规则挖掘方法挖掘出有意义的规则。  相似文献   

14.
带结论域的关联规则的挖掘   总被引:3,自引:0,他引:3  
为了提高关联规则挖掘的效率和提高关联规则的准确率,提出了以rough set为基础的关联规则挖掘,该文系统介绍了两种挖掘算法的主要过程,并提出了带结论域的并联规则挖掘解决方法。  相似文献   

15.
张艳 《计算机时代》2009,(10):49-50,53
讨论了数据库中含有数量和类别属性的数据的关联规则挖掘方法。利用模糊集的理论与方法求解数量相关问题,给出了模糊概念关联规则挖掘算法Apriori_concept。  相似文献   

16.
Most methods for mining association rules from tabular data mine simple rules which only use the equality operator “=” in their items. For quantitative attributes, approaches tend to discretize domain values by partitioning them into intervals. Limiting the operator only to “=” results in many interesting frequent patterns that may not be identified. It is obvious that where there is an order between objects, operators such as greater than or less than a given value are as important as the equality operator. This motivates us to extend association rules, from the simple equality operator, to a more general set of operators. We address the problem of mining general association rules in tabular data where rules can have all operators {?, >, ≠, =} in their antecedent part. The proposed algorithm, mining general rules (MGR), is applicable to datasets with discrete-ordered attributes and on quantitative discretized attributes. The proposed algorithm stores candidate general itemsets in a tree structure in such a way that supports of complex itemsets can be recursively computed from supports of simpler itemsets. The algorithm is shown to have benefits in terms of time complexity, memory management and has good potential for parallelization.  相似文献   

17.
正态云关联规则在预测中的应用   总被引:25,自引:1,他引:24  
在信息处理领域,用数据挖掘方法发现关联规则和进行预测是两大热点,首先借助正态云模型来替代对数量属性论域的划分,并提出数量属性上的正态云关联规则的概念,接着给出挖掘正态云关联规则的方法,并利用已挖掘出的正态云关联规则进行预测,由于正态云模型较好地软化了数量属性论域的划分边界,从而使得挖掘出的正态云关联规则与预测的结果更容易被人理解。  相似文献   

18.
谢印宝  张佑生 《计算机工程》2000,26(12):150-151,154
在大数据库中确定关键条件属性集,是使用基于粗集理论的集合论生成分类规则算法的重要步骤。该文在简述分类规则形成算法的基础上,对确定关键条件属性集的模糊聚类算法进行了详细的讨论,并给出该方法应用的一个实例。  相似文献   

19.
数据集中的冗余属性会降低数据采掘结果的解释能力及精度。该文介绍了在非项目集类型的数据集中采掘聚类关联规则的基本原理,并利用RoughSet理论对属性间的归纳依赖关系进行了分析,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系的算法,使采掘出的关联规则的精度及解释能力都达到令人满意的水平。  相似文献   

20.
针对不确定性数据中模糊关联规则的挖掘问题,提出一种基于群搜索优化(GSO)算法优化隶属度函数(MF)的模糊关联规则挖掘方法。首先,将不确定性数据通过三元语言表示模型进行表示;然后,给定一个初始MF,并以最大化模糊项集支持度和语义可解释性作为适应度函数,通过GSO算法的优化学习获得最佳MF;最后,根据获得的最佳MF,利用改进型的FFP-growth算法来从不确定数据中挖掘模糊关联规则。实验结果表明,该方法能够根据数据集自适应优化MF,以此实现从不确定数据中有效地挖掘关联规则。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号