首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
敏感性关联规则的隐藏是最大程度地保持原始数据集的其他特征,保证敏感规则不被挖掘出来.针对已有的基于对原始数据集中事务修改的方法产生大量I/O操作的问题,提出了基于频繁模式树(FP-tree)的敏感性关联规则隐藏的方法.该方法首先利用FP-tree存储了与事务数据库相关的全部信息,减少了产生和测试候选集耗费的大量时间;再利用改进的频繁模式树(IFP-tree)是单向的,快速挖掘出最大频繁项目集,确定敏感性关联规则;然后删除敏感关联规则对应的频繁项目集,更新IFP-tree项目集节点和相应的项目头表的计数,对更新的IFP-tree反向挖掘生成新的不包含敏感关联规则的事务数据库.实例和理论分析表明,该方法是正确和高效的.  相似文献   

2.
对关联规则的数据挖掘和遗传算法进行了介绍,提出了一种采用遗传算法的关联规则提取方法,并以交通事故的原因分析为例,进行了关联规则挖掘.  相似文献   

3.
基于数值属性的关联规则的挖掘   总被引:1,自引:0,他引:1  
研究了基于数值属性的关联规则的挖掘问题,提出了挖掘算法Q-Basic和Q-AR,试验表明Q-AR是有效的。  相似文献   

4.
研究了基于数值属性(QuantitativeAtribute)的关联规则的挖掘问题,提出了挖掘算法Q_Basic和Q_AR,试验表明Q_AR是有效的。  相似文献   

5.
对关联规则的数据挖掘和遗传算法进行了介绍,提出了一种采用遗传算法的关联规则提取方法,并以交通事故的原因分析为例,进行了关联规则挖掘.  相似文献   

6.
关联规则挖掘方法是Web挖掘的主要方法之一,本文在讨论了关联规则挖掘方法的一般知识后,重点研究了基于Web的兴趣关联规则挖掘技术.通过该技术可挖掘出访问者的兴趣爱好等信息,帮助网站经营者调整经营策略,提高网站的访问效率.  相似文献   

7.
针对并行关联规则挖掘算法不能有效的解决负载平衡的问题,在CD算法的基础上,介绍了一种基于动态数据集划分的并行关联规则挖掘算法.它根据各个节点的反馈来决定向每个节点分配的数据集大小.与静态的数据集划分相比,它能更好地实现负载平衡,提高并行数据挖掘的效率.  相似文献   

8.
基于概念层次的关联规则挖掘算法   总被引:4,自引:0,他引:4  
在经典关联规则挖掘算法的基础上,给出了带有概念层次的事务数据的关联规则有效挖掘算法,并通过实验,给出算法执行效率的分析。结果表明,该算法能得到有效的基于概念层次的关联规则。  相似文献   

9.
传统的关联规则算法要对数据库进行多次扫描,效率低下。使用MapReduce模型对Apriori算法进行改进,这种改进后的算法只需对数据库进行2次扫描,从实验结果可以看出挖掘效率得到明显提高。  相似文献   

10.
以Windows 2000系统日志作为挖掘对象,利用Apriori算法找出其中蕴涵的关联规则,并用VB实现.  相似文献   

11.
1 INTRODUCTIONDatamining (DM )istheprocessofextractingvaluableknowledgehiddeninlargevolumesofrawda ta[1 15] .Aneffectivedataminingmethodshoulden abletheuserstoexplorethedatawarehouse ,selectallkindsofrelativedata ,conductanalysisatdifferentlevelsandfinally publishknowledgeinvariousfor mats.However ,theabundanceofthedatainthedatawarehouse(DW )canalsoaffecttheefficiencyofDM ,thereasonofwhichliesinthefollowingaspects[2 4 ] :1)agreatnumberofdataoftenresultinmultiplescanintheDWandtherefor…  相似文献   

12.
基于差分扩张和差分平移提出了一种新的无损信息隐藏算法。在按照一定的顺序扫描图像得到一个灰度序列后,用该算法计算序列中任意2个相邻像素之间的差分,将差分大于K-1(K是由用户根据嵌入容量所选择的一个正整数)的向右扩张,差分小于-K的向左扩张,介于-K、K-1之间的差分用来隐藏信息。并通过适当调整图像灰度使得嵌入信息后差分的改变均匀分布在2个像素上,保证了较好的图像质量。与目前几种常见算法进行比较发现,本文算法在保持相同峰值信噪比的基础上,能够嵌入更多的信息。  相似文献   

13.
针对甲状腺电子病历数据量大、更新速度快的特点,提出了一种挖掘有效关联规则的技术.该技术运用区间归并法与特征区间法相结合的离散化方法对病历中的数据进行预处理;在规则生成的核心算法中,提出了优化的增量更新FUP算法,算法通过对新旧数据库设定不同的支持度得到病历各属性间的关联规则.实验验证了改进算法的有效性,挖掘结果对了解疾病的诊断、治疗、发展规律有重要价值,对医学研究有重要意义.  相似文献   

14.
高校图书馆借阅数据的关联规则挖掘研究   总被引:1,自引:0,他引:1  
戚敏 《广西工学院学报》2007,18(4):77-80,90
为了向读者提供图书推荐的个性化服务,阐述了使用数据挖掘技术为高校图书馆的业务管理工作提供决策参考的设计思想及实现过程,并完成了图书馆关联规划挖掘系统的设计与实现。本文采用一种改进的Apriori算法对图书馆学生的借阅历史数据进行挖掘分析,得到了很多关联规则,以从中发现读者对资源的借阅模式,为图书馆信息服务、信息资源采集提供了科学决策的有效方法。  相似文献   

15.
将关联规则数据挖掘的方法运用到教学评价中,从教学评价数据中挖掘有助于提高教学质量的相关信息。确定了教学评价的影响因素,给出了数据挖掘设计步骤。运用关联规则中Apriori算法,寻找教学评价成绩与教师基本情况之间的关系,为教师提供有价值的参考,帮助教学部门进行决策,从而更好地开展教学工作。  相似文献   

16.
关联规则挖掘算法中常用的支持度和可信度是对关联规则在统计意义上的有效性度量,在挖掘结果的有用度上缺乏指导作用,它们不能作为有用性的指标.从数据挖掘的最终目的出发定义了基于最终用户实际目标的效益度指标,并对最小效益度筛选性质进行了论证,提出了一种快速有效的关联规则挖掘算法.讨论了从关联规则的兴趣模板和限制模板转换到效益度的方法.实验结果表明,效益度指标具有支持度与可信度不可替代的作用;该算法的最小效益度剪切技术是有效的,不仅可以较大幅度地提高算法速度,而且可以作为规则模板的统一实现算法以及提供更精确的控制.  相似文献   

17.
高效关联规则数据挖掘算法研究   总被引:4,自引:0,他引:4  
关联规则挖掘是数据挖掘领域的一个重要问题,由于关联规则挖掘通常是基于超大型数据库或数据仓库,算法的效率在一定程度上决定挖掘的成败,针对关联规则挖掘中的主要任务--频集发现过程中存在的几个问题,提出了项目树的概念,引出了一种新的控制模式,并设计了相应的高效挖掘算法,大大提高了挖掘效率。  相似文献   

18.
间接关联是数据挖掘领域中一种数据项之间的关联关系,为了有效地应用于市场营销、智能数据分析、web日志分析等领域,给出了一个基于频繁项目对支持矩阵直接生成频繁项目对之间候选间接关联的挖掘算法(TRISCAN-IA)。该算法只需要3次扫描数据集即可找出所有的间接关联,从而提高了算法的运行效率、在一个web log的真实数据集上进行了试验,与现有算法的比较表明,该算法具有更好的性能。  相似文献   

19.
海量数据上挖掘关联规则的并行算法   总被引:3,自引:0,他引:3  
针对目前关联规则挖掘算法中数据库规模很大时算法执行时间太长的问题。指出了并行计算是解决该问题的一个有效方法。利用新提出的可以忽略仅仅在少于1/4的结点机上的局部频繁项集,给出了一种新的并行随机抽样方法,并利用机群并行计算机的自治能力和I/O高度并行的特点,提高了抽样算法对海量数据的处理能力和效率。理论分析和实验数据显示,该算法的加速比接近于处理机的个数p,通信复杂性为处理机的个数p的对数,具有良好的扩展性和海量处理能力,且精确度较高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号