首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
刘波  潘久辉 《电子学报》2007,35(8):1612-1616
关联规则挖掘是数据挖掘领域中重要的研究分支,频繁项集或频繁谓词集的计算是其中的关键问题.本文针对包括多值属性的关系数据库,以多维关联规则挖掘为目标,研究频繁谓词集的计算方法,提出了MPG算法及IMPG增量算法.MPG算法通过构建频繁模式图MP-graph,按照深度优先搜索方法,动态挖掘频繁谓词集,只需扫描数据库一次.此外,该方法至多增加一次数据库扫描,就能扩展为IMPG算法,进行增量关联规则挖掘.文章分析了算法时间和空间性能,用实验说明了算法的有效性.  相似文献   

2.
数据挖掘是指从大量数据中发现潜在、有用知识的过程。关联规则是数据挖掘的一个主要研究内容,而如何提高挖掘算法的效率是关联规则数据挖掘的核心问题。Apriori算法是关联规则挖掘的经典算法,但是在实际应用Apriori算法的时间空间开销都很大。针对Apriori算法的局限性,从实际应用出发提出了多最小支持度算法,一方面降低候选项目集中候选项的数量;另一方面减少扫描数据库的次数。这种算法不仅降低了I/O负荷,而且减少了时间开销,具有较高的效率。  相似文献   

3.
张婷婷 《现代电子技术》2020,(1):99-101+106
为了提高音乐分类的精准性及个性化,提出基于关联规则的数据挖掘技术在音乐分类中的使用,解决单一轨道提取的局限性问题。首先,对音乐文件预处理进行分析,主要包括提取主旋律、分析和声;之后,对基于FPGrowth关联规则挖掘算法的音乐风格进行分析。因为FPGrowth算法只需要扫描两遍原始数据,对原始数据进行压缩具有较高的效率,所以将FPGrowth关联规则挖掘算法应用于音乐媒体的风格分类中,并且创建基于FPGrowth关联规则挖掘的音乐风格分类,减少所需频繁项集的数量,从而提高数据库扫描速度,在此过程中不需要候选项集,实现音乐分类过程中的数据挖掘;最后,对数据挖掘的效率进行Matlab测试,测试结果表示,相比基于LAD和Apriori算法的音乐风格分类,基于FPGrowth的音乐风格分类减少了I/O开销,提高了运行效率和分类的精准性。  相似文献   

4.
随着高校图书管理系统建设的不断发展,广大师生的图书借阅活动产生了大量的浏览数据。为了对以上借阅信息进行数据挖掘以便为读者提供更高水平的服务,提出一种基于数据挖掘技术的图书馆个性化快速推荐算法。首先对数据挖掘的主要方法和组织结构进行了介绍;然后对经典关联规则挖掘算法中的Apriori算法进行改进,提高了关联规则的运算效率;最后采用改进的Apriori算法对图书借阅历史数据进行关联分析,从而对读者做出个性化的推荐。实验结果表明,提出的图书馆个性化快速推荐算法具有较高的准确度和运行效率。  相似文献   

5.
现有数据挖掘算法的缺点是在挖掘大数据时会出现大量候选模式,从而造成可伸缩性瓶颈,个别算法虽然不生成候选模式,但是计算代价高昂,缺乏有效剪裁,运行效率存在瓶颈.为此,提出一个全新的单阶段不生成候选模式的数据挖掘算法,其创新性有3点:一是基于前缀生长的模式枚举和基于效用上限值评估的剪裁策略;二是基于稀疏矩阵和虚拟投影的效用信息表达;三是节省存储空间的深度优先搜索方法.大量实验表明,新算法的时间效率比现有算法高5倍以上,并且内存使用量比现有算法少20%~60%,可伸缩性高.  相似文献   

6.
在对现有增量关联规则更新算法进行讨论的基础上,针对只关注分类预测结果中的某些特定类别的应用,提出了一个改进算法.该算法通过对类别结果的限制,有效减少了算法在多维增量关联规则挖掘过程中扫描数据库的次数及使用的候选谓词集表中记录的个数,使算法具有更优的空间复杂度、更高的结果聚焦度.  相似文献   

7.
主要介绍基于Web Service技术的一个数据挖掘系统,在一个关联规则挖掘的并行算法—CD算法的基础上,结合一种基于动态数据集划分的并行关联规则挖掘算法,利用动态方式分配数据量,使每个处理器获得相同多的数据集,解决在网络中大量分散的数据因通信等问题而引起的负载平衡,从而提高了数据挖掘效率。  相似文献   

8.
为解决传统挖掘方法进行数据挖掘时,存在规定时间范围内数据挖掘量少,导致挖掘效率不高的问题,提出Apriori算法在无线网络数据智能挖掘中的应用研究.通过数据挖掘关联规则设计、基于Apriori算法的无线网络数据文本分类和无线网络数据离群点智能过滤,实现无线网络数据智能挖掘.通过实验证明,所提挖掘方法与传统方法相比挖掘效率得到明显提升.  相似文献   

9.
针对传统Apriori算法的不足之处,提出两种Apriori改进算法,分别基于构造辅助表和项集求交集策略。改进算法大幅度减少扫描数据库的次数,缩减对不必要事务的扫描时间,显著提高频繁项集的生成效率,从而使算法达到更高的运算效率。实验结果表明,两种改进算法都是有效的关联规则挖掘方法,且比Apriori算法性能更优,亦为关联规则挖掘研究提供了一些科学可行的新思路。  相似文献   

10.
冯婧垚  李兴明 《电信科学》2007,23(11):57-60
加权关联规则挖掘是告警相关性分析的重要手段.本文引入了比例加权支持度的概念,提出了一种基于加权关联模式树的加权关联模式挖掘算法.实验表明,本算法与MINWAL(O)算法相比,时间效率有了明显提高,节约了存储空间,告警相关性分析的准确性也得到了提高.  相似文献   

11.
关联规则挖掘是数据挖掘技术的一个重要分支,其中Apriori算法是最经典和最有影响力的算法。本文在讨论和分析了关联规则挖掘的基本概念后,提出了一种减少扫描数据库次数的改进算法。改进后的算法分析证明,它可以有效地提高数据挖掘的性能。  相似文献   

12.
提出了一个快速有效的增量更新挖掘多层关联规则算法MLARU,其基本思想是通过数据库和Web日志构建概念层次树,采用区间支持度的方法表示交叉层次的项集支持度,并采用根据层次树剪枝和增量更新的方法来挖掘多层关联规则。实验结果表明,该算法的效率得到了很好的改善,能在线为用户动态提供多层次个性化推荐。  相似文献   

13.
《现代电子技术》2018,(7):183-186
传统数据挖掘系统存在挖掘速率慢、时间长、数据可靠度低等问题,无法达到运动训练生化指标精准数据挖掘的标准,为此,对基于关联规则的运动训练生化指标数据挖掘系统进行设计。采用三层结构B/S模式,将后台的数据库存储以及挖掘的数据作为参考,设计系统硬件框架;选取数据并对数据进行预处理,采用关联规则数据挖掘算法完成系统软件部分设计;进行实验,验证系统设计的合理性。实验结果表明,该系统数据挖掘速率快、耗费时间短、可信度高,为运动生化指标数据挖掘提供了更加合理的评定标准。  相似文献   

14.
龙睿 《现代电子技术》2020,(14):170-172+176
针对当前电商大数据背景下的数据分类与挖掘中存在递归效率低、周期频繁、冗余度高等问题,文中提出一种基于人工智能的大数据分类和挖掘算法。该算法采用快速Spark架构,在将获取到的电商大数据进行智能Spark分类的基础上,通过设置根据数据管辖维度进行控制的纵向序列,可以在较大程度上提高数据挖掘的效率。在数据挖掘的过程中构建各类数据所对应的挖掘模式,从而能够在最短的时间内生成用户行为树,降低数据挖掘中的冗余度。在数据分类时,将用户行为树及其数据的集合进行依次映射,从而解决因频繁搜索导致的周期收敛困难的问题。使用旅游业电商数据对所提算法进行仿真验证,结果表明,该算法在数据挖掘中消耗时间短、准确度高。  相似文献   

15.
黄名选  蒋曹清 《电子学报》2018,46(12):3029-3036
主题漂移和词不匹配是自然语言处理中一个难题,文本挖掘与信息检索的结合有助于解决该问题.鉴于此,本文提出一种基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展算法.该算法采用新的完全加权正负项集支持度和关联度计算方法以及模式评价框架,对初检用户相关反馈文档集挖掘与原查询词相关的正负关联模式,从模式中提取扩展词实现跨语言查询译后扩展.与现有基于伪相关反馈、加权关联模式挖掘的跨语言扩展算法比较,本文算法能有效地减少查询主题漂移和词不匹配问题,提高跨语言信息检索性能;本文模式挖掘方法可用于推荐系统,提高其准确性.  相似文献   

16.
多维关联规则是数据挖掘中的一个重要研究方向,由此提出了一种高效的多维关联规则挖掘算法,该方法通过引入MDPI-tree(多维谓词索引树)结构,有效地将数据立方体技术和频繁项集挖掘算法FP-Growth结合起来,能用于挖掘维间和混合维关联规则.最后将此算法应用于移动通信交叉销售模型,通过实验验证算法的有效性和实用性.  相似文献   

17.
基于改进关联规则的网络入侵检测方法的研究   总被引:1,自引:1,他引:1  
研究关联规则的高效挖掘算法对于提高入侵检测的准确性和时效性具有非常重要的意义.针对现行的入侵检测方法建立的正常模式和异常模式不够准确、完善,容易造成误警或漏警的问题,本文将改进后的关联规则挖掘算法-XARM和关联规则增量更新算法-SFUP应用于网络入侵检测,提出了新的入侵检测方法,该方法通过挖掘训练审计数据中的频繁项集建立系统和用户的正常行为模型以及入侵行为模型.  相似文献   

18.
一种频繁项目集的快速挖掘算法   总被引:2,自引:2,他引:0  
关联规则是当前数据挖掘研究的主要领域之一,发现频繁项目集是关联规则数据挖掘中的关键问题。文章提出了一种快速挖掘频繁项目集的新方法FMFI(Fast Mining Frequent Itemsets)。针对关联规则下频繁项目集的特性,该算法摆脱了传统的自底向上的搜索策略,而采取了自底向上和自顶向下相结合的双向搜索方式,从而降低了扫描数据库的次数,提高了挖掘效率。  相似文献   

19.
关联规则的开采是数据挖掘中的一个重要问题,其核心是频繁模式挖掘。频繁模式挖掘算法的高效率性近年来是许多学者研究的方向。首先对关联规则挖掘问题进行了描述,其次对一种基于项目可辨识向量及其“与”运算设计的频繁项集快速挖掘算法SLIG进行了分析,最后利用二元关系矩阵及其项之间的二元关系数目,缩减候选频繁k项集的产生,提出了改进算法SLIG*,提高了SLIG算法的效率。  相似文献   

20.
Web挖掘是使用数据挖掘技术在www数据中发现潜在的、有用的模式或信息.关联规则是Web挖掘的一个重要研究领域.根据关联规则挖掘的要求与特点,结合遗传算法,提出一个有效的Web关联规则挖掘方法.实验结果表明,该算法在Web挖掘中具有一定的优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号