首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为改进基于数据库垂直表示的频繁项集挖掘算法的性能,给出了用索引数组方法来改进计算性能的思路.提出了索引数组的概念及其计算方法,并提出了一种新的高效的频繁项集挖掘算法Index-FIMiner.该算法大大减少了不必要的tidset求交及相应的频繁性判断操作,同时也论证了代表项可直接与其包含索引中的所有项集的组合进行连接,这些结果项集的支持度均与代表项的支持度相等,从而降低了这些频繁项集的处理代价,提高了算法的性能.实验结果表明,Index-FIMiner算法具有较高的挖掘效率.  相似文献   

2.
针对频繁项集挖掘存在数据和模式冗余的问题,对数据流最大频繁项集挖掘算法进行了研究。针对目前典型的数据流最大频繁模式挖掘算法DSM-MFI存在消耗大量存储空间及执行效率低等问题,提出了一种挖掘数据流界标窗口内最大频繁项集的算法MMFI-DS,该算法首先采用SEFI-tree存储包含在不断增长的数据流中相关最大频繁项集的重要信息,同时删除SEFI-tree中大量不频繁项目,然后使用自顶向下和自底向上双向搜索策略挖掘界标窗口中一系列的最大频繁项集。理论分析与实验表明,该算法比DSM-MFI算法具有更高的效率,并能节省存储空间。  相似文献   

3.
丁邦旭 《硅谷》2012,(5):152-153
数据流的特点要求挖掘算法只能经过一次扫描获得挖掘结果,并且要求较低的空间复杂度。结合数据流的特点,提出一种基于滑动窗口的数据流频繁项集挖掘新算法MFIM。该算法采用二进制向量矩阵表示滑动窗口中的事务序列,以这种新的结构来记录频繁项集的动态变化,有效地挖掘数据流频繁项集。理论分析与实验结果表明该算法能获得较好的时间复杂度与空间复杂度。  相似文献   

4.
鉴于频繁项集存在数据和模式冗余的问题,挖掘数据流最大频繁项集的算法引起了极大的关注,本文提出了一种挖掘数据流滑动窗口内最大频繁项集算法——MMFI-SW算法。该算法首先使用类似FP-tree的数据结构记录最新到达的数据流信息,同时删除过时的数据和大量的不频繁项目,然后设计一个创新的方法有效地从数据流滑动窗口中输出最大频繁项集。理论分析与实验结果表明,MMFI-SW算法具有较低的时间复杂度。  相似文献   

5.
针对用于数据流频繁项集挖掘的现有方法存在引入过多次频繁项集以及时空性能与输出精度较低的问题,利用Chebyshev不等式,构造了项集频度周期采样的概率误差边界,给出了动态检测项集支持度变化方法.提出了一种基于周期采样的数据流频繁项集挖掘算法FI-PS,该算法通过跟踪项集支持度变化确定项集支持度的稳定性,并以此作为调整窗口大小以及采样周期的依据,从而以一个较大的概率保证项集支持度误差有上界.理论分析及实验证明该算法有效,在保证挖掘结果准确度相对较好的条件下,可获得较优执行性能.  相似文献   

6.
提出了一种改进的基于fp-tree的Apriori算法.该算法先用尾元将fp-tree分区,生成数据量更小的子数据集,再动态删除冗余数据将子数据集的数据进一步压缩,最后通过扫描子数据集进行支持数统计,从而快速挖掘.实验结果表明,在对含有大量高维度数频繁项集的数据集进行挖掘时,这个改进算法的挖掘速度较快.  相似文献   

7.
王蕾 《硅谷》2011,(24):69-70
安全运营中心SOC(Security Operation Center)是安全管理体系中的核心平台,而关联分析引擎则是SOC中的核心内核,设计并实现一种关联分析引擎的原型,创新地将序列模式挖掘中的Carma算法应用在引擎中,并对算法进行改进,提出在原算法第一步中限定当前交易子集v的长度及减弱v被插入集合V的条件,显著减少频繁项集挖掘所产生的模式数量,提高挖掘速度,该引擎能够有效的消除或减少重复及冗余报警,并能从海量数据中对多步攻击的报警事件进行逻辑关联,发现隐藏的攻击策略,自动产生关联规则并具有预警功能。  相似文献   

8.
针对逆向工程领域截面数据预处理中的多轮廓排序问题,提出了一种简便有效的链表法.该算法分为粗排序和精确排序两步,首先通过极角进行粗排序,然后利用带有访问标记的链表来完成精确排序.通过实例表明,链表法能够对截面单轮廓数据和多轮廓数据实现有效地排序.这为逆向工程中后续的曲线拟合和曲面重构奠定了基础.  相似文献   

9.
Apriori算法是当前使用最广泛的关联规则挖掘方法中最为经典的算法之一;但是该算法需要反复的扫描数据库,在I/O上花消很大,并且在得到频繁-2项集的过程中会产生庞大的候选-2项集,其次在筛选得到频繁-k项集时,并没排除那些不应该参组合的元素,而导致该算法效率很低,针对上面影响计算效率的三个方面提出基于压缩事务矩阵相乘得到频繁项目集的算法,只需一次扫描数据库,经过压缩处理产生产生事务矩阵,通过矩阵间运算得到频繁项目集,有效提高了关联规则的挖掘效率。  相似文献   

10.
尽管邻接矩阵是有穷自动机的一种常用存储方法,但是,邻接矩阵并不适合存储所有类型的有穷自动机.原因是两个状态间可能有两条以上同方向的弧,而邻接矩阵只能记录两个状态间存在的一条弧.所以,有穷自动机的存储结构最好采用邻接链表来存储.将此数据结构应用于NFA转换为DFA的计算,将传统的子集法中状态转换矩阵,由三维数组降低为二维数组.  相似文献   

11.
胡俊 《硅谷》2010,(21):175-175
随着数据库技术的发展,高效的数据挖掘算法有助于人们重新认识数据、理解数据。基于FP-树的关联规则挖掘算法FP-growth是当前应用最广的一种挖掘频繁项目集的算法。本文简要描述了该算法的几种主要发展方向。  相似文献   

12.
本文以多冷水机组系统为研究对象,对系统采集的大量历史运行数据进行数据处理与分析,采用Apriori频繁项集算法,通过分级挖掘,挖掘在不同运行工况下各台冷水机组运行参数与最小运行能耗之间的关联规则,并以机组运行总能耗最小为目标,提出了一种将粒子群算法与关联规则结合的负荷分配优化方法.仿真验证结果表明:该方法通过优化冷水机...  相似文献   

13.
对于连续频繁访问路径的挖掘如果采用常见的序列模式挖掘算法, 挖掘效率是比较低的, 而且只能得到频繁访问路径. 本文在研究访问路径性质的基础上给出了一种能从普通 Web 日志中挖掘出连续频繁访问路径的算法. 设计了一种新颖的数据结构压缩存储空间及存储所需挖掘信息. 同时采用分区搜索的方式, 为每个频繁节点构造一棵后缀树, 通过遍历该后缀树挖掘出连续频繁访问路径. 采用这种方法进行挖掘, 无需生成候选集, 而且一次就可以挖掘出所有以根节点为后缀的连续频繁访问路径.  相似文献   

14.
用分段法与链表法的二维布尔运算   总被引:5,自引:0,他引:5  
二维布尔运算是计算机图形学中的基本算法。通过把两个二维几何形体分别按入点与出点位置顺序分段,组合成一个新的图形,形成了—种新的二维布尔运算算法:分段法。笔者介绍了分段法的几何原理和基本步骤,并利用面向对象技术实现复杂数据结构操作的基本方法——链表法实现了常用的二维布尔运算算法,并将两种方法作了比较。  相似文献   

15.
针对生物网络中频繁子图的挖掘问题,提出了一种基于FP-树结构的MaxFP算法.此算法以代谢路径作为研究对象,在适合于生物网络图简化模型的基础上,采用一种不产生候选集的改进FP-growth算法挖掘生物网络中的闭合频繁子图.此算法考虑了基于频繁项目集的算法应用于网络的缺陷,根据生物网络的特点对FP-growth算法进行了改进.实验证明,提出的MaxFP算法比基于Apriori的频繁模式挖掘算法运行速度快,不仅能挖掘出最大的频繁子图,且能找到更多具有生物意义的频繁子图.  相似文献   

16.
基于指纹结构特征信息匹配的算法   总被引:5,自引:0,他引:5  
苑玮琦  李宏伟 《光电工程》2006,33(7):101-104,109
为了克服指纹识别中常见的问题,本文提出一种基于指纹结构特征信息匹配的算法。该算法利用改进的Bresenham算法求得指纹分叉点间连线所穿越的脊线个数和分叉点结构特征信息,得到模板指纹和待识指纹的结构特征信息矢量数组;运用二分图的完美匹配算法,得到矢量数组的匹配度。对该匹配度进行评估,如果高于某一个闽值,则认为指纹匹配成功;否则,则认为不是同一指纹。该算法在实际应用中取得较好的效果。  相似文献   

17.
以电子商务为依托,应用数据挖掘技术,经过可行性分析,设计的网上书店系统是基于VisualStudio.Net环境,应用ASP.NET技术,其后台代码使用c群来实现的。详细介绍Ariori算法挖掘布尔关联规则频繁项集。该系统具有通常网上书店的常用功能,如用户管理、新书上架、分类查找、图书检索、图书收藏夹、购买流程、销售排行、图书评论,网站管理等。  相似文献   

18.
宋凌云 《硅谷》2011,(1):12-13
首先由简单问题引入约瑟夫问题,然后用单向循环链表解决约瑟夫问题,最后对模拟方法及数学方法的优劣性进行分析,从而为研究人员和开发人员基于性能选择使用算法解决约瑟夫问题的实例提供依据。  相似文献   

19.
徐娟 《硅谷》2013,(7):113-113,75
本文根据硬盘分区链表、主引导扇区、分区结点的结构和特点,提出一组对分区链表进行恢复的方法。  相似文献   

20.
一种快速的间接关联挖掘算法   总被引:1,自引:1,他引:0  
给出了一个基于候选间接关联反单调性和频繁项目对支持矩阵的不需要生成所有频繁集的直接挖掘项目对之间间接关联的挖掘算法,并在一个Web log的真实数据集上进行了试验,与现有算法的比较表明该算法具有更好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号