首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 390 毫秒
1.
针对用于数据流频繁项集挖掘的现有方法存在引入过多次频繁项集以及时空性能与输出精度较低的问题,利用Chebyshev不等式,构造了项集频度周期采样的概率误差边界,给出了动态检测项集支持度变化方法.提出了一种基于周期采样的数据流频繁项集挖掘算法FI-PS,该算法通过跟踪项集支持度变化确定项集支持度的稳定性,并以此作为调整窗口大小以及采样周期的依据,从而以一个较大的概率保证项集支持度误差有上界.理论分析及实验证明该算法有效,在保证挖掘结果准确度相对较好的条件下,可获得较优执行性能.  相似文献   

2.
王希馗 《硅谷》2011,(10):191-192,157
利用Apriori算法和FP-growth算法挖掘密集型数据集的全部频繁项集代价高昂,针对该问题提出一种基于链表数组的关联规则挖掘算法,该方法使用链表数组为每个项目建立事务链表,只需要扫描数据库1次,就能够快速得到每个候选项的支持度,从而有效的发现频繁项集。通过与经典算法分析对比表明,该算法具有较快的挖掘速度。  相似文献   

3.
提出了一种改进的基于fp-tree的Apriori算法.该算法先用尾元将fp-tree分区,生成数据量更小的子数据集,再动态删除冗余数据将子数据集的数据进一步压缩,最后通过扫描子数据集进行支持数统计,从而快速挖掘.实验结果表明,在对含有大量高维度数频繁项集的数据集进行挖掘时,这个改进算法的挖掘速度较快.  相似文献   

4.
鉴于频繁项集存在数据和模式冗余的问题,挖掘数据流最大频繁项集的算法引起了极大的关注,本文提出了一种挖掘数据流滑动窗口内最大频繁项集算法——MMFI-SW算法。该算法首先使用类似FP-tree的数据结构记录最新到达的数据流信息,同时删除过时的数据和大量的不频繁项目,然后设计一个创新的方法有效地从数据流滑动窗口中输出最大频繁项集。理论分析与实验结果表明,MMFI-SW算法具有较低的时间复杂度。  相似文献   

5.
针对频繁项集挖掘存在数据和模式冗余的问题,对数据流最大频繁项集挖掘算法进行了研究。针对目前典型的数据流最大频繁模式挖掘算法DSM-MFI存在消耗大量存储空间及执行效率低等问题,提出了一种挖掘数据流界标窗口内最大频繁项集的算法MMFI-DS,该算法首先采用SEFI-tree存储包含在不断增长的数据流中相关最大频繁项集的重要信息,同时删除SEFI-tree中大量不频繁项目,然后使用自顶向下和自底向上双向搜索策略挖掘界标窗口中一系列的最大频繁项集。理论分析与实验表明,该算法比DSM-MFI算法具有更高的效率,并能节省存储空间。  相似文献   

6.
丁邦旭 《硅谷》2012,(5):152-153
数据流的特点要求挖掘算法只能经过一次扫描获得挖掘结果,并且要求较低的空间复杂度。结合数据流的特点,提出一种基于滑动窗口的数据流频繁项集挖掘新算法MFIM。该算法采用二进制向量矩阵表示滑动窗口中的事务序列,以这种新的结构来记录频繁项集的动态变化,有效地挖掘数据流频繁项集。理论分析与实验结果表明该算法能获得较好的时间复杂度与空间复杂度。  相似文献   

7.
本文以多冷水机组系统为研究对象,对系统采集的大量历史运行数据进行数据处理与分析,采用Apriori频繁项集算法,通过分级挖掘,挖掘在不同运行工况下各台冷水机组运行参数与最小运行能耗之间的关联规则,并以机组运行总能耗最小为目标,提出了一种将粒子群算法与关联规则结合的负荷分配优化方法.仿真验证结果表明:该方法通过优化冷水机...  相似文献   

8.
空间调制是一种高数据速率、低复杂度的多输入多输出无线传输技术,因其发射天线被信息序列随机激活,若被激活的信道状态不佳将导致系统误码性能下降.于是,提出一种结合天线选择和索引组合映射调制的传输方案.该方案将传统空间调制的激活天线索引比特和星座符号索引比特组合映射为一个新的调制符号,结合天线选择算法确定最佳发射天线子集,将新的调制符号通过最佳信道进行传输.在算法实现过程中采用了奇异值分解和硬限制检测等方法降低计算复杂度.实验分别仿真了两种天线选择算法下的系统性能.结果表明,提出的方案比传统的空间调制系统具有更好的误比特率特性.  相似文献   

9.
Apriori算法是当前使用最广泛的关联规则挖掘方法中最为经典的算法之一;但是该算法需要反复的扫描数据库,在I/O上花消很大,并且在得到频繁-2项集的过程中会产生庞大的候选-2项集,其次在筛选得到频繁-k项集时,并没排除那些不应该参组合的元素,而导致该算法效率很低,针对上面影响计算效率的三个方面提出基于压缩事务矩阵相乘得到频繁项目集的算法,只需一次扫描数据库,经过压缩处理产生产生事务矩阵,通过矩阵间运算得到频繁项目集,有效提高了关联规则的挖掘效率。  相似文献   

10.
李琼  刘亚玲 《硅谷》2010,(6):79-79
对XML数据建立有效索引,是左右XML数据处理性能的重要因素.提出在内存是限定的情况下,进行XML结构摘要查询的restri(k)-index结构索引.该方案提出一个代价函数,并设计出一组扩展的基本操作和实现算法,在限定内存中作出合理的结构索引满足结构查询需要.初步的实验结果显示,该方法具有良好的性能,它为路径查询处理提供更多的选择。  相似文献   

11.
Frequent pattern mining is the most important phase of association rule mining process because of its time and space complexity. Several methods have attempted to improve the performance of association rule mining by enhancing frequent pattern mining efficiency. Due to the large size of the data-sets and huge amounts of data which should be mined, many parallel and distributed mining approaches have been introduced to divide data-sets or to distribute mining processes between multiple processors or computers and thus, improve the efficiency of the mining process. In this paper, we propose a hadoop-based parallel implementation of PrePost+ algorithm for frequent itemset mining. In our parallel approach, the process of constructing N-Lists of itemsets has been distributed between the mappers and the operation of the final pruning process and extracting frequent itemsets has been carried out by reducers in a map-reduce parallel programming model. The experimental results show that our hadoop-based PrePost+(HBPrePost+) algorithm outperforms one of the best existing parallel methods of frequent itemset mining (PARMA) in terms of execution time.  相似文献   

12.
为实现在大型事务数据库中挖掘有价值的序列数据,提出了一种基于位图的高效的序列模式挖掘算法(SMBR)。SMBR算法采用位图表示数据库的方法,提出一种简化的位图表示结构。该算法首先由序列扩展和项扩展产生候选序列,然后通过原序列位图和被扩展项位图位置快速运算生成频繁序列。实验表明,应用于大型事务数据库,该方法不仅能有效地提高挖掘效率,而且挖掘处理过程中产生的临时数据所需的内存大大降低,能够高效地挖掘序列模式。  相似文献   

13.
基于响应面法和Morgenstern-Price法土坡可靠度计算方法   总被引:5,自引:0,他引:5  
基于响应面法,建立了一种高效的边坡可靠度指标和失效概率近似计算方法。该法在构造响应面函数时,抽样点计算采用Morgenstern-Price法取代传统费时的有限单元法,大大降低了计算工作量。利用Monte-Carlo随机抽样原理,提出了一种能同时确定边坡最危险非圆弧滑动面和最小可靠度指标的随机搜索新算法。该文给出的两个算例验证了方法的实用性和可靠性,其计算结果同时表明:当分别以最小可靠度指标和最小中值安全系数为目标函数时,搜索到的边坡最危险滑动面相差较大。最后,探讨了土性指标(c,φ)的分布概型及相关性对边坡可靠度计算结果的影响。  相似文献   

14.
This paper proposes an efficient algorithm for computing the dynamic responses of one-dimensional periodic structures and periodic structures with defects. It uses the symmetric property of the periodic structure and the energy propagation feature of the dynamic system to analyze the algebraic structure of the matrix exponential corresponding to one-dimensional periodic structures and periodic structures with defects. By using the special algebraic structure of this matrix exponential and the precise integration method, an efficient and accurate algorithm is proposed for computing the matrix exponential corresponding to one-dimensional periodic structures or periodic structures with defects. Hence an efficient method is presented for computing the dynamic responses of one-dimensional periodic structures and periodic structures with defects. It is accurate, efficient and saves memory.  相似文献   

15.
Wu YD  Shen DS  Bykovsky VK  Rosetti J  Fiddy MA 《Applied optics》1994,33(32):7572-7578
Digital optical computing executed on arrays of binary data can offer parallel processing and multivalued output, which permits more flexibility in algorithm development. The hardware used consists of two computer-controlled magneto-optic spatial-light-modulator arrays in conjunction with a CCD detector array as the computational hardware. Algorithms for binary-processing tasks are presented. We used magneto-optic spatial light modulators for parallel processing in a way that exploits multivalued output. Also, in carrying this evaluation out, we developed a new and efficient multiplication algorithm. Multiplication is an important operation in many digital systems, and the design of fast multipliers is of great interest to computer scientists and engineers. The speed of this computing system is evaluated.  相似文献   

16.
驾驶员语音增强质量的评价指标是保证语音增强算法性能的关键,而现有的语音增强质量评价方法不能准确地反映人对声音感知的主观性。针对上述问题,分析了言语可懂度指数对语音增强算法评价的适用性,并在某品牌汽车上进行实验。通过在汽车内建立均匀线性传声器阵列来对驾驶员语音进行信号采集,然后利用波束形成算法对阵列中不同传声器组合的语音信号进行增强,得到汽车在不同行驶速度时不同阵列组合的语音增强结果。使用信噪比和言语可懂度指数分别对实验得到的语音增强结果进行评价,结果表明言语可懂度指数更适合评价汽车内驾驶员的语音增强算法的性能。  相似文献   

17.
针对高维聚类算法--相交网格划分算法GCOD存在的缺陷,提出了基于密度度量的相交网格划分聚类算法IGCOD.IGCOD算法对相交网格的尺寸进行控制,重新定义更为合理的密度度量方法,根据密度期望值来合并两个相交的网格.理论分析和实验证明,相对于GCOD算法,基于密度度量的相交网格划分聚类算法IGCOD在性能上有显著的提高.  相似文献   

18.
对于连续频繁访问路径的挖掘如果采用常见的序列模式挖掘算法, 挖掘效率是比较低的, 而且只能得到频繁访问路径. 本文在研究访问路径性质的基础上给出了一种能从普通 Web 日志中挖掘出连续频繁访问路径的算法. 设计了一种新颖的数据结构压缩存储空间及存储所需挖掘信息. 同时采用分区搜索的方式, 为每个频繁节点构造一棵后缀树, 通过遍历该后缀树挖掘出连续频繁访问路径. 采用这种方法进行挖掘, 无需生成候选集, 而且一次就可以挖掘出所有以根节点为后缀的连续频繁访问路径.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号