首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
多数基于FP-growth思想的频繁模式挖掘算法存在建树过程复杂、支持度计算繁琐的问题。针对这些问题,提出一种基于位编码链表(Bitmap-Code List,BC-List)的频繁项集挖掘算法(BC-List Frequent Itemsets Mining,BCLFIM)。该算法首先采用基于位图表示的节点编码模型生成位图树(BC-tree),以BC-tree的节点信息作为数据结构通过按位运算来快速获取BC-List的节点集,避免了复杂的交集运算,提高了连接效率;其次通过使用超集等价和支持度计数剪枝策略,缩小了挖掘频繁模式的搜索空间。实验结果证明,该算法相比于FIN算法和DFIN算法具有更快的挖掘速度。  相似文献   

2.
频繁模式挖掘的模式数量通常过于巨大,在实际应用中只有少量的频繁模式被使用。Top-k频繁模式挖掘通过排列模式频数限制频繁模式的数量,有效提高了算法效率。提出了TPN(Top-k-Patterns based on Nodesets)算法,该算法使用了节点集的概念,将数据压缩于Poc-tree,通过Top-k-rank表重新计算最小支持度限制生成候选模式的数量。实验通过与ATFP,Top-k-FP-growth算法比较,证明该算法有较好的效率。  相似文献   

3.
社区发现是复杂网络研究中的一项重要研究内容,基于节点相似度的凝聚方法是一种典型的社区发现方法。针对现有节点相似度计算方法中存在的不足,提出一种基于多层节点的节点相似度计算方法,该方法既可以有效地计算节点之间的相似度,又可以解决节点相似度相同时的节点合并选择问题。进一步基于这种改进的节点相似度计算方法和团体之间的连接紧密度度量准则构建社区发现模型,并在真实世界的网络上进行社区发现实验。与GN算法、Fast Newman算法和改进的标签传播算法的实验结果相比,该模型可以更加准确地找到各个社区的成员。  相似文献   

4.
针对配电自动化终端优化布局问题,提出了一种基于重要度排序的终端优化布局方法。首先以等年值综合费用为目标函数,供电可靠性和投入产出比为双重约束建立了配电自动化终端优化布局模型。然后通过分析配电自动化终端对供电可靠性提升的影响,给出各个节点的“二遥”及“三遥”终端安装重要度定义及计算公式。最后采用枚举法确定最优终端安装数量,基于节点终端安装重要度排序确定终端的最优安装位置。该方法考虑了已布局节点对剩余节点终端安装重要度的影响,能够在降低计算量的同时兼顾布局合理性。运用所提方法RBTS-BUS2系统及扩充模型进行终端优化布局并与智能优化算法的布局结果进行对比,验证了本文方法的有效性及优越性。  相似文献   

5.
为了精确建模Internet自治系统层面上的拓扑结构,提出了基于最小节点度和最大节点度的拓扑幂律模型及其参数估计新算法。针对Internet自治系统层拓扑实际测量数据,利用新算法对拓扑幂律模型中的最小节点度、最大节点度以及标度参数进行计算。实验结果表明,由新算法估计的Internet自治系统层拓扑幂律模型的最小节点度为1,最大节点度随网络规模的增大而增大,标度参数的误差与使用最大然似估计法误差一样均非常小,约为2.25。  相似文献   

6.
针对传统的BP神经网络模式分类算法在各个网络输出值较为接近或者模式类之间的网络输出值接近的情况下容易发生误判的问题,提出一种基于模式相关的BP神经网络分类算法,并结合具体电路,运用该方法进行建模、仿真.实验结果表明,采用模式相关的BP神经网络分类算法能够充分利用网络输出层各个节点的所有输出,增强了网络的输出特性,便于正确、方便的进行模式分类,且分类效果良好,具有一定的通用性.  相似文献   

7.
关联规则是数据挖掘领域的一个重要研究方向。针对关联规则的增量挖掘问题,该文提出一种快速算法FIAFAR。算法使用CAN-树存储原始交易数据库,弥补了FP-树的不足,适应于增量挖掘以及最小支持度变化的情况。采用子父节点指针的设计,可以快速生成条件模式树,提高算法的效率。实验验证了算法的有效性。  相似文献   

8.
针对大数据时代的图挖掘算法中必须避免进行子图同构检测的问题,采用社会网络中的信息传播模型研究在单个大图中挖掘近邻频繁模式.首先计算节点标号对邻居节点的关联强度,运行联合概率分布来计算节点标号集合的概率支持度,以概率支持度为判断标准,运用改进的逆矩阵+共生频繁项树(COFI-树)挖掘算法对每个节点的标号构成的项集组成的事务数据集进行频繁项集挖掘.实验分析结果显示,该方法快过传统的单个大图频繁子图挖掘算法,返回的结果也多过频繁子图挖掘算法,并且可以发现一些传统频繁子图挖掘算法发现不了的有趣模式.而且与基于FP-树的频繁模式挖掘算法相比,逆矩阵+COFI-树能够支持大规模数据集,对内存利用效率较高.  相似文献   

9.
基于聚类划分的高效用模式并行挖掘算法   总被引:4,自引:0,他引:4  
针对在大规模数据库中挖掘高效用模式产生大量基于内存的效用模式树,从而导致内存空间占用较大以及丢失一些高效用项集的问题,提出在Hadoop分布式计算平台下的基于聚类划分的高效用模式并行挖掘算法PUCP。首先,采用聚类的方法把数据库中相似的事务划分为若干数据子集;然后,把若干划分好的数据子集分配到Hadoop平台的各个节点中构造效用模式树;最后,把各个节点中相同项的条件模式基分配到同一个节点中进行挖掘,以减少各个节点交叉操作的次数。通过实验结果和理论分析表明:PUCP算法在不影响挖掘结果可靠性的前提下,与主流串行高效用模式挖掘——效用模式增长挖掘算法(UP-Growth)和现有的并行高效用模式挖掘算法PHUI-Growth相比,挖掘效率分别提高了61.2%和16.6%;并且使用了Hadoop计算平台,能有效缓解挖掘大规模数据的内存压力。  相似文献   

10.
无线传感器网络(WSNs)内有大量的冗余数据,它们消耗了过多的网络能量;目前的数据融合算法对数据彼此间的联系考虑得不够充分,融合精度有待提高.针对上述问题,提出了一种基于改进支持度的节能型数据融合算法.该算法在网络的感知节点根据设定的阈值对采集到的数据进行初次融合,并引入自支持度的概念,与灰色接近度理论相结合改进支持度函数,将改进的支持度函数应用到汇聚节点计算最终的数据融合估计值.使用Matlab进行仿真的结果表明:该算法可节能27.87%,数据融合的温度绝对误差均值约为0.98℃,达到了节能和提高融合精度的目的.  相似文献   

11.
In this paper we propose a new approach in genetic algorithm called distributed hierarchical genetic algorithm (DHGA) for optimization and pattern matching. It is eventually a hybrid technique combining the advantages of both distributed and hierarchical processes in exploring the search space. The search is initially distributed over the space and then in each subspace the algorithm works in a hierarchical way. The entire space is essentially partitioned into a number of subspaces depending on the dimensionality of the space. This is done in order to spread the search process more evenly over the whole space. In each subspace the genetic algorithm is employed for searching and the search process advances from one hypercube to a neighboring hypercube hierarchically depending on the convergence status of the population and the solution obtained so far. The dimension of the hypercube and the resolution of the search space are altered with iterations. Thus the search process passes through variable resolution (coarse-to-fine) search space. Both analytical and empirical studies have been carried out to evaluate the performance between DHGA and distributed conventional GA (DCGA) for different function optimization problems. Further, the performance of the algorithms is demonstrated on problems like pattern matching and object matching with edge map.  相似文献   

12.
针对分布式环境下FP-tree的构造及合并,给出了一种网格环境下FP-tree的分布式构造算法GridDBMA。该算法中,各站点根据全局项目头表,独立构造局部频繁模式树BFP-tree,然后,利用合并算法将各局部树合并为一棵全局频繁模式树,并在全局频繁模式树上提取出所求的频繁项目集,通过对传统频繁模式树的存储结构的改进,减少了树的规模及站点间的网络通信量,并使树的遍历更加方便有效,提高了合并效率,从而提高了整个频繁项目集的挖掘效率。最后,采用天体光谱数据作为形式背景,实验验证了该算法的正确性和有效性。  相似文献   

13.
基于Hadoop分布式计算平台,给出一种适用于大数据集的并行挖掘算法。该算法对非结构化的原始大数据集以及中间结果文件进行垂直划分以确保能够获得完整的频繁项集,将各个垂直分块数据分配给不同的Hadoop计算节点进行处理,以减少各个计算节点的存储数据,进而减少各个计算节点执行交集操作的次数,提高并行挖掘效率。实验结果表明,给出的并行挖掘算法解决了大数据集挖掘过程中产生的大量数据通信、中间数据以及执行大量交集操作的问题,算法高效、可扩展。  相似文献   

14.
基于自适应加权融合的分布式滤波算法   总被引:1,自引:0,他引:1  
针对存在丢包的传感器网络中每个传感器节点对目标估计确信度不同的问题,提出一种基于自适应加权融合的分布式滤波算法.考虑节点在网络中的影响力及其节点属性,将节点重要度与传感器网络节点观测数据间的支持度线性加权,获得每个传感器节点对目标的估计确信度,并将该确信度构成的融合权值引入节点状态估计值的一致性协议中,更新传感器节点对目标的状态估计值,提高分布式滤波算法的估计精度和传感器节点估计值的一致性.仿真结果验证了所提出方法的有效性.  相似文献   

15.
袁冰  杨枨 《计算机工程与设计》2011,32(10):3530-3533
为解决传统网上考试系统应用于大规模考试任务时并发访问的瓶颈问题,提高系统的并发访问能力和服务效率,提出了基于考试任务的分布式设计。设计中采用遗传算法,将考试任务自动分解后,根据一定的策略自动分发到各分布式部署的考试服务器中,并行为考生提供考试服务,从而能够充分合理利用软硬件资源,分散系统压力,解决网络带宽、服务器处理能力、数据库访等的瓶颈问题,提高系统并发访问能力。开发了相应的软件系统,并通过实例验证了该设计的有效性,可满足大规模考试任务的要求。  相似文献   

16.
传统数据挖掘算法在处理海量数据集时计算能力有限。为解决该问题,提出一种基于Map Reduce的分布式序列模式挖掘算法MR-PrefixSpan。在PrefixSpan算法的基础上,对模式挖掘任务进行分割,利用Map函数处理由不同前缀得到的序列模式,并行构造投影数据库,从而提高挖掘效率及简化搜索空间。采用Reduce函数对中间结果进行规约,得到全局序列模式。在Hadoop集群上的实验结果表明,MR-PrefixSpan能减少数据库扫描时间,具有较高的并行加速比和较好的可扩展性。  相似文献   

17.
A fully distributed approach to update synchronization is presented where each site completely executes every update. This approach has several features-higher resiliency to different kinds of failures, higher parallelism, improved response to user requests, and low communication overhead. A fully distributed algorithm for concurrency control obtained by rehashing a previously published semidistributed algorithm into the fully distributed model of update execution is presented. A performance model of replicated database systems is presented and used to study the performance of the proposed algorithm and its semidistributed version. The results of the performance study reveal that the proposed approach can substantially improve the performance at the cost of moderate input/output overhead  相似文献   

18.
研究在频谱共享条件下家庭基站双层网络的分布式功率控制策略.将宏基站所能承受的干扰限度视为家庭基站的可分配资源,家庭基站以竞价形式对其"购买",从而构成宏基站与家庭基站以及家庭基站用户之间的博弈模型.分析了该博弈过程中纳什均衡解的存在性和惟一性,并给出了在非合作模式下指导家庭基站用户进行理性竞争的分布式功率调整算法.最后,通过仿真实验验证了所提出算法的有效性.  相似文献   

19.
Causal message ordering is required for several distributed applications. In order to preserve causal ordering, only direct dependency information between messages, with respect to the destination process(es), need be sent with each message. By eliminating other kinds of control information from the messages, the communication overheads can be significantly reduced. In this paper we present an algorithm that uses this knowledge to efficiently enforce causal ordering of messages. The proposed algorithm does not require any prior knowledge of the network topology or communication pattern. As computation proceeds, it acquires knowledge of the communication pattern and is capable of handling dynamically changing multicast communication groups, and minimizing the communication overheads. With regard to communication overheads, the algorithm is optimal for the broadcast communication case. Extensive simulation experiments demonstrate that the algorithm imposes lower communication overheads than previous causal ordering algorithms. The algorithm can be employed in a variety of distributed computing environments. Its energy efficiency and low bandwidth requirement make it especially suitable for mobile computing systems. We show how to employ the algorithm for causally ordered multicasting of messages in mobile computing environments.  相似文献   

20.
针对现有换热站并联水泵优化算法在集中式架构下控制适应性不足的问题, 本文提出了一种改进的分布式并联水泵优化算法. 首先, 建立了并联水泵的分布式控制系统, 并对该优化问题的数学模型进行描述, 在目标函数中引入自适应非线性因子; 然后, 设计了改进的分布式果蝇优化算法, 在该算法中每台水泵的控制器仅通过与邻居控制器交互信息即可完成并联水泵的优化; 并且, 在嗅觉搜索阶段, 使用正弦余弦策略替代赋予个体距离与方向的随机策略; 最后, 以两个实际换热站中不同并联水泵系统为例对算法进行仿真验证, 并基于仿真结果进行性能分析. 结果表明, 相较于传统算法, 改进的分布式果蝇优化算法能得到更优的控制策略, 有着收敛速度快、稳定性好和鲁棒性强的特点; 并且该算法适用于不同系统的并联水泵优化问题, 具有可扩展性. 在实际工程验证中相较于集中式算法, 该算法在总功率和计算时间上分别平均降低了5.47%和29.90%, 因此, 能够满足实际换热站中对并联水泵热负荷优化分配的需求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号