首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
与布尔型数据的频繁模式挖掘相比,时间序列的频繁模式挖掘是一个相对复杂的问题,目前对此类问题还缺少深入的研究.通过对小波滤波的研究,提出了一种时间序列的频繁模式挖掘算法,Frequent-Wavelet算法.该算法的特点是采用多孔平滑滤波器组对时间序列做低通平滑处理,用得到的多个尺度序列表示原序列,较好地解决了时间序列的平凡相似问题和时间轴伸缩问题.实验表明,Frequent-Wavelet算法对于时间序列的频繁模式挖掘具有较好的效果.  相似文献   

2.
在个性化的网络学习中,对知识点间的关联规则进行挖掘是一个关键的问题.该文提出了一种基于后缀树的知识点间关联规则挖掘算法,该算法通过对web日志数据构造后缀树进行序列挖掘,动态地挖掘最大频繁序列,进而发现有意义的知识点间的关联规则.  相似文献   

3.
为进一步解决对大型数据库进行关联规则挖掘时产生的CPU时间开销大和I/O操作频繁问题,给出一种改进的关联规则挖掘算法(ARMAC).该算法引入有向无环图和tidlist结构用以提高频繁项目集的计算效率,并将数据库划分为内存可以满足要求的若干部分,解决了对大型数据库挖掘时磁盘操作频繁的问题,从而有效地适用于大型数据库的关联规则挖掘.该算法吸取连续关联规则挖掘(CARMA)算法的优势,只需扫描两次数据库便可完成挖掘过程.实验结果表明:该算法在大型事务数据库中具有更高的执行效率.  相似文献   

4.
挖掘告警序列间关联规则的算法都受到最小支持度的限制,仅能够得到频繁告警序列间的关联规则. 对此,提出了一种以高相关度、高置信度为条件,通过聚类找到特征相同的网元告警群,然后基于相关度统计的挖掘算法. 实验结果表明,该算法可以高效、准确地挖掘出电信网络告警数据库中频繁和非频繁告警序列间的关联规则.  相似文献   

5.
在关联规划挖掘理论研究上,首次给出了项目序列集格空间,并且探讨了在这个空间上的基本操作算子、基于项目序列集格空间及其操作,建立了关联规则挖掘模型.在关联规则挖掘算法方面,设计了基于项目序列集操作理论的关联规则挖掘算法SIS,该算法执行时间整体上优于Apriori算法,而且随着数据量的增大,该算法执行时间的增长幅度也小于Apriori算法.  相似文献   

6.
由频繁项集产生的关联规则往往不能保证规则前、后件中的项是正相关的,因此可能产生无意义的关联规则;当这些关联规则用于分类时,会产生大量无用分类规则,增加了时间开销.因此,基于数学期望提出了正相关的频繁项集的分类算法.该算法在挖掘正相关频繁项集时,利用置信度进行规则选取,生成正相关关联规则组成的分类器对数据集进行分类.实验表明,这种分类算法可以大幅度减少所产生的频繁项集数量,分类准确率达到C4.5和CMAR的水平,且显著减少了算法的时间.  相似文献   

7.
挖掘电信告警关联模式方法   总被引:1,自引:0,他引:1  
关联模式挖掘算法通常受到最小支持度的限制,仅能得到频繁告警序列间的关联模式,针对这一问题,基于图论思想提出了一种挖掘电信网络告警间关联模式的方法.首先在单遍扫描数据库的条件下挖掘网络中的二项关联模式,然后直接发现其最大关联模式,从而避免大量中间项集的产生. 基于实际网络告警数据的实验结果表明,该方法不仅具有较高的效率,而且有效.  相似文献   

8.
发现最大频繁项目集是关联规则挖掘的重要步骤,针对关联规则挖掘中最小支持度发生变化的增量式更新问题,提出了高效发现最大频繁项目集的更新算法.该算法在FP树的基础上增加了记录各项目支持数的表,在头表中增加了域,从而减少了访问事务数据库和FP树的时间,提高了发现最大频繁项目集的效率.  相似文献   

9.
间接关联是数据挖掘领域中一种数据项之间的关联关系,为了有效地应用于市场营销、智能数据分析、web日志分析等领域,给出了一个基于频繁项目对支持矩阵直接生成频繁项目对之间候选间接关联的挖掘算法(TRISCAN-IA)。该算法只需要3次扫描数据集即可找出所有的间接关联,从而提高了算法的运行效率、在一个web log的真实数据集上进行了试验,与现有算法的比较表明,该算法具有更好的性能。  相似文献   

10.
时间序列模式挖掘的算法研究   总被引:1,自引:2,他引:1  
提出一种进行时间序列模式挖掘的算法 ,用于对大型数据库的海量数据分析 ,从中挖掘出超过用户给定支持度和置信度的时间序列 ,从而为用户的决策支持和趋势预测提供依据 .算法分为在数据中对于频繁项集的发现和频繁序列挖掘两个部分 ,排除不可能达到支持度和置信度阈值的项集 ,缩小了挖掘中的数据扫描范围 ,提高了数据挖掘的效率  相似文献   

11.
与传统静态数据库中的数据不同,数据流是一个按时间到达的有序的项集,这使得经典的频繁项集挖掘算法难以适用到数据流中.根据数据流的特点,提出了数据流频繁项集挖掘算法FP—SegCount.该算法将数据流分段并利用改进的FP—growth算法挖掘分段中的频繁项集.然后,利用Count Min Sketch进行项集计数.算法解决了压缩统计和计算快速高效的问题.通过和FP—Ds算法的实验对比,FP—SegCount算法具有较好的时间效率.  相似文献   

12.
基于事务相似矩阵的关联规则挖掘算法   总被引:3,自引:0,他引:3  
通过对Apriori算法挖掘过程的深入分析,提出一种改进的关联规则挖掘算法——基于事务相似矩阵的关联规则挖掘算法(ARBSM):在压缩事务布尔矩阵的基础上构建一个事务相似矩阵,直接查找高阶肛项频繁集,有效解决了Apriori算法逐层搜索的迭代产生频繁项集的瓶颈问题。测试结果表明,ARBSM算法可以高效地挖掘潜在的强关联规则。  相似文献   

13.
针对PCBA组装企业的SMT产品生产规划问题,给出了一种考虑预估订单和生产线故障率等不确定条件的生产任务排程方法。该方法将预估订单的批量、来料时间和交货期等用区间数表示,建立其不确定型调度模型,并采用可能度水平将该模型转换为确定型,然后用遗传算法进行求解。给出了该遗传算法的结构,并提出了“染色体按生产线分段、段内按产品加工序排列”的8进制编码、基因交叉和段长改变的变异操作等具体方法。实验结果验证了其可行性,具有较好的参考价值。  相似文献   

14.
Indirect association is a high level relationship between items and frequent item sets in data. There are many potential applications for indirect associations, such as database marketing, intelligent data analysis, web -log analysis, recommended system, etc. Existing indirect association mining algorithms are mostly based on the notion of post - processing of discovery of frequent item sets. In the mining process, all frequent item sets need to be generated first, and then they are fihered and joined to form indirect associations. We have presented an indirect association mining algorithm (NIA) based on anti -monotonicity of indirect associations whereas k candidate indirect associations can be generated directly from k - 1 candidate indirect associations, without all frequent item sets generated. We also use the frequent itempair support matrix to reduce the time and memory space needed by the algorithm. In this paper, a novel algorithm (NIA2) is introduced based on the generation of indirect association patterns between itempairs through one item mediator sets from frequent itempair support matrix. A notion of mediator set support threshold is also presented. NIA2 mines indirect association patterns directly from the dataset, without generating all frequent item sets. The frequent itempair support matrix and the notion of using tm as the support threshold for mediator sets can significantly reduce the cost of joint operations and the search process compared with existing algorithms. Results of experiments on a real - word web log dataset have proved NIA2 one order of magnitude faster than existing algorithms.  相似文献   

15.
针对目前大多数Apriori改进算法在处理大数据集时所面临的性能瓶紧问题,该文以项集中各项在事务中的概率分布特征为切入点,并在BF-Apriori的逆序编码算法基础上,设计基于逆序转换的模式匹配算法和候选频繁项集生成算法,以提高规则挖掘过程的时间效率.最后,3个子算法构成了该文所提出的Apriori改进算法BF_Adv...  相似文献   

16.
传统的关联规则并行挖掘算法中存在着产生大量的候选项集和通信量高的缺点,本文在分析已有并行挖掘关联规则算法的优缺点的基础上,提出了一个效率较高的并行优化关联规则挖掘算法EPMAR(Efficient Parallel Mining Association Rules),并与其它相应的算法进行了比较.实验结果证明:算法EPMAR是有效的,具有一定的扩展性.  相似文献   

17.
工程结构优化设计的混合遗传算法   总被引:1,自引:0,他引:1  
根据工程实际,充分考虑规范规定的约束条件和各项技术标准要求,建立了工程结构优化设计模型。为了改善遗传算法在迭代过程中经常出现未成熟收敛、振荡、随机性太大和迭代过程缓慢等缺点,提出一种离散变量结构优化设计的三等分割算法,并与标准遗传算法结合成混合遗传算法。对25杆框架结构优化设计,结果表明,这种混合遗传算法的收敛特性得到很好的改善,即发挥了三等分割算法省时、局部搜索能力强的特点,又发挥了遗传算法全局性好的特点,是有效的工程结构优化设计方法。  相似文献   

18.
运动干涉检测的优化算法   总被引:2,自引:0,他引:2  
对做复杂运动的几何对象进行运动干涉检测通常计算量很大,它引起两个问题:①检测次数多,效率低;②由于误差的积累导致算法可靠性不高。本文以解决这两个问题为目的,提出了利用最大相对速度和距离变量确定时间间隔的运动干涉检测算法,并在此基础上引入模糊逻辑来控制时间裕度,使时间间隔适当增大,从而让这一算法无论在效率还是在可靠性方面都有了提高。并利用算例证明了该算法的稳定性和有效性。  相似文献   

19.
海量数据利用传统Apriori算法进行挖掘会浪费大量存储空间和通信资源,导致算法效率低下,因此,提出MapReduce框架下Aprioi算法的改进方法,首先采用水平划分的方法将MapReduce数据库分成n个独立的数据块,然后发送到采用动态负载均衡划分的m个工作节点上。每个节点扫描各自的数据块,产生局部候选频繁项集,计算每个候选频繁项集的支持度阈值并与最小支持度阈值进行比较以确定最终的频繁项集。改进后的算法可以减少各个节点之间的数据流动,只需要扫描两次事务数据库就能挖掘出全部频繁项集,节省扫描时间和存储空间,提高挖掘效率。  相似文献   

20.
一种基于遗传算法的DNA多序列比对方法   总被引:4,自引:0,他引:4  
为了克服遗传算法应用于多序列比对时所遇到的比对序列数受限制以及比对寻优速度慢的缺点,提出了一种基于遗传算法的DNA多序列比对方法(GAMA);针对DNA多序列比对的特点,指出了传统遗传算法中的交叉操作将为序列比对带来沉重的计算负担;避开遗传算法通常所采用的遗传操作算子,设计了独特的遗传算子(插入删除算子和合并分离算子)、基于BLAST相似度评分方法和完全比对块加权的个体适应度值评价函数,采用了便于插入和删除操作以及相似度评分的基于字符和空位矩阵的染色体编码方案。本算法具有操作算子数量少,算子调用机制简明的特点。最后,给出了将GAMA应用于DNA多序列比对的算例,实验结果验证了本算法的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号