首页 | 本学科首页   官方微博 | 高级检索  
     

高速网络流频繁项挖掘算法
引用本文:赵小欢,夏靖波,付凯,李明辉.高速网络流频繁项挖掘算法[J].计算机研究与发展,2014,51(11).
作者姓名:赵小欢  夏靖波  付凯  李明辉
作者单位:1. 中国人民解放军95034部队 广西百色533616;空军工程大学信息与导航学院 西安 710077
2. 空军工程大学信息与导航学院 西安 710077
3. 空军后勤部 北京 100720
基金项目:国家自然科学基金项目,陕西省自然科学基金重点项目,全军军事学研究生课题
摘    要:在当前骨干网络链路速率呈几何倍数增长的情况下,实时准确地挖掘出网络流中的频繁项对于网络管理和网络安全具有重要的意义.在SS(space saving)计数算法的启发之下,针对网络流的实际特性,提出了一种剪枝操作受时间和流长双重约束的网络流频繁项挖掘算法(integrated weighted frequent items mining,IWFIM).IWFIM计数算法采用时间和流长组合赋权的方式为每个流项赋权,且算法每次剪枝操作时总是删除权值最小的流项.在IWFIM算法的基础上,依据网络流的重尾分布特性,又提出了一种能够结合散列方法和计数方法优点的网络流频繁项挖掘算法(counting Blooming filter and integrated weighted frequent items mining,CBF_IWFIM).CBF_IWFIM算法首先采用改进的计数型布鲁姆过滤器(counting Blooming filter,CBF)在不保存网络流信息的情况下过滤掉绝大部分的短流,然后采用IWFIM算法实现网络流频繁项挖掘.通过实际网络流量测试表明,CBF_IWFIM和IWFIM算法具有非常高的空间利用率和准确率,2种算法对于网络流频繁项的挖掘效果明显优于SS等3种算法,即使在使用其他算法1?3缓存的极端情况下,CBF_IWFIM和IWFIM 2种算法的频繁项识别效果仍然要优于SS等算法.

关 键 词:网络流  频繁项  数据挖掘  剪枝策略  计数算法  散列算法  重尾分布  计数型布鲁姆过滤器

Frequent Items Mining Algorithm over Network Flows at High-Speed Network
Zhao Xiaohuan,Xia Jingbo,Fu Kai,Li Minghui.Frequent Items Mining Algorithm over Network Flows at High-Speed Network[J].Journal of Computer Research and Development,2014,51(11).
Authors:Zhao Xiaohuan  Xia Jingbo  Fu Kai  Li Minghui
Abstract:
Keywords:network flows  frequent items  data mining  pruning strategy  counting method  Hash method  heavy-tailed distribution  counting Blooming filter
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号