首页 | 本学科首页   官方微博 | 高级检索  
     

基于Kafka和Kubernetes的云平台监控告警系统
引用本文:郝鹏海,徐成龙,刘一田.基于Kafka和Kubernetes的云平台监控告警系统[J].计算机系统应用,2020,29(8):121-126.
作者姓名:郝鹏海  徐成龙  刘一田
作者单位:南京南瑞信息通信科技有限公司,南京210003;南京南瑞信息通信科技有限公司,南京210003;南京南瑞信息通信科技有限公司,南京210003
基金项目:南京南瑞信息通信科技有限公司科技项目(5246DR200014)
摘    要:为了实现对容器云、主机设备以及业务系统的实时监控, 设计了一种基于Kafka和Kubernetes的云平台监控告警系统. 通过Kubernetes对Docker容器进行管理, 通过Kafka接收不同地区不同主机的设备运行信息, 通过探针对业务系统进行监控, 并且通过告警的关联规则设置, 减少了冗余告警, 增强了告警的故障检测能力, 提高了告警的准确度.

关 键 词:Kubernetes  Kafka  实时监控  关联告警规则  故障检测
收稿时间:2020/2/13 0:00:00
修稿时间:2020/3/17 0:00:00

Monitoring and Alarm System for Power Grid Cloud Platform Based on Kafka and Kubernetes
HAO Peng-Hai,XU Cheng-Long,LIU Yi-Tian.Monitoring and Alarm System for Power Grid Cloud Platform Based on Kafka and Kubernetes[J].Computer Systems& Applications,2020,29(8):121-126.
Authors:HAO Peng-Hai  XU Cheng-Long  LIU Yi-Tian
Affiliation:Nanjing NARI Information and Communication Technology Co. Ltd., Nanjing 210003, China
Abstract:In order to achieve real-time monitoring of container clouds, host devices, and business systems, a cloud platform monitoring and alarm system based on Kafka and Kubernetes is designed. Docker containers are managed through Kubernetes, and Kafka receives device operation information from different hosts in different regions. The business system is monitored through probes. By setting the alarm association rules, redundant alarms are reduced, alarm fault detection capabilities are enhanced, and alarm accuracy is improved.
Keywords:Kubernetes  Kafka  real time monitoring  associated alert rules  fault detect
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号