首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
RRDTool监控数据存储技术结合Open-Falcon开源监控平台,可以实现针对铁路云数据中心下大规模实时监控数据的有效处理,提高运维生产效率。随着铁路的快速发展,铁路监控运维平台在处理大规模实时数据时所面对的任务也越来越艰巨。本文将以处理大规模实时监控数据为切入点,介绍RRDTool的基础概念与工作原理,简化大规模监控数据的存储、规整数据的格式,直观展示被监测对象随时间的变化趋势。同时结合Open-Falcon这一开源监控平台采集、存储和展示大规模实时数据,从而实现针对铁路云数据中心下大规模实时监控数据的有效处理,提高运维生产效率。  相似文献   

2.
刘雪涛 《计算机科学》2012,(Z2):230-231,242
网络流量监控系统部署在数据中心,可以用来优化广域网带宽,监控应用系统、网络时延和突发异常流量等,对提高数据中心的运维水平有很大帮助。  相似文献   

3.
为了解决高校数据中心在设备数量和种类迅速增长带来的运维管理难题,采用一套兼容多种设备的监控平台尤为必要。本文提出了应用Zabbix开源系统构建高校数据中心监控平台的运维方案,分析平台的功能模块与实现路径。实践表明,采用该方案建设的监控平台能满足日常设备监控需求,有效提升运维效率。  相似文献   

4.
随着信息安全重要性的日益提高,国家电网统推的桌面终端标准化管理系统,简称桌管,是国家电网公司在全公司内外网终端设备上安装的终端监控管理软件,是信息安全管理主要平台。虽然可以实时监控着信息系统运行情况,但目前其并未实现即时的异常数据报警功能,需要运维人员主动去查看,而地市公司信息运维部门暂未实现24小时值班制度,即无法及时获悉并处理信息系统异常变动,桌管监控指标也无法始终达到国网要求的100%,同时也存在极大的安全隐患。  相似文献   

5.
容器监控是保证容器基础设施正常运行的核心要素之一,然而当前容器监控角度较为单一,尚缺少直观有效的方法协助运维人员快速定位业务容器异常原因.本文设计并实现了一个面向Kubernetes的容器立体化监控系统,通过监控指标相关性分析,把相关性较强的指标作为立体化监控的核心指标提供给运维人员,更好地实现对容器的全局统筹监控.  相似文献   

6.
Docker容器监控系统在系统运维层面保障容器的安全。为解决当前容器监控系统存在部署过程复杂、异常检测精确度低、资源消耗量大和监控潜在黑洞等问题,采用Prometheus+、Sysdig和Weave scope等组件,构建支持可视化交互的综合型监控系统框架。该系统不仅可以快速准确定位异常来源、易于部署和资源消耗量低,还可以采用多种执行方式。依照监控组件资源使用量和组件执行模式,设计实验并对该系统进行研究。实验结果显示,Prometheus+磁盘故障检出率高并且可以长期存储数据,Sysdig在异常检测的误检率低并且耗费资源少,Weave Scope的异常检出率低,但是它可以同时监控多个容器。实验结果验证了该系统的有效性,其不仅可以全面地实时监控Docker容器内的各个节点,还可以解决多容器联合监控的问题。同时,系统从根本上降低了Docker容器整体的安全风险。  相似文献   

7.
随着云计算技术的快速进步与广泛应用,企业信息化建设得以迅速发展,为了探索面向大规模微服务应用的云平台运维关键技术,提升微服务架构下云平台的运维保障能力,针对微服务云平台运维工作与相关技术展开调研;首先介绍了当前微服务云平台运维工作的背景与特点,阐述了云平台运维工作的国内外研究现状并进行分析;根据微服务云平台运维工作的特点,将云平台运维技术主要分为监控运维、资源调度与故障分析三类,分别综述每一类运维技术的研究现状,并分析每类运维技术中不同方法的优缺点;最后,结合工业需求、当前技术的不足、以及微服务云平台运维工作的特点分析了云平台运维工作的未来发展趋势,并且对微服务云平台重要的运维技术也进行了总结与展望。  相似文献   

8.
在实时业务数据处理中,需要用到Flume、Kafka、Slipstream等一系列功能组件。在前台业务系统与大数据平台的数据传输过程中,需要监控数据是否正常流动。如果出现了异常,需要定位异常出现的位置。通过一系列的监控工具和方法,可以快速定位各个环节的功能组件是否正常运行。该技术方案的主要目的是为了监控大数据平台实时数据计算的整体流程是否正常工作,前台业务系统与大数据平台内部的数据校验、大数据平台内部的数据校验逻辑是否正确。一方面可以在日常开发过程中验证数据的可靠性,另一方面也可以帮助运维人员更快更精准地定位到产生异常数据的问题所在,从而对现有的业务逻辑进行优化,提高业务效率。  相似文献   

9.
银行为了在发生异常时能及时处理,往往会通过监控系统来实现对硬件、网络、应用系统等的监控和报警。Nagios是一个开源且免费的计算机及网络系统监控软件,运行在Linux平台上,能通过各种插件和SNMP协议,对设备、网络及各种应用系统进行状态监控。介绍了Nagios的工作原理和功能,以及在平安银行成都分行的应用情况。具体应用实践表明,利用Nagios构建集中监控系统效果非常显著,为银行的生产运维提供了有效的监控报警平台。  相似文献   

10.
监控设备大规模安装和应用带来了运维困难的问题.本文研发了一个通用运维管理平台,平台通过前端状态采集装置获取监控设备运行时产生的各种状态信息;平台的运维管理系统汇总、存储状态信息,并提供监控、统计、分析、报警等管理功能以支持运维业务;平台的可视化展示子系统对状态信息进行可视化渲染呈现,为系统运维提供智能化的支持.状态采集装置模块化和冗余设计使得设备具有通用性、可扩展性、高可靠性和易维护性.状态信息具有时序数据特征,运维管理系统使用InfluxDB存储状态信息,大幅度降低了存储空间需求,并保证了数据查询和管理的性能需求.基于InfluxDB的监控设备通用运维管理平台已在多个用户单位安装试用,运行状态良好,具有很好的经济社会效益和推广价值.  相似文献   

11.
城市轨道交通综合监控系统仿真平台能够有效培养地铁从业人员,提高地铁调度、运营、维护人员的水平,近年来城市轨道交通综合监控系统软件的应用研究已更侧重于线网建设、深度集成、智慧车站、无人驾驶、综合安防及运维、云平台、大数据等领域,传统的城市轨道交通综合监控系统仿真平台已无法满足当前城市轨道交通综合监控系统建设和运营的需要。本文从轨道交通综合监控仿真平台的发展,对未来城市轨道交通综合监控系统仿真平台建设做一个展望。  相似文献   

12.
企业数字化转型的浪潮中,全国各地政府和企业投入大量的精力和资金建设云平台,考虑到安全、成本和稳定等各方面因素,很多企业采用了混合云建设策略,但是这种混合云架构在监控方面存在着平台组件监控覆盖度低,监控覆盖范围不全,告警信息不统一、可读性差以及告警通知不及时甚至缺失等问题,为平台的运维和运营带来极大的困难,无法全方位掌控故障告警以及全网云平台的运行情况。针对混合云监控的痛点,开展多云平台监控体系的研究与设计,实现混合云平台的统一纳管,集中监控和统一告警。  相似文献   

13.
目前主要依靠人工运维输电架空线路,由于运维工作量大、细节多、空间变化快等诸多问题,电网公司目前考虑在电力设备上安装在线视频监控设备,代替人工监视特殊地段的输电线路,基于此,本文研发了一款智能视频终端,具有多种新功能,可以解决工作中的实际问题。  相似文献   

14.
此监控系统主要是针对某很行内部各系统运维能实时监控、显示、预警,方便管理员了解各系统运行情况及维护,虽然项目没有很大的规模却有及强的针对性、实用性和使用价值,系统原则是方便、简洁、及时准确、清楚明了。在此项目开发过程中选用了非常流行的J2EE框架技术,为项目的成功开发奠定了良好的基础。此项目在项目组同志的共同努力已成功展开,其间也得到其他同事的许多帮助,才得以顺利进行。  相似文献   

15.
国网公司日益庞大的服务器集群产生的大量生产运行数据,以及实时分析各类设备、系统产生的海量监控数据成为电力IT运维工作的新挑战。异常检测技术作为智能电网信息运维工作的关键技术,可以有效检测运维故障并及时告警,避免损坏敏感设备。目前一些传统异常检测方法检测的异常种类少且精度低,导致故障发现不及时。为了应对这一挑战,提出了基于胶囊网络的多维时间序列异常多分类模型NNCapsNet。首先,应用无监督算法结合专家知识对电网营销业务应用服务器性能监控数据进行预处理和标注。其次,引入胶囊网络进行分类和异常检测。五折交叉验证的实验结果表明,NNCapsNet在包含15类异常的数据集上实现了91.21%的平均分类准确度。还在包含2万条监控数据的数据集上与4个基准模型进行了对比,NNCapsNet在关键评估指标上均取得了较好的结果。  相似文献   

16.
介绍了一种用于Hadoop集群自动化监控、预警系统的实现。通过获取集群节点的内存、CPU、磁盘信息统计节点系统信息,同时统计集群各类Hadoop基础服务的基础信息,如服务的内存使用、存活状态等。系统对收集的信息做异常信息处理与告警,自动推送给系统运维,极大提高了运维的响应速度,缩短问题定位、解决周期。  相似文献   

17.
信息技术在企业的应用越来越广,从核心的生产经营业务到日常的管理事务,从办公自动化到事务流程的办理,都可以通过信息系统来开展。离开信息系统,企业的业务开展必然受到制约,甚至无法开展。而保证信息系统的正常运行则成了系统运维部门的首要任务,快速有效地解决系统问题成为系统运维部门的基本要求。信息系统状态综合监控系统能够保证系统运维部门更好地完成工作,从应急处理的"被动"式运维转为可预见性的"主动"式运维,做到提早发现问题、及时解决问题,保证信息系统正常可靠地运行,为业务的顺利开展提供有力的技术支持。  相似文献   

18.
高文 《工矿自动化》2019,(2):105-108
针对煤矿监控类系统故障处理时效性低、现场维护工作量大、运维成本高等问题,在对故障信息进行统一规范的基础上,设计了一种煤矿监控类系统远程故障分析平台。该平台分为设备层、网络层、系统层和运维层。设备层内置具备故障自诊断能力的故障探针,检测到故障后将关联信息缓存,并上传至网络层。网络层收到设备层传来的故障信息后,先对设备层故障信息进行缓存,再连同网络层产生的故障信息一起打包上传至系统层。系统层部署的故障信息采集软件可通过内存接口、数据库或文本文件等方式从监控类系统上位机软件中获得故障信息,同时支持网络层设备故障信息直接采集,将故障信息缓存后传输至运维层。运维层将接收的故障信息存入故障信息中心库进行分析和推送。该平台可为煤矿监控类系统故障分析提供重要的数据支撑,为煤矿监控类系统运维服务提供有效的技术保障。  相似文献   

19.
气象信息网络监控管理平台采用先进的Java EE架构,基于B/S方式,对用户已经部署的各种重要网元设备进行集中管理.该平台可以作为用户的综合性运维管理平台,实现对信息网络系统进行集中监控、事件管理、性能分析和日常运维等.通过平台可以实现IT资产管理、事件管理、预警管理、响应与告警管理、报表管理.对业务及支撑系统的所有I...  相似文献   

20.
此监控系统主要是针对某很行内部各系统运维能实时监控、显示、预警,方便管理员了解各系统运行情况及维护,虽然项目没有很大的规模却有及强的针对性、实用性和使用价值,系统原则是方便、简洁、及时准确、清楚明了。在此项目开发过程中选用了非常流行的J2EE框架技术,为项目的成功开发奠定了良好的基础。此项目在项目组同志的共同努力已成功展开,其间也得到其他同事的许多帮助,才得以顺利进行。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号