信息化的挑战
信息系统成为现代企业不可或缺的工具,它为人们日常的生活、工作带来不可磨灭的影响。尤其在互联网+的时代,信息的获取手段更为多元,方式更为多样,这也导致了构成分发信息的系统结构越发复杂,给运维带来了诸多挑战:
1、系统越发复杂,故障定位繁琐
2、系统巡检过程过长,严重依赖人员能力。
3、重复的报告和报表工作,效率低下。
面对挑战的手段
1、减少故障排查的时间。
2、减少巡检工作的重复工作。
3、自动生成申报报表。
平台架构
1、报表展现展示把系统功能通过WEB页面、客户端界面等方式展现给用户,并实现系统预警机制,例如设备故障、系统性能超标、业务关联等等。
2、分析引擎实现具体的系统功能和系统故障的逻辑分析。实现所需要的统计和分析结果
3、数据采集主要是完成系统信息的访问和收集功能。
监控和告警
运维平台通常会对以下指标进行监控,并对相应指标进行告警:
操作系统
数据库
中间件
存储
虚拟化
目前能够监控的指标包括:
上述指标单位可按需进行调整。
通过监控和告警能够迅速排查出到底哪个系统的哪个指标出现问题,及时进行相关的故障处理。
自动化巡检
自动化巡检是在设备监控的基础之上的进一步检查升华,能够自动将所需要检查的内容直观的显现在面前,不需要再周而复始的进行登录系统、敲击键盘找到需要检查的指标,记录相关指标是否有异常。
自动化巡检可以巡检的系统和内容包括:
自动化巡检具有实用和灵活的功能,同时,如果巡检的指标项目和内容发生变化,只要是已经导入和处理的数据,可以在5分钟之内调整完毕,马上可以进行巡检。如果没有引入平台,需要执行非常多的步骤进行巡检,引入之后只需要两步就可以完成巡检。