什么是IT监控管理

Viewed 35

终于突出了"监控"
将 监控告警一般默认归入事件管理范畴 这一规则基本上是明朗化了
在大多数会认真应用itil管理理论的组织里 ,极高的概率拥有1-N套监控系统
所以处理监控告警就成了一个必须的功能

1 Answers

image.png

定义

事态: 对服务或其他配置项(CI)的管理具有重要意义的任何状态变更。
监控: 通过对系统、实践、流程、服务或其他实体的重复观察,探测事态并确保已知其当前状态。
并非所有的监控都会检测到事态,阈值和其他准则确定哪些状态更改将被视为事态。典型的事态类别是信息、警告和异常。

目的

监控和事态管理实践的目的是系统地观察服务和服务组件,将其状态变化识别为事态并进行记录和报告。该实践识别基础设施、服务、业务流程和信息安全等事态,确定其优先级,建立对这些事态的适当响应,包括对可能导致潜在故障或事件的条件作出响应。

实践范围

  • 识别和优化监控的范围
  • 实施和维护连续监控
  • 建立和维护事态的识别,分类和处理规则
  • 实施流程和自动化工具使已定义的事态管理规则产生作用
  • 根据议定和实施的规则以及流程对事件进行持续处理
  • 以商定的形式向利益相关者提供受监控服务和资源的当前和历史状态的信息

监控告警转工单过滤规则示例
image.png

实践成功因素

  • 建立和维护描述各类事态的方法/模型以及检测这些事态所需要的监控能力
  • 确保向利益相关者提供及时、相关和充分的监控数据
  • 确保检测、解释事态,并在需要时尽快采取措施