Vídeo no final da pagina.
Os Services ou Componentes como gosto de chamar são todas as métricas que podem ser obtidas de nossos hosts. Podemos coletar métricas de desempenho, capacidades e outras diversas. Os estados que eles podem assumir são definidos de acordo com os gatilhos que são aplicados por meio de regras. Um exemplo de gatilho comum é o usado para espaço em disco, onde podemos definir que ao passar de 80% seja usado o estado de Warning ou Alerta e ao ultrapassar 95% podemos definir para o estado Critical ou Critico. Vou mostrar agora com mais detalhes:
OK: O Componente está em bom funcionamento. No exemplo abaixo indica que a diferença de horário entre o servidor monitorado e o servidor de monitoramento está dentro do aceitável e logo abaixo temos um exemplo referente ao uso de CPU:
![](https://pauloadriano.com/wp-content/uploads/2023/06/image-70.png)
![](https://pauloadriano.com/wp-content/uploads/2023/06/image-63.png)
WARNING: O componente está em estado de alerta. No exemplo abaixo a diferença de horário entre o servidor de monitoramento e o servidor monitorado esta superior a 30 segundos, se fosse superior a 30 segundos o estado seria Critico:
![](https://pauloadriano.com/wp-content/uploads/2023/06/image-69-1024x50.png)
CRITICAL: O Service está em estado crítico. No exemplo abaixo estamos considerando novamente a diferença de horario entre o servidor de monitoramento e o servidor monitorado, observe que agora a diferença esta em 2 minutos e 29 segundos:
![](https://pauloadriano.com/wp-content/uploads/2023/06/image-68.png)
UNKNOWN: O Service está em estado desconhecido. Este caso é uma placa de rede que foi descoberta e em seguida foi removida do servidor, como o Checkmk não consegue encontrar ela ele assume que o estado é desconhecido.
![](https://pauloadriano.com/wp-content/uploads/2023/06/image-67.png)
Para os estados WARNING e CRITICAL podemos definir regras das mais diversas maneiras, criando exceções ou mesmo regras que vão ser aplicadas a apenas um tipo de dispositivo.
Video: