Checkmk Pra Ontem – Estados de Componentes ou Serviços

Vídeo no final da pagina.

Os Services ou Componentes como gosto de chamar são todas as métricas que podem ser obtidas de nossos hosts. Podemos coletar métricas de desempenho, capacidades e outras diversas. Os estados que eles podem assumir são definidos de acordo com os gatilhos que são aplicados por meio de regras. Um exemplo de gatilho comum é o usado para espaço em disco, onde podemos definir que ao passar de 80% seja usado o estado de Warning ou Alerta e ao ultrapassar 95% podemos definir para o estado Critical ou Critico. Vou mostrar agora com mais detalhes:

OK: O Componente está em bom funcionamento. No exemplo abaixo indica que a diferença de horário entre o servidor monitorado e o servidor de monitoramento está dentro do aceitável e logo abaixo temos um exemplo referente ao uso de CPU:

WARNING: O componente está em estado de alerta. No exemplo abaixo a diferença de horário entre o servidor de monitoramento e o servidor monitorado esta superior a 30 segundos, se fosse superior a 30 segundos o estado seria Critico:

CRITICAL: O Service está em estado crítico. No exemplo abaixo estamos considerando novamente a diferença de horario entre o servidor de monitoramento e o servidor monitorado, observe que agora a diferença esta em 2 minutos e 29 segundos:

UNKNOWN: O Service está em estado desconhecido. Este caso é uma placa de rede que foi descoberta e em seguida foi removida do servidor, como o Checkmk não consegue encontrar ela ele assume que o estado é desconhecido.

Para os estados WARNING e CRITICAL podemos definir regras das mais diversas maneiras, criando exceções ou mesmo regras que vão ser aplicadas a apenas um tipo de dispositivo.

Video:

Translate »