check_ganglia_metric

Screenshot Software:
check_ganglia_metric
Szczegóły programowe:
Wersja: 2012.02.28
Filmu: 15 Apr 15
Wywoływacz: Michael T. Conigliaro
Licencja: Wolny
Popularność: 34

Rating: 2.0/5 (Total Votes: 2)

check_ganglia_metric jest plugin Nagios, który pozwala wyzwalać alarmy na dowolnym zwoje metrycznym.
check_ganglia_metric był mocno zainspirowany check_ganglia_metric.php Władimira Vuksan, ale jest wyposażony w szereg ulepszeń.

Instalacja

# Pip install check_ganglia_metric
... Lub:
# Easy_install check_ganglia_metric
zwoje Konfiguracja
Jeśli twój serwer Nagios i zwoje Meta Daemon są uruchomione na tym samym komputerze, prawdopodobnie trzeba edytować gmetad.conf aby umożliwić zdalne połączenia z serwerem Nagios.
Aby zezwolić na połączenia z nagios-server.example.com:
trusted_hosts nagios-server.example.com
Aby zezwolić na połączenia od wszystkich hostów (prawdopodobnie zagrożeń bezpieczeństwa):
all_trusted na
Testy na linii poleceń
Najpierw zobaczmy, czy check_ganglia_metric może komunikować się z zwoje Meta Daemon:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle
Stan Ok, bezczynności procesora = 99,3% | 99,3% = cpu_idle ;;;;
Komunikat "Stan Ok" wskazuje, że check_ganglia_metric działa. Jeśli masz problemy z uzyskaniem tego do pracy, spróbuj ponownie z pełnym rejestrowaniem włączona (--verbose), aby uzyskać lepszy wgląd w to, co się dzieje źle.
Teraz spróbuj ustawić próg alarmowy:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
Stan krytyczny, bezczynności procesora = 99,6% | 99,6% cpu_idle = 99 ;; ;;
Powiedzieliśmy check_ganglia_metric wrócić status "krytyczny" w przypadku bezczynności procesora była większa niż 99. komunikat "Stan krytyczny" oznacza, że ​​to działa. Należy pamiętać, że check_ganglia_metric analizuje zakresy i progi zgodnie z oficjalnymi wytycznymi rozwoju wtyczki Nagios.
Aby zobaczyć pełną listę opcji wiersza poleceń z krótkimi opisami, prowadzonych check_ganglia_metric z opcją --help.
Nagios Konfiguracja
Po pierwsze, należy utworzyć definicję polecenia:
polecenie zdefiniować {
& Nbsp; command_name check_ganglia_metric
& Nbsp; command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ HOSTADDRESS $ --metric_name = $ ARG1 $ --warning ARG2 $ = $ = $ Arg3 --critical $
}
Teraz możesz skorzystać z powyższego polecenia w waszych definicji usług:
zdefiniować usługę {
& Nbsp; service_description CPU bezczynności - zwoje
& Nbsp; wykorzystanie some_template
! & Nbsp; check_command check_ganglia_metric cpu_idle 0: 20 0: 0!
& Nbsp; nazwę_hosta host.example.com
}
To działa dobrze, dopóki coś się nie uda z check_ganglia_metric (np plik cache nie mogą być odczytywane / zapisywane, zwoje Meta Demon nie może być osiągnięty, itp). W tym momencie każda usługa, która polega na check_ganglia_metric nie powiedzie, być może zalewać was z wpisami. Można temu zapobiec dzięki zastosowaniu zależności usług.
Pierwszą rzeczą, jaką musimy to definicja polecenie sprawdzenia wieku pliku:
polecenie zdefiniować {
& Nbsp; command_name check_file_age
& Nbsp; command_line / usr / lib / nagios / plugins / check_file_age -f $ ARG1 $ -w ARG2 $ $ $ Arg3 $ -c
}
Następnie definiujemy usługę, która sprawdza wiek pliku cache check_ganglia_metric za. Należy pamiętać, że aby być naprawdę skuteczne, usługa ta powinna być sprawdzana co najmniej (najlepiej więcej) częściej niż wszystkie inne kontrole, które polegają na check_ganglia_metric:
zdefiniować usługę {
& Nbsp; service_description Cache dla check_ganglia_metric
& Nbsp; wykorzystanie some_template
& Nbsp;!!! Check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60 120
& Nbsp; nazwę_hosta localhost
& Nbsp; check_interval 1
& nbsp; max_check_attempts 1
}
I wreszcie, utworzyliśmy rzeczywistą zależność usługi. Zauważ, że mam włączony use_regexp_matching w Nagios, który pozwala mi korzystać z wyrażeń regularnych w moich dyrektyw. Przez trzymanie "- zwoje" na końcu każdej usługi, która polega na check_ganglia_metric, mogę zaoszczędzić sobie wiele wysiłku:
zdefiniować servicedependency {
& Nbsp; nazwę_hosta localhost
& Nbsp; service_description Cache dla check_ganglia_metric
& Nbsp; dependent_host_name *.
. & Nbsp; dependent_service_description * - zwoje $
& Nbsp; execution_failure_criteria c, p
}
Teraz, jeśli coś pójdzie nie tak z check_ganglia_metric, tylko jeden alert zostanie wysłana o pliku pamięci podręcznej, a wszystkie usługi zależne Kontrole będą wstrzymane aż do rozwiązania problemu, który spowodował check_ganglia_metric na porażkę. Kiedy problem zostanie rozwiązany, trzeba zaktualizować znacznik czasowy pliku pamięci podręcznej, aby umieścić "Cache dla check_ganglia_metric" usługi z powrotem do stanu OK (co pozwoli na utrzymaniu kontroli, by nadal):
& Nbsp; dotykowy /var/lib/nagios/.check_ganglia_metric.cache
Porady
Jest to możliwe, aby uzyskać pełną listę dostępnych hostów i metryki, umożliwiając "więcej komunikatów" rejestrowanie (-vv). Ponieważ wymagane są opcje metric_host i METRIC_NAME, masz trochę na "jajka i kury" problem tutaj, ale to jest OK. Wystarczy dostarczyć pewne dane fikcyjne. Wtyczka błędu na końcu z "przyjmującego / metryczny nie znaleziono" błędów, ale nie przed jego zrzuca pamięć podręczną:
& Nbsp; check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = manekin --metric_name = -vv manekin

Co nowego w tym wydaniu:

  • Dodaj - Opcja -metrics_max_age
  • Merge CHANGELOG.rst do README.rst

Wymagania :

  • Python
  • Nagios,

Ograniczenia :

  • Nie działa z Pythonem 2.4

Podobne oprogramowanie

Zorp
Zorp

20 Feb 15

SmokePing
SmokePing

2 Jun 15

NetXMS
NetXMS

17 Feb 15

Komentarze do check_ganglia_metric

Komentarze nie znaleziono
Dodaj komentarz
Włącz zdjęć!