Nagios hadoop hdfs sjekk

  • Dette er en sjekk for å undersøke status på hdfs i et hadoop cluster
  • Eksisterende sjekker ga ikkje den informasjonen eg trengde, så eg hacka sammen en liten test. Det er ikkje vakker kode, men det fungerer for meg.
  • Sjekken bruker admin-web-sida til hdfs, som normalt fins på http://hdfs-namenode:50070/dfshealth.jsp Dette er berre enkel regex-parsing av utput fra denne websida
  • Ny versjon, som ikkje trenger links, Last ned her check_hadoop0.4
  • Krever nagios perl-moduler, utils.pm
  • Testa mot hadoop 0.20.2
  • Gir performancedata for b.l.a. størrelse på hdfs, u-replikerte blokker, noder ok/dead etc

check_hadoop_hdfs v. 0.4
Copyright (c) 2011 Jon Ottar Runde, jru@rundeconsult.no
See http://www.rundeconsult.no/?p=38 for updated versions and documentation
Usage: -w <warn> -c <crit> -x <Unreplicated blocks warn> -u <Unreplicated blocks crit> -H <Hostname> -p <Port> [-v version] [-h help]

Checks several Hadoop hdfs-parameters
-H (–Host)
-p (–Port)
-w (–warning)   = warning for DFS Usage
-c (–critical)  = critical limit for DFS Usage  (w < c )
-x (–unreplicatedwarn) = Warning limit for Unreplicated blocks
-u (–unreplicatedcritical) = Error limit for Unreplicated blocks
-h (–help)
-v (–version)

Eksempel Nagios-config

define service{
use                          generic_service
service_description    Hadoop_Extended Check
check_command       check_hadoop_extended
hosts                       namenode.company.com
}

define command{
command_name        check_hadoop_extended
command_line        $USER1$/check_hadoop.pl -H namenode.company.com  -p 50070 -w 5 -c 10 -x 100 -u 1000
}

Leave a Comment