系统环境
监控服务器:redhat linux as5,nagios-3.0.5, nagios-plugins-1.4.11
被监控端:windows2003,nsclient++0.3.3
本文档主要实现nagios监控windows主机,nagios监控windows系统有三种实现方式:SNMP、NSClient++、NRPE。
本文只介绍使用NSClient++方式来监控Windows,然后简单介绍一下nagios如何使用插件及自己编写插件参数。
1.Nagios的安装
1.安装基础支持套件
nagios需要apache,gcc,glibc,gd库等套件才能运行。
2.创建帐号及组
3.安装nagios
4.配置apache
在alias模块<IfModule alias_module>添加如下行。(如果是rpm安装apache,将下面行写入到alias处)
创建apache目录验证文件并重启apache
service httpd restart #重启apache
5.安装nagios-plugins
nagios-plugins是nagios官方提供的一套插件程序,nagios监控主机的功能其实都是通过执行插件程序来实现的。
6.其它设置
chkconfig --add nagios #配置机器启动时自动启动Nagios
vi /etc/selinux/config #关闭SELinux
service iptables stop #关闭SELinux,或打开80,5666端口
7.启动并访问
启动
访问nagios
http://192.168.0.20/nagios/
nagios已经正常运行,现在它只监控了它自己。
2.监控Windows服务器
nagios监控windows系统有三种实现方式:SNMP,NSClient++,NRPE,后面两种方式都需要在windows上安装agent,本文档只介绍使用NSClient++方式来监控Windows。
1.windows设置
把nsclient++0.3.3.zip解压到C盘然后进入命今窗口安装
编辑NES.ini
[modules] #去掉注释符号”;”除了CheckWMI.dll和RemoteConfiguration.dll
FileLogger.dll
CheckSystem.dll
CheckDisk.dll
NSClientListener.dll
[Settings]
allowd_host=192.168.0.20/32 #些处为nagios服务的IP
[NSClient]
port=12489 #去掉注释就可以了!
启动nsclient服务并确认端口是否打开
2.nagios设置
接下来我们开始配置nagios服务器里面的内容,因为nagios是模块化调用,先到配置文件打开windows相关模块。
vi /usr/local/nagios/etc/nagios.cfg
打开模块后配置windows.cfg
vi /usr/local/nagios/etc/objects/windows.cfg
define host{
use windows-server
host_name winserver #被监控主机名
alias My Windows Server
address 192.168.0.8 ; 被监控的windows地址
#把下面的host_name都改成winserver
define service{
use generic-service
host_name winserver
service_description CPU Load
check_command check_nt!CPULOAD!-l 5,80,90 #监控CPU使用
}
define service{
use generic-service
host_name winserver
service_description Memory Usage
check_command check_nt!MEMUSE!-w 80 -c 90 #监控内存
}
打开windows模块,设置windows.cfg中相关被监控主机与监控内容后nagios服务器就配置完了,下面重启nagios然后看一下监控结果。
service nagios start
呵呵,监控到了,现在windows运行一切正常。
3.Nagios监控相关内容
1).nagios目录功能的简要说明
bin
Nagios执行程序所在目录,nagios文件即为主程序
etc
Nagios配置文件位置
sbin
Nagios Cgi文件所在目录,也就是执行外部命令所需文件所在的目录
Share
Nagios网页文件所在的目录
Var
Nagios日志文件、spid 等文件所在的目录
var/archives
日志归档目录
var/rw
用来存放外部命令文件
libexec
存放nagios插件
2)如何使用nagios插件
上面监控windows使用了check_nt插件(插件都放在/usr/local/nagios/libexec)
[root@cxy ~]# ls /usr/local/nagios/libexec/
check_apt check_ftp check_mailq check_overcr check_tcp
check_breeze check_http check_mrtg check_ping check_time
check_by_ssh check_icmp check_mrtgtraf check_pop check_udp
check_clamd check_ide_smart check_nagios check_procs check_ups
check_cluster check_ifoperstatus check_nntp check_real check_users
check_dhcp check_ifstatus check_nntps check_rpc check_wave
check_dig check_imap check_nrpe check_sensors negate
check_disk check_ircd check_nt check_simap urlize
可以看到有很多插件我们也可以使用帮助来自己写监控代码
例如查看check_nt帮助
[root@cxy libexec]# pwd
/usr/local/nagios/libexec
[root@cxy libexec]# ./check_nt -h
Usage:check_nt -H host -v variable [-p port] [-w warning] [-c critical][-l params] [-d SHOWALL] [-t timeout]
#监控CPU写法
CPULOAD =
Average CPU load on last x minutes.
Request a -l parameter with the following syntax:
-l <minutes range>,<warning threshold>,<critical threshold>.
<minute range> should be less than 24*60.
Thresholds are percentage and up to 10 requests can be done in one shot.
ie: -l 60,90,95,120,90,95
#完整写法为
check_nt!CPULOAD!-l 5,80,90
check_nt调用cpuload,5分钟内负载平均达到80%为warning,负载达到90%为critical
#监控磁盘使用
UsedDISKSPACE =
Size and percentage of disk use.
Request a -l parameter containing the drive letter only.
Warning and critical thresholds can be specified with -w and -c.
#如果要监控C盘,达到80%报警,达到90%为严重危险
check_nt!USEDDISKSPACE!-l c -w 80 -c 90