0

nagios的配置

Posted in Linux at 五月 10th, 2011 / No Comments »

/usr/local/nagios/etc/nagios.cfg:

interval_length  表示时间单位,默认为60,即1分钟

/usr/local/nagios/etc/objects/services.cfg:

normal_check_interval  表示重新检测的时间间隔,默认为3个时间单位

check_interval  与normal_check_interval的作用一样,只能在3.X中使用

retry_check_interval  重试时间

max_check_attempts 这个是出现故障的连接次数,达到这个次数之后就报警

关于max_check_attempts、normal_check_interval、retry_check_interval三个参数。
首先要说明两个概念,一、软态:被监控项处于retry_check检测周期内的非正常状态;二、硬态:被监控项达到max_check_attempts最大次数后的非正常状态;除此之外的状态,我们估且称之为“常态”。
我们试着看看设置如下参数时,Nagios是怎么做状态检测及告警的:
引用
        max_check_attempts      3
        normal_check_interval      3
        retry_check_interval        2
        notification_interval         3

首先,Nagios每三分钟检测一次服务,当某次检测到服务状态为异常时,直接进入软态(1/3 soft state),此后,以每2分钟(retry_check_interval)的检测频率,再进行2次(一共进行3次检测,从而达到 max_check_attempts)检测,如果这两三检测服务都为异常,则直接进入硬态(hard state)。进入硬态后,Nagios以每3分钟(normal_check_interva)一次的频率检测服务,这与常态时是一样的;同时每3分钟(notification_interval)进行一次告警。

注意:修改这些参数后并不是即时生效。首先要重启nagios,然后等待下一次检测完成,nagios才会按新的参数计算检测时间与报警次数。

出现alert后,如果要发送email报警,需要满足以下条件:

service中有定义notifications_enabled=1,且此service的contacts有定义service_notification_commands。

service_notification_commands的command出自于commands.cfg,这里定义了使用什么命令发送邮件。

host的alert是一样的。

收不到邮件通常有以下几种可能:

邮件被拒收,检查mail的log可以看到。

service_notification_commands格式不正确,检查nagios的log可以查出问题。

http://vrlinux.com/wenzhangjingxuan/20100825/74091.html

http://www.itnms.net/discuz/viewthread.php?tid=475

http://nagiostutorial.com/nagios/~1626

Published in Linux

No Responses to “nagios的配置”

Leave a Reply

请输入算式结果(看不清请点击图片)
(必须)