【经典】肇庆市教育局基于云平台的《纤语监控方案》

2016-6-20 11:50| 发布者: top18oo| 查看: 433| 评论: 0 |原作者: 建安君 |来自: 纤语网络

监控一直是企业机房设备的重中之重,在肇庆市教育局是纤语网络的经典一役,解决方案如下:

Ubuntu Server下Nagios3简易安装与配置
一、引言
Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。
网上很多语焉不详的Nagios搭建过程描述,有些照着做根本就不能正确运行。本文结合多篇Nagios安装配置教程及使用的系统本身特性,以最方便最快捷的方式搭建一个实用的监控服务器,方便之后的优化完善。


二、系统安装与准备
本例使用VirtualBox在虚拟机环境下进行部署,使用的系统如下:
Nagios服务端:Ubuntu Server 14.04.2 + xubuntu-desktop
Linux客户端:Ubuntu Server 14.04.2
Windows客户端:Windows Server 2003 Enterprise Edition SP2

1.系统安装完毕,将/etc/apt/目录下的sources.list替换为163的sources.list,使用命令sudo apt-get update更新系统。
2.使用命令ps –e | grep ssh查看ssh服务是否已启动,如果看到sshd则说明ssh-server已启动;如果未启动则用命令sudo apt-get install openssh-server安装ssh-server后再次查看。
3.使用命令sudo passwd root修改root登录密码(因后面需要用到)。
4.输入命令sudo apt-get install xubuntu-desktop安装轻量级图形桌面xfce。
三、Nagios3安装与配置

图形桌面成功安装后,使用root登录进去。
1.Nagios安装
在桌面打开终端,输入命令apt-get install nagios3安装nagios3,几分钟后弹出邮件服务器配置界面:
按下Tab键并回车,在弹出的界面设置邮件服务器域名:
填写完毕,再次按下tab键并回车,在弹出的界面设置Nagios管理员nagiosadmin的登录密码:
回车,在弹出的界面再次输入密码确认:
接下来,等待Nagios自动完成安装(在此过程nagios-plugins将被自动安装):
2.Nagios监控本机配置
本例配置Nagios主要监控本机以下服务:
1. Disk Space:磁盘分区使用情况
2. Current Users:当前登录到系统的用户
3. Current Load:CPU负载
4. Total Processes:系统进程数
5. HTTP
6. SSH
在终端输入命令“df -h”查看硬盘分区信息:
进入/etc/nagios-plugins/config/目录,打开disk.cfg,将其“check_disk”和“check_all_disk”内容修改如下:
重启nagios3服务:
在宿主机(或虚拟机本机)打开浏览器,在地址栏输入http://ip/nagios3 (ip为nagios服务器的ip地址),用户名为nagiosadmin,密码即安装时配置的密码。进入界面后,点击左侧的“services”,本机配置的各服务均OK。
至此,nagios3已实现对本机的监控。如需添加监控的其他服务,只需修改本机配置文件localhost_nagios2.cfg再重启nagios。
3.Nagios监控Linux客户端配置
通过nrpe插件,nagios能实现对Linux客户端的监控。
①客户端配置:
安装好客户端unbuntu server后,同样要对其升级和完善,方法详见开头所述“系统安装与准备”。
切换到root用户,输入命令apt-get install nagios-nrpe-server安装nrpe。
安装完成后,输入命令“df -h”查看硬盘分区信息:
打开nrpe配置文件:vi /etc/nagios/nrpe.cfg,在allowed_hosts一行添加nagios服务器的IP地址:
修改command段(服务定义命令)内容如下:
 
重启nrpe:
②服务端配置:
在桌面打开终端,输入命令/usr/lib/nagios/plugins/check_nrpe –H ip (此ip为linux客户端的IP地址)检查nrpe,测试成功的话会输出客户端的NRPE版本号。
进入/etc/nagios3/conf.d/目录,在此目录下创建一个名为linux.cfg的空白文件,打开linux.cfg,添加以下内容定义Linux主机和服务:
服务说明:
1. check_disk:检查磁盘分区使用情况
2. check_users:检查当前登录到系统的用户
3. check_load:检查CPU负载
4. check_total_procs:检查系统进程数
5. check_zombie_procs:检查僵尸进程数
6. check_http:检查HTTP
7. check_ssh:检查SSH
③验证测试:
在终端输入service nagios3 restart重启nagios3,然后打开浏览器,在地址栏输入http://ip/nagios3 (ip为nagios服务器的ip地址),用户名为nagiosadmin,密码即安装时配置的密码。进入界面后,点击左侧的“services”,等待几分钟后,Linux客户端的各服务均OK:


至此,nagios成功实现对Linux的监控。如需添加监控的其他服务或增加Linux客户端,只需修改配置文件linux.cfg再重启nagios。
4.Nagios监控Windows客户端配置
通过NSClient++插件,nagios能实现对Windows客户端的监控。
①客户端配置:
安装好windows 2003 sp2后,还需安装IIS服务(可选)。初次运行NSClient++安装程序,发现不能安装,需要更新系统。更新系统完毕,再次运行NSClient++安装程序:

点击next,选择Typical安装,一直点击next。
跳到配置界面,在Allowed hosts一栏输入nagios服务器的IP地址,Passwore可以留空,下面的选项全部勾选:
点击next直至安装完成。
②服务端配置:
进入/etc/nagios-plugins/config/目录,打开nt.cfg文件,修改其内容如下(其中12489为NSClient++默认指定端口):
进入/etc/nagios3/conf.d/目录,在此目录下创建一个名为windows.cfg的空文件,并修改其内容如下:
服务说明:
1. CLIENTVERSION:检查windows客户端NSClient++版本
2. UPTIME:检查windows客户端正常运行时间
3. CPULOAD!-l 5,80,90:检查CPU负载,若5分钟内平均负载超80%则发出警告WARNING,而超90%则是危机报警CRITICAL alert
4. MEMUSE!-w 80 –c 90:检查内存负载,当内存使用率达80%则WARNING,而达90%则CRITICAL alert
5. USEDDISKSPACE!-l c –w 80 –c 90:检查C盘(-l后的c表示C盘)空间,使用率达80%则WARNING,而达90%则CRITICAL alert
6. SERVICESTATE!-d SHOWALL –l W3SVC:检查IIS服务状态,当服务停止则发送CRITICAL alert
7. PROCSTATE!-d SHOWALL –l explorer.exe:检查系统进程,当进程处于非运行状态时,则发送CRITICAL alert
③验证测试
在终端输入service nagios3 restart重启nagios3,然后打开浏览器,在地址栏输入http://ip/nagios3 (ip为nagios服务器的ip地址),用户名为nagiosadmin,密码即安装时配置的密码。进入界面后,点击左侧的“services”,等待几分钟后,Windows客户端的各服务均OK:

至此,nagios成功实现对Windows的监控。如需添加监控的其他服务或增加Windows客户端,只需修改配置文件windows.cfg再重启nagios。



<
 
QQ在线咨询
售前咨询热线
13926003607
售后服务热线
13926003607
返回顶部