Мониторинг сервера
Данная статья является продолжением серверной тематики. Подняв свой
сервер, за ним необходимо следить. Ведь он, как ребенок, нуждается во
внимании, заботе и обеспечении безопасности. Нужно следить за состоянием
как аппаратной, так и программной части. Отслеживать на нем все
внештатные ситуации, такие как перегруз, атака на сервер или выход из
строя жестких дисков в raid массиве. Вот здесь нам помогут некоторые
утилиты, о которых я расскажу чуть ниже. Сразу оговорюсь, что это просто
обзорная статья и здесь не будут расписаны способы установки этих
утилит.
Итак, одним из критически важных компонентов сервера является жесткий диск.
Именно его состоянию необходимо уделять огромное внимание. Желательно,
чтобы у вас был настроен RAID. Например, RAID 1 повышает вероятность
сохранности данных в 2 раза, а RAID 10 еще и скорость записи. Одним из
признаков того, что что-то не так, является распад RAID-массива. Тут
необходимо просмотреть логи, а также S.M.A.R.T. дисков. Логи обычно хранятся в /var/log, ну а S.M.A.R.T. можно глянуть при помощи утилиты smartctl. Если есть ошибки, то желательно этот диск заменить и не использовать больше на сервере.
Температура. Перегрев - крайне нежелательное состояние
для любой техники, и компьютер не исключение. Да, на уровне BIOS есть
защита, которая не даст спалить ваш процессор, просто отключив питание в
критический момент. Но нам ведь этого не надо?! Сервер, по возможности,
должен стоять в прохладном месте. Да в прочем, и любая другая техника
не откажется от такого блага в +30. Следить за температурой можно при
помощи sensorsd.
Нагрузка на сервер. Одна нелепая ошибка в приложении
или скрипте может стоить употреблением всех ресурсов этим приложением
или скриптом. Если серьезно, то тут все зависит от того, где стоит и для
чего предназначен этот сервер. Домашний сервер, вряд ли, ждет перегруз.
Но все же, время от времени лучше за ним поглядывать, для этого можно
использовать htop (удобно и понятно).
Важно не забывать про антивирусную защиту
сервера. В случае с почтовым сервером можно "на лету" проверять почту
на содержание вредосного кода и СПАМа. На файловом хранилище -
заливаемые файлы. Говоря про защиту, невозможно не упомянуть про firewall.
Лучше закрыть все порты и оставить только нужные для правильной работы.
SSH перенести со стандартного порта. Ну и временами проверять Auth.log. Иногда, там можно увидеть что-то интересное.
Все это, конечно, хорошо. Но не удобно пользоваться всем этим
по-отдельности. Нужно запускать каждую утилиту отдельно или же запускать
их скриптом, при этом просматривая кучу лишних данных. Именно для этого
существуют комплексные экраны отслеживания. И один из них - Zabbix.
Гибкий и удобный инструмент системного администратора. Отлично
дополняется при надобности. Есть несколько способов оповещения о
проблеме - email, jabber, sms. Есть очень удобная вещь - карта сети. То
есть, можно так же отслеживать и другие сетевые устройства, такие как
роутер, рабочие станции пользователей и т.д. Все удобно в читабельном
виде выводится в виде графиков, к тому же легко устанавливается. Проблем
с ним возникнуть не должно.
На этом все. Стабильной работы и большого аптайма вам.
http://linux-easy.ru/blog/nastrojka/server/monitoring-servera.html
|