logo

Select Sidearea

Populate the sidearea with useful widgets. It’s simple to add images, categories, latest post, social media icon links, tag clouds, and more.
hello@youremail.com
+1234567890
 

Мониторинг

Выявление отклонений - основа стабильности

Мониторинг событий

Для мониоринга событий хорошо подходит стек ELK, так как приспособлен для эффективной работы с большими объемами текстовой информации. Пытаться как то использовать, например, Zabbix для мониторинга ТЖ 1С можно, но такой мониторинг будет иметь серьезные ограничения в возможностях.

Мониторинг ТЖ 1С является одновременно простой и сложной задачей. Она проста, так как точно известно, что есть журнал, который, при определенных настройках, включает в себя вообще все события. Ее сложность в том, что даже за час этот журнал может стать настолько большим, что некоторые средства для работы с нми становытся не применимы. Elasticsearch проектировался для работы с большими объемами произвольных текстовых данных и для решения задачь их анализа. После загрузки и разбора событий из ТЖ 1С в Elasticsearch становится доступна возможность в течение короткого промежутка времени решить достаточно сложные задачи. Такой вопрос, как «На каких регионах чаще всего возникают длительные блокировки и кто из пользователей из ставит?» очень легко решается с помощью Kibana. Помимо решения аналитических задач, с помощью ELK существует возможность также вести оперативный мониторинг с отправкой оповещений.

Функционально стек ELK может быть представлен следующим образом:

Сбор данных

Эту роль берут на себя так называемые beats - программы для передачи в Elasticsearch

Обработка

Logstash выполняет разбор получаемых событий, применяет фильтры, добавляет поля и устанавливает типы данных

Хранение

В Elasticsearch реализована одна из лучших архитектур, дающая возможность эффективно хранить и искать данные

Анализ

Kibana - современное веб-приложение, которое поможет визуализировать данные и получить из них нужную информацию

Мониторинг метрик

Мониторинг метрик, заключающийся в накоплении значений каких-то числовых показателей, значительно менее требователен к ресурсам при хранении и анализе. Для мониоринга метрик в большинстве случаев применимы Zabbix и Prometheus.

Prometheus — еще одна из применяемых систем мониторинга, основанная на метриках. Она имеет очень развитый математический аппарат и даже собственный язык запросов — PromQL. Для визуализации, как правило, применяется очень гибко настраиваемое веб-приложение Grafana. Благодаря своим возможностям, Prometheus хорошо подходит для мониторинга сложных приложений, например, серверов СУБД или контейнерных сред.

Успешно применено на практике выделение следующих видов мониторинга:

Оперативный мониторинг

Отслеживание текущей ситуации и генерирование оповещений

Аналитический мониторинг

Накопление данных и выполнение их анализа после наступления отраженных в них событий

Мониторинг основных трендов

Создание ключевых точек для отслеживания показателей на больших интервалах времени

Мониторинг мониторинга

Мониторнг исправности поступления новых данных от наблюдаемых систем

Мониторинг инфраструктуры удобно выполнять с помощью Zabbix благодаря его универсальности. Агенты для активных проверок есть для любой операционной системы, помимо этого поддерживается взаимодействие по протоколу SNMP и с помощью IPMI. Этого достаточно для решения очент большого числа задач. Благодаря возможности наносить узлы на карту, Zabbix представляет собой также очень хороший инструмент для визуализации. Далее будет показана возможность поддержантия карт и информации об узлах сети в Zabbix в актуальном виде с помощью ansible.

Одной из целей мониторинга ИТ инфраструктуры является проактивное выявление и устранение сбоев. Это значит, что при возникновении проблемы оператору о ней должно стать известно прежде, чем о ней узнают пользователи системы. Проактивное реагирование на сбои добавляет устойчивости всей системе, так как позволяет избежать более серьезных проблем при промедлении. Особенно, это касается мониоринга состояния жестких дисков, других аппаратных частей серверов и сетевых устройств.