Для мониоринга событий хорошо подходит стек ELK, так как приспособлен для эффективной работы с большими объемами текстовой информации. Пытаться как то использовать, например, Zabbix для мониторинга ТЖ 1С можно, но такой мониторинг будет иметь серьезные ограничения в возможностях.
Мониторинг ТЖ 1С является одновременно простой и сложной задачей. Она проста, так как точно известно, что есть журнал, который, при определенных настройках, включает в себя вообще все события. Ее сложность в том, что даже за час этот журнал может стать настолько большим, что некоторые средства для работы с нми становытся не применимы. Elasticsearch проектировался для работы с большими объемами произвольных текстовых данных и для решения задачь их анализа. После загрузки и разбора событий из ТЖ 1С в Elasticsearch становится доступна возможность в течение короткого промежутка времени решить достаточно сложные задачи. Такой вопрос, как «На каких регионах чаще всего возникают длительные блокировки и кто из пользователей из ставит?» очень легко решается с помощью Kibana. Помимо решения аналитических задач, с помощью ELK существует возможность также вести оперативный мониторинг с отправкой оповещений.
Функционально стек ELK может быть представлен следующим образом:
Эту роль берут на себя так называемые beats - программы для передачи в Elasticsearch
Logstash выполняет разбор получаемых событий, применяет фильтры, добавляет поля и устанавливает типы данных
В Elasticsearch реализована одна из лучших архитектур, дающая возможность эффективно хранить и искать данные
Kibana - современное веб-приложение, которое поможет визуализировать данные и получить из них нужную информацию
Мониторинг метрик, заключающийся в накоплении значений каких-то числовых показателей, значительно менее требователен к ресурсам при хранении и анализе. Для мониоринга метрик в большинстве случаев применимы Zabbix и Prometheus.
Prometheus — еще одна из применяемых систем мониторинга, основанная на метриках. Она имеет очень развитый математический аппарат и даже собственный язык запросов — PromQL. Для визуализации, как правило, применяется очень гибко настраиваемое веб-приложение Grafana. Благодаря своим возможностям, Prometheus хорошо подходит для мониторинга сложных приложений, например, серверов СУБД или контейнерных сред.
Успешно применено на практике выделение следующих видов мониторинга:
Отслеживание текущей ситуации и генерирование оповещений
Накопление данных и выполнение их анализа после наступления отраженных в них событий
Создание ключевых точек для отслеживания показателей на больших интервалах времени
Мониторнг исправности поступления новых данных от наблюдаемых систем
Мониторинг инфраструктуры удобно выполнять с помощью Zabbix благодаря его универсальности. Агенты для активных проверок есть для любой операционной системы, помимо этого поддерживается взаимодействие по протоколу SNMP и с помощью IPMI. Этого достаточно для решения очент большого числа задач. Благодаря возможности наносить узлы на карту, Zabbix представляет собой также очень хороший инструмент для визуализации. Далее будет показана возможность поддержантия карт и информации об узлах сети в Zabbix в актуальном виде с помощью ansible.
Одной из целей мониторинга ИТ инфраструктуры является проактивное выявление и устранение сбоев. Это значит, что при возникновении проблемы оператору о ней должно стать известно прежде, чем о ней узнают пользователи системы. Проактивное реагирование на сбои добавляет устойчивости всей системе, так как позволяет избежать более серьезных проблем при промедлении. Особенно, это касается мониоринга состояния жестких дисков, других аппаратных частей серверов и сетевых устройств.