• /
  • /

Мониторинг ИТ-инфраструктуры: для чего нужен, подходы и инструменты

Сегодня почти любая компания полностью зависит от стабильной работы ИТ-сервисов. Информационные технологии встроены во все бизнес- и производственные процессы. Поэтому компаниям очень важно следить за бесперебойной работой серверов, сетей, бизнес-приложений и внедрять системы ИТ-мониторинга.

Системы IT-мониторинга позволяют предотвращать инциденты, обеспечивать доступность услуг, поддерживать высокое качество обслуживания клиентов. В статье подробно расскажем о том, что они собой представляют, перечислим преимущества, рассмотрим основные подходы и инструменты для их организации.

Содержание

Что такое система мониторинга IT-инфраструктуры

Мониторинг ИТ-инфраструктуры представляет собой процесс наблюдения и анализа работы различных компонентов информационной среды компании: серверов, сетей, виртуальных машин, баз данных и приложений. Он включает в себя диагностику, оценку и отслеживание изменений в их функционировании. Мониторинг производится с помощью специальных программ, формирующих автоматизированную систему наблюдения. В случае возникновения ошибки или обнаружения уязвимости такая система сразу же оповестит о ней системного администратора, а также временно решит возникшую проблему.

Например, через час после начала рабочего дня в компании происходит сбой почтового сервера. Система мониторинга сразу же уведомляет администратора об инциденте, и он приступает к решению проблемы. Этот процесс может занять всего 20 минут. Без системы наблюдения сотрудники могли бы не получать письма в течение нескольких рабочих часов, и только звонки недовольных клиентов привлекли бы внимание к проблеме.

Весь процесс наблюдения за ИТ-инфраструктурой можно разбить на две составляющие:
  • Мониторинг оборудования
    Мониторинг оборудования
    • нагрузка на процессор;
    • загрузка оперативной памяти;
    • объем свободного дискового пространства;
    • пропускная способность сети;
    • количество запущенных задач в единицу времени и др.
  • Мониторинг ПО (приложений)
    Мониторинг ПО (приложений)
    • время отклика программ;
    • количество активных пользователей;
    • время выполнения запросов к базе данных;
    • количество запросов к базе данных;
    • число ошибок, зафиксированных в системе и др.
Это не весь перечень отслеживаемых показателей. Как правило, нужные критерии выбираются с учетом целей проекта и специфики бизнеса компании. Для эффективного контроля и управления ИТ-средой критерии и метрики должны анализироваться в комплексе.

Зачем нужен мониторинг состояния IT-инфраструктуры

Ключевая цель мониторинга ИТ-инфраструктуры – обеспечение стабильной и качественной работы всех систем, предотвращение сбоев и минимизация времени простоя. Процедура включает в себя:

  • Сбор и анализ данных. Инструменты мониторинга используются для изучения информации о загрузке и производительности ИТ-ресурсов компании, а также об общем состоянии оборудования. Например, можно проанализировать нагрузку на серверы, определить, есть ли перегруженные, или те, которые не используют свою мощность полностью. Это позволяет оптимизировать использование ресурсов и затраты на содержание ИТ-инфраструктуры компании.

  • Предотвращение инцидентов. Система мониторинга помогает обнаруживать проблемы в ИТ-инфраструктуре еще до того, как они станут серьезной проблемой и клиенты начнут обращаться за помощью через Service Desk. Это касается как нежелательных зависаний в работе сетей, так и серьезных сбоев, которые могут парализовать работу всего бизнеса или привести к потере критически важных данных и к финансовым убыткам.
Пример:
Непредвиденный выход из строя платежного терминала в магазине может привести к потере клиентов, которые не имеют наличных денег для оплаты товаров. А если такой сбой случится в нескольких торговых точках, то компания понесет существенные финансовые потери и приобретет клиентов с негативным пользовательским опытом.
  • Защита информации. Непрерывный мониторинг позволяет оперативно распознавать и предотвращать попытки несанкционированного доступа к данным, выявлять подозрительную активность и другие риски цифровой безопасности.

  • Планирование и прогнозирование. На основе анализа действующей в компании ИТ-инфраструктуры можно разрабатывать меры по ее дальнейшему развитию и масштабированию. Для этого учитываются будущие потребности бизнеса и прогнозируемый рост нагрузки на ИТ-систему.

Мониторинг ИТ-инфраструктуры необходим в любой компании, которая использует для работы компьютеры, серверы, программное обеспечение и другие ИТ-ресурсы. Для его организации существуют определенные методы и инструменты, о которых рассказываем далее.

Методы мониторинга

В ИТ-сфере нет единой устоявшейся классификации методов мониторинга, но условно можно выделить два основных типа его организации: инфраструктурный (классический) и зонтичный.

Инфраструктурный фокусируется на мониторинге и управлении отдельными объектами сети. Такими объектами могут быть серверы, рабочие станции, сети, базы данных, различные контроллеры, датчики и другие элементы. Для каждого из них настраиваются оптимальные рабочие значения, при отклонении от которых система наблюдения отправляет уведомление о сбое в работе оборудования техническим специалистам. Такой тип мониторинга автоматизирует проверку функционирования различных компонентов ИТ-инфраструктуры и освобождает сотрудников от каждодневной ручной диагностики.

Однако, у данного подхода есть недостаток – когда мониторинг осуществляется только для отдельных систем, крайне сложно составить представление о ситуации в ИТ-среде компании в целом. А так как оборудование и бизнес-процессы тесно взаимосвязаны, важно понимать их влияние друг на друга, и где именно искать источник проблемы в случае инцидента. Это особенно актуально для компаний с сетью филиалов и множеством разделенных ИТ-процессов.

Зонтичный мониторинг позволяет подойти к наблюдению за работой сети комплексно. Он аккумулирует данные, поступающие из всех подключенных источников мониторинга, анализирует их и выводит информацию в единой консоли в режиме реального времени. При этом системным администраторам видна четкая связь между элементами сети, и как одно событие влияет на другое. Все метрики ИТ-процессов находятся под единым наблюдением специалистов – под «зонтиком».

Такой подход оптимален для компаний, чья деятельность сильно зависит от бесперебойной работы цифровой инфраструктуры, и у которых есть четко прописанные SLA для предоставляемых услуг, из-за чего в случае инцидента они несут значительные финансовые и репутационные потери. Как правило, это крупный и средний бизнес с сетями филиалов в разных городах, сложной ИТ-инфраструктурой (большое количество серверов, дата-центров, облачных решений, баз данных, приложений), а также со множеством инструментов мониторинга. К такому бизнесу относятся банки, онлайн-магазины, супермаркеты и торговые сети, компании в сфере телекоммуникаций.

Каждая компания может выбрать наиболее подходящий ей тип мониторинга, а также совмещать их. Например, для малого и среднего бизнеса с достаточно простым ИТ-ландшафтом, небольшой командой техподдержки и эффективно налаженными единичными системами наблюдения будет достаточно проведения классического ИТ-мониторинга. А крупная компания может использовать зонтичный мониторинг для большей части своих подразделений, и только для отдельного, в котором контролируется ограниченный объем компонентов, – инфраструктурный.

Инструменты мониторинга

Независимо от выбранного типа ИТ-мониторинга, для его организации нужны эффективные инструменты. Рассмотрим наиболее популярные решения из доступных на цифровом рынке:

  • Zabbix. Это система с открытым исходным кодом для мониторинга состояния компьютерной сети в реальном времени – серверов, сетевого оборудования, баз данных, приложений. Она собирает и анализирует производительность компонентов сети, их доступность, количество работающих программ, загрузку процессора и оперативной памяти.
Пример мониторинга Zabbix
Пример мониторинга Zabbix. Источник - https://www.zabbix.com/
Zabbix позволяет гибко настраивать уведомления, в том числе через электронную почту и SMS, что помогает оперативно реагировать на любые инциденты.

Также система поддерживает протокол SNMP и предоставляет расширенные возможности для формирования отчетов и визуализации данных. Zabbix прост в установке и конфигурации, с ним легко работать и недорого обслуживать Все это делает его инструментом, который широко используется в компаниях любого масштаба.

Zabbix разработан и доступен для использования под лицензией GPL (GNU General Public License) версии 2. Это подразумевает, что исходный код является свободным для распространения, и его может использовать любой желающий.

  • Nagios. Еще одна система с открытым исходным кодом для наблюдения за компонентами ИТ-ландшафта компании. Мониторинг ведется в режиме реального времени через удобный веб-интерфейс, есть гибкие настройки оповещений, поддержка интернет-протоколов SNMP, HTTP, SSH. Система поддерживает множество плагинов, что позволяет интегрировать ее практически с любым типом стороннего программного обеспечения. Базовый функционал Nagios реализован на высокопроизводительном ядре Core 4, благодаря чему потребляется меньше ресурсов сервера.

  • Icinga. Эта система мониторинга изначально была ответвлением от Nagios, но со временем стала проще и понятнее для пользователей, а также намного производительнее. Позволяет наблюдать за всеми сетевыми сервисами и оборудованием,поддерживает протокол SNMP, работает в различных операционных системах. Есть шаблоны для формирования отчетов. В Icinga применяется открытый исходный код под лицензией GNU General Public License Version 2.
Мониторинг Icinga.
Мониторинг Icinga. Источник – https://github.com/translaster/icingaweb2-ru
  • Prometheus. Также собирает информацию о состоянии серверов и систем, но делает это методом, отличным от остальных программ мониторинга. Как правило, объекты наблюдения отправляют данные на подключенные к ним сервера мониторинга. Prometheus же самостоятельно обращается к целевым серверам и устройствам через HTTP-вызовы и извлекает необходимые параметры с временными интервалами, заданными пользователем. В таком подходе к сбору данных есть определенное преимущество – централизованный контроль. Если Prometheus инициирует запросы к целевым объектам, то и вся конфигурация осуществляется непосредственно в Prometheus, а не в отдельных системах.
Пример мониторинга Prometheus
Пример мониторинга Prometheus. Источник – https://habr.com/ru/companies/selectel/articles/275803/
  • Grafana. Это решение не является системой мониторинга, но представляет собой эффективный инструмент визуализации и анализа полученных данных. Для этого используются различные панельные модули, с помощью которых которых можно создавать красивые визуализации, например, тепловые карты, гистограммы, а также таблицы (dashboards), круговые и линейные графики и диаграммы. Как правило, работает в связке с Prometheus, MS SQL, MySQL, PostgreSQL, а также интегрируется с Zabbix, Nagios и другими системами. Распространяется бесплатно по лицензии GNU AGPL v3.
Пример мониторинга Grafana
Пример визуализации данных в Grafana

Внедрение систем ИТ-мониторинга

Для внедрения системы ИТ-мониторинга компания может рассмотреть два варианта.

Первый – это расширение собственного штата и найм ИТ-инженеров, которые будут отвечать за проектирование систем наблюдения, соответствующих нуждам компании, а также сотрудников в службу поддержки для дальнейшей работы с системами мониторинга. Этот вариант потребует дополнительных финансовых инвестиций и подойдет крупным компаниям, деятельность которых связана с ежедневной высокой нагрузкой на IT-поддержку, цифровую инфраструктуру или разработку. При этом бизнес не будет зависеть от внешних поставщиков услуг.

Второй вариант – привлечение аутсорсинговой компании. Если информационные технологии не являются ключевым направлением деятельности бизнеса, то передача мониторинга ИТ-инфраструктуры стороннему подрядчику будет оптимальным решением. Это значительно дешевле поиска и найма штатных сотрудников. Делегирование ответственности за ИТ-процессы опытным специалистам позволяет компаниями сосредоточить усилия на ключевых для бизнеса задачах. Такой вариант подойдет для малого и среднего бизнеса.

Выбор между расширением внутреннего IT-отдела и использованием аутсорсинга зависит от финансовых возможностей и стратегических задач компании. В определенных ситуациях наиболее разумным вариантом может стать комбинированный подход, при котором задействуются как внутренние ресурсы компании, так и услуги стороннего подрядчика.

Нужен мониторинг ИТ-инфраструктуры?

Мы поможем!

Оставьте заявку на консультацию