««Всё было нормально» – как вовремя замечать и не допускать проблемы в серверной
Одна из серьёзных проблем серверных, работающих без должного контроля, – это отсутствие или некорректная работа систем алертинга и мониторинга. Без них ИТ-инфраструктура превращается в «чёрный ящик»: всё работает – пока не перестанет.
А когда перестанет, восстановление работы занимает часы и дни, а не секунды и минуты.

Разберёмся, как алертинг и мониторинг помогают эффективно следить за состоянием серверной. С помощью мониторинга администраторы могут постоянно наблюдать за состоянием систем: CPU, RAM, дисков, сети, процессов, логов, сервисов. Алертинг же – это средства для их автоматического уведомления (по email, Telegram, SMS и т.п.) при выходе метрик за допустимые пределы.
Другими словами, мониторинг и алертинг помогают следить за состоянием программ и оборудования в серверной, а при возникновении аварий, быстро с ним справляться. А что, если таких систем нет в вашей ИТ-инфраструктуре?
Риски
-
Проблемы обнаруживаются поздно. Если проблема возникла в конце дня, бухгалтер может её и не заметить до следующего рабочего утра. Вечер, ночь, а то и выходные, когда проблема могла бы быть устранена, прошли зря. Бухгалтер обнаружит её поздно, а техподдержка поздно начнёт её устранять.
-
Обычная история с переполнением жёсткого диска может стать фатальной для баз. В серверных массивах аварийное завершение работы одного диска может навредить всем остальным.
-
Долгая реакция на крах системы. Если информация о системе нигде не записывалась, разобраться, что именно сломалось, может быть непросто. Время на диагностику проблем увеличивается в разы и десятки раз.
Стоит ли говорить, что подобные проблемы, это лишние ресурсы (время, оборудование, занятость специалистов), которые правильнее было бы вложить в развитие и профилактику проблем.
Что мониторить
Эксперты выделяют минимум тестов, который позволит избежать большого числа аварий в серверной бухгалтерии.
-
Диски. Это поможет избежать потери данных и падения баз данных.
-
Память. Средство от внезапных перезагрузок, тормозов и аварийного завершения работы программ.
-
Процессорная нагрузка. Предотвращает зависания.
-
Сеть. Чтобы всегда можно было подключиться к нужной базе.
-
Температура. Подробности тут: https://vk.com/wall-229201059_65
-
Сервисы (программные компоненты). Важна совместимость компонентов для корректной работы бухгалтерских программ.
-
Логи. Необходимо для выявления «первых звоночков» и установления всех обстоятельств происшествий
Как построить систему мониторинга и алертинга?
Построение подобной системы с нуля – трудоёмкий и недешёвый процесс, который требует от организатора времени, выделения вычислительных мощностей (нового оборудования?), особых профессиональных навыков, а после внедрения – постоянного внимания технических специалистов.
Если в вашей организации всё это в дефиците, то имеет смысл передать эту работу на аутсорс внешним подрядчикам.
Центр по инновациям и инфраструктуре АРБИС для своих клиентов реализует услугу «Мониторинг и сопровождение», которая включает мониторинг и алертинг, и обеспечивается всеми необходимыми ресурсами, чтобы приглядывать за оборудование и ПО в вашей серверной.
Свяжитесь с нами для получения полной информации об услуге!
Обращайтесь в АРБИС по телефону в шапке профиля, письмом на электронную почту order_cib@arbis29.ru или через сообщения в нашем ВК-сообществе.

