Вам также могут быть интересны:
Автоматизация управления инцидентами
Ключевой целью осуществления процесса incident management (управления инцидентами) является восстановление нормального функционирования информационной системы в самый короткий срок. Не менее важна также и минимизация негативного влияния на бизнес-деятельность компании, если работоспособность задействованных служб оказалась нарушена. Уровень нормальной работы служб определяется как функционирование, которое соответствует уровню, отраженному в соглашении об уровне обслуживания - SLA.
В то же время к инцидентам не причисляются события, не относящиеся к качеству предоставляемых услуг в сфере ИТ, а также происшествия, которые, снижая уровень качества, все же не выходят за обусловленные соглашением границы. Особенное место также занимают и случаи, когда клиентская компания не ощутила последствий случившегося инцидента – например, когда все меры были приняты автоматически или системными администраторами еще до момента снижения качества работы ИТ сервисов. К подобным случаям можно отнести проведение автоматической архивации данных и очистки места на рабочих дисках при приближении их переполнения, замена сервера на резервный при сбое в основном и так далее. Подобные происшествия также нельзя исключать из перечня инцидентов. Верная организация работы ИТ сервисов требует отработки и подобных случаев в соответствии с комплексной процедурой - отображением в отчетной документации и принятием правильных мер по предупреждению таких происшествий в будущем.
Автоматизация управления инцидентами подразумевает наличие краткого формального описания путем перечисления определенных характеристик.
Входные данные для описания инцидентов:
- подробное описание, пришедшее от Service Desk, службы обеспечения бесперебойного функционирования сетей и серверов;
- отображение конфигураций и элементов, так или иначе связанных с произошедшим инцидентом; данные описания берут из CMDB, баз единиц конфигурации, включающих все элементы инфраструктуры, в том числе оборудование, ПО, документация, службы и другое;
- данные (при их наличии) взятые из базы возможных проблем и базы ранее случавшихся ошибок;
- создание описания способа разрешения произошедшего инцидента.