Обеспечение бесперебойной работы вычислительных систем. Организация бесперебойной работы отделений: суммированный учет рабочего времени и резервные бригады. Этапы методологии планирования бесперебойной деятельности организации в случае бедствия

Концепция, методы и средства обеспечения непрерывности бизнеса (Business Continuity Planning - BCP) и восстановления деятельности после бедствий (Business Disaster Recovery - BDR) широко известны и апробированы на Западе. Технология обеспечения непрерывности деятельности при чрезвычайных ситуациях является неотъемлемой частью производственной деятельности крупных компаний и государственных организаций, что позволяет им обеспечить практически бесперебойное функционирование в случае чрезвычайных происшествий малого и среднего масштаба и восстанавливать свою деятельность с минимальными, заранее просчитанными убытками в случае широкомасштабных бедствий.

Б.Д. Альтерман, В.И. Дрожжинов, Г.Е. Моисеенко
Jet Info Online №5 2003

Читатели статьи ознакомятся с терминологией и основными понятиями в рассматриваемой области знаний и методологией разработки планов обеспечения непрерывности бизнеса в нештатных ситуациях. Приводятся примеры конкретных планов.

Планирование непрерывности деятельности- это постоянная забота первых руководителей организаций и компаний, которые живут не одним днем и заинтересованы в сохранении и развитии своих предприятий. Именно им и лицам, отвечающим за безопасность и финансовое здоровье компаний и организаций, в первую очередь предназначена эта статья.

Один из авторов статьи, В.И. Дрожжинов, является сертифицированным cпециалистом по планированию непрерывности бизнеса (АВСР), он прошел обучение в Канаде в Институте по восстановлению после бедствия, сдал сертификационный экзамен. Сертификат выдан Международным институтом по восстановлению после бедствия (Нью-Йорк, США).

Введение

Под нештатными или чрезвычайными ситуациями понимаются внешние воздействия, приводящие к невозможности функционирования предприятия в обычном, регламентируемом соответствующими стандартами данного предприятия режиме.

К таким внешним воздействиям в первую очередь относятся:

  • Отключение электроэнергии
  • Пикетирование и забастовки
  • Прорывы водопровода или канализации
  • Террористические акты или их угроза
  • Выход из строя кондиционеров
  • Гражданские беспорядки
  • Пожары
  • Локальные конфликты
  • Природные катаклизмы

Кроме прямых потерь организации несут издержки, связанные с нарушением процедур производственного и финансового учета, потерей расположения заказчиков, ухудшением имиджа и снижением конкурентоспособности.

Концепция, методы и средства обеспечения непрерывности бизнеса и восстановления деятельности после бедствий (Business Continuity Planning - BCP и Business Disaster Recovery - BDR) широко известны и апробированы на Западе при возникновении официально объявленных бедствий и чрезвычайных происшествий более мелкого характера. Они являются неотъемлемой частью производственной деятельности многих крупных компаний, что позволяет им обеспечить практически бесперебойное функционирование в случае чрезвычайных происшествий малого и среднего масштаба и восстанавливать свою деятельность с минимальными, заранее просчитанными убытками в случае широкомасштабных бедствий.

Для того, чтобы обезопасить себя на случай возникновения нештатных ситуаций, нужно иметь:

  • План действий в нештатной ситуации,
  • Хорошо обученные и тренированные "аварийные группы".

План обеспечения бесперебойного функционирования организации в случае нештатной ситуации представляет собой детальный перечень мероприятий, которые должны быть выполнены до, во время и после чрезвычайного происшествия или бедствия. Этот план документируется и регулярно испытывается для того, чтобы убедиться, что в случае нештатной ситуации он обеспечит продолжение деятельности организации и наличие резерва критически важных ресурсов.

Наличие даже очень хорошего плана не гарантирует защиту компании от неприятностей, если у нее нет хорошо обученных групп сотрудников, знающих, что, когда и как они должны делать при возникновении любой нештатной ситуации.

Аналитики отмечают, что потери от террористической атаки 11 сентября могли быть значительно больше, если бы отсутствовали планы действий в чрезвычайных ситуациях, имеющиеся у большинства американских компаний. Заметим, что многие из этих планов появились в преддверии 2000 г. в связи с так называемой "Проблемой 2000" ().

Таблица 1. Действия компаний по повышению безопасности в преддверии 2000 г. и после 11 сентября 2001 г.

ДЕЙСТВИЯ

В ПРЕДДВЕРИИ 2000 Г.

Киберугрозы организационным системам

ИТ-индустрия создала инструменты для обнаружения и устранения "Проблемы 2000" (У2К) в аппаратных и программных средствах. Компании понесли значтельные затраты на тестирование, модификацию и замену своих систем

Имеется огромное число технических решений для обеспечения безопасности, и в каждом конкретном случае требуется проведение тщательного отбора. При этом нужно иметь в виду, что безопасность людей не менее важна, чем безопасность материальных активов

Коммерческая зависимость и взаимозависимость компаний

Различные объединения промышленных предприятий проводили оценку угроз нарушения логистических цепочек и последствий таких нарушений. Компании требовали от своих поставщиков подтверждения устранения в своих информационных системах угроз, связанных с "Проблем ой 2000"

Компании углубили свое осознание проблем обеспечения устойчивости логистических цепочек. После 11 сентября они стали меньше полагаться на практику поставок точно в назначенный срок (just-in-time) и больше - на складские запасы "на всякий случай" (just-in-case)

Киберугрозы критическим инфраструктурам

Владельцы и операторы инфраструктур (телекоммуникационных, трубопроводных и др.) обеспечили решение "Проблемы 2000" в своих системах, разработали и проверили планы их восстановления после бедствия и создали сети сотрудничества для обмена информацией и координации действий в чрезвычайных ситуациях

Компании очень вяло обмениваются информацией во всех сферах, кроме финансовой, где существуют долговременные доверительные отношения, позволяющие координировать действия в чрезвычайный ситуациях

Нежелание делиться информацией

Конгресс США издал закон, по которому обмен информацией между Компаниями по "Проблеме 2000" не является нарушением антимонопольного законодательства

Сейчас в Конгрессе США рассматривается закон об обмене между компаниями антитеррористической информацией, подобный закону, принятому в отношении "Проблемы 2000"

Атмосфера страха и неопределенности

Предприятия и их объединения организовали в прессе кампанию с целью убедить акционеров и публику в том, что последствия "Проблемы 2000" будут минимальными

Сразу после 11 сентября все компании публично выразили соболезнования родственникам погибших в зданиях ВТЦ

Горизонт планирования

Знание точной даты проявления "Проблемы 2000" и понимание ее сути упростили планирование работ по ее преодолению. Наличие необходимого инструментария обусловило сокращение времени решения задачи

Время проведения террористической атаки и применяемые для этого средства непредсказуемы. Поэтому необходимо тщательное исследование рисков для определения соответствующих мер и инструментов защиты

Готовы ли российские компании к внедрению у себя планов обеспечения непрерывности деятельности? Информация об этом противоречива. Изучение рынка сервисных ИТ-услуг, проведенное компанией Market-Visio/EDC в 2000-2001 гг. (http://www.edc.ru/), показало, что услуга по планированию непрерывности бизнеса (BCP) в России пока слабо востребована.

Исследование, проведенное в 2001 г. компанией Ernst & Young (www.ey.com/Russia/security-risk), свидетельствует о том, что 67% опрошенных ею российских компаний имеют планы обеспечения непрерывности бизнеса (BCP), причем у 61,2% этих компаний планы протестированы, а у 38,8% - нет.

Столь разные оценки объясняются тем, что Market-Visio/EDC опрашивала предприятия действительно по вопросу непрерывности бизнеса при комплексных угрозах (см. ), а Ernst & Young, судя по содержанию отчета, только по проблемам информационной безопасности (отказы компьютеров, атаки хакеров, компьютерные вирусы и др.).

Таблица 2. Классификация прерывателей (рисков) бизнеса (не исчерпывающая)

ТИП ПРЕРЫВАТЕЛЯ БИЗНЕСА

АНГЛИЙСКОЕ НАЗВАНИЕ ПРЕРЫВАТЕЛЯ

РУССКОЕ НАЗВАНИЕ ПРЕРЫВАТЕЛЯ

Предпринимательский

Business Relocation

Переезд предприятия или организации в другое помещение или офис

Промышленный шпионаж

Утрата архива

Mergers & Acquisitions

Слияние/приобретение предприятий/организаций

Negative Publicity

Негативная информация о компании в прессе

Переход с ручной на автоматизированную информационную систему или с одной автоматизированной системы на другую

"Наезд" криминальных, коммерческих или государственных структур

Человеческий

Трудовой конфликт (забастовка, локаут и др.)

Loss of Workforce

Организованный уход сотрудников или их потеря в результате, например, несчастного случая

Невозможность набрать сотрудников

Succession Planning

Отсутствие планирования замещения должностей

The Human Factor

Человеческий фактор, терроризм в любой форме и с применением любого оружия

Unauthorized Access

Несанкционированный доступ

White Collar Crime

Преступления "белых воротничков"

Workplace Violence

Силовые конфликты на рабочих местах

Техногенный

Веерное отключение электроэнергии

Computer Failure

Отказы компьютеров

Computer Harking

Атаки хакеров

Computer Viruses

Компьютерные вирусы

Environmental Hazards

Аварии систем жизнеобеспечения (прорыв канализации, трубопроводов горячей и холодной воды., отказ воздуховодов и др.)

Multi-Tenant Sites

Проблемы, вызванные размещением в одном здании нескольких компаний

Перебой в электроснабжении

Sick Building Syndrome

Синдром, вызванный наличием в материалах, из которых построено здание, вредных для здоровья примесей

Transportation Disruptions

Нарушения работы общественного транспорта

Природный

Снежная буря

Землетрясение

Electrical Storms

Электромагнитные бури

Природно-техногенный

Зимняя погода

Biological Hazards

Эпидемии

Наводнение

Artificial and natural objects landing

Падение искуcственных (например, самолетов) и природных (например, метеоритов) объектов с неба

Следует заметить, что осознание необходимости заботиться об информационной безопасности и связанная с этим разработка планов обеспечения непрерывности функционирования информационных систем - уже большой шаг российских предприятий к обеспечению устойчивости бизнеса.

Здесь не рассматривается большой пласт предпринимательских рисков, связанных с изменением курса национальной валюты, государственного регулирования, наносящего ущерб коммерческой деятельности, или политической системы. Эти риски заслуживают особого рассмотрения, поскольку для их снижения используются методы, существенно отличные от описанных в настоящей статье.

План обеспечения бесперебойной деятельности организации в случае нештатных ситуаций: вопросы и ответы

После бедствия необходимо заняться восстановлением своего бизнеса. При этом некоторые организации находятся в более выигрышном положении: у них есть "План обеспечения бесперебойной деятельности организации" (далее план).

Зачем нужен план?

В заголовках национальных и международных новостей постоянно присутствуют сообщения о самых разнообразных бедствиях. Многие бедствия приходят неожиданно, и в этом случае на планирование и организацию работ уже нет времени: нужно бороться за выживание. Поскольку ущерб, приносимый бедствиями, нельзя предотвратить, организациям нужно застраховаться, составив план, который обеспечит успешное восстановление деятельности. Проблема восстановления еще больше усугубляется сложностью распределенных вычислительных сред, разнородностью технических средств, программного обеспечения и протоколов связи.

В настоящее время почти все компании в значительной степени зависят от компьютерных технологий или автоматизированных систем. Неработоспособность этих систем даже в течение нескольких часов может привести к существенным финансовым потерям и даже поставить под угрозу существование организации.

По мере того, как все большее число критичных бизнес-процессов переносится на вычислительные системы с распределенной архитектурой (например, клиент-сервер), компании начинают беспокоиться о том, как можно защитить эти системы в случае бедствия. При переносе приложений из вычислительного центра, где существует жесткий контроль безопасности и воздействий внешней среды, на рабочие места в оперативных подразделениях вероятность прерывания деятельности существенно возрастает. Для вычислительного центра пожары, прорывы водопровода и канализации, отключения телефонной связи и электрического питания подконтрольны и являются большой редкостью, но с распределением приложений по локальным или глобальным сетям, вероятность, что где-нибудь случится чрезвычайное происшествие, сильно возрастает.

Организации должны предусмотреть меры по восстановлению тех сфер своей деятельности, которые имеют критичное для бизнеса значение. При этом должна восстанавливаться не только информационная система. Необходимо предусмотреть замену оборудования локальных телефонных станций, восстановление справочной службы и дистанционного обслуживания, обеспечение мест для работы сотрудников, спасение имущества, которое пригодно к использованию (список не является исчерпывающим). Если подобные составляющие не могут быть восстановлены своевременно, управление организацией становится практически невозможным.

Большинство компаний может обеспечить продолжение своей деятельности после перерыва, вызванного бедствием, предприняв ряд определенных шагов.

Что представляет собой план и почему он так важен?

План обеспечения бесперебойной деятельности организации представляет собой детальный перечень мероприятий, которые должны быть выполнены до, во время и после бедствия. Этот план документируется и испытывается, чтобы удостовериться в его работоспособности в изменяющихся условиях.

Каковы выгоды от наличия плана?

План служит руководством к действию во время кризиса и гарантирует, что ни один важный аспект не будет упущен. Профессионально составленный план направляет действия даже неопытных сотрудников.

Наличие детального, регулярно испытываемого плана поможет оградить любую организацию от судебных исков по поводу халатности. Само существование плана служит доказательством того, что руководство компании не пренебрегло подготовкой к возможным бедствиям.

Основные выгоды от составления детального плана обеспечения бесперебойной деятельности состоят в следующем:

  • Минимизация потенциальных финансовых потерь.
  • Уменьшение юридической ответственности.
  • Сокращение времени нарушения нормальной работы.
  • Обеспечение стабильности деятельности организации.
  • Организованное восстановление деятельности.
  • Сведение к минимуму суммы страховых взносов.
  • Уменьшение нагрузки на ведущих сотрудников.
  • Лучшая сохранность имущества.
  • Обеспечение безопасности персонала и заказчиков.
  • Соблюдение требований законов и инструкций.

Каковы последствия отсутствия плана?

Часто цитируемое исследование, проведенное Техасским университетом, выявило следующую статистику:

  • 85% организаций сильно или полностью зависят от вычислительных систем.
  • В среднем на 6-й день перерыва в работе компания теряет 25% ежедневного дохода, а на 25-й день - 40%.
  • После перерыва в работе наблюдается быстрый рост финансовых потерь и ухудшения функционирования.
  • Спустя две недели после прекращения работы вычислительных систем у 75% компаний потеря функционирования становится критической или полной.
  • 43% компаний, испытавших бедствие и не имевших плана обеспечения бесперебойного функционирования, не возобновляют свою деятельность, а спустя два года продолжает функционировать лишь 10% компаний.

Это исследование показало, что организации, которые составили план действий в непредвиденных обстоятельствах, имели существенно меньшие дополнительные затраты и потери доходов.

По оценке, потери доходов этой группы организаций были бы в 2,5 раза выше, если бы при возникновении чрезвычайной ситуации они не привели в исполнение соответствующие планы.

Кто отвечает за разработку плана?

В конечном итоге за разработку плана отвечает руководство компании, которое должно осуществлять контроль за имуществом компании, что включает контроль за информационными системами компании и обеспечение их непрерывного функционирования.

Проблемы, связанные с восстановлением функционирования информационной системы должны быть заботой всей компании, а не только руководства подразделения, отвечающего за ИТ-инфраструктуру. Руководители всех подразделений, деятельность которых зависит от услуг, предоставляемых отделом ИТ-технологий, должны разработать процедуры действий в чрезвычайных обстоятельствах, касающиеся собственных функциональных обязанностей, а также участвовать в разработке плана восстановления деятельности. Каждое функциональное подразделение должно привести в действие свою часть плана в рамках общих усилий по восстановлению деятельности. В плане должно быть отражено даже выполнение таких обеспечивающих функций, как содержание зданий и оборудования. Эффективность выполнения этих функций может не влиять непосредственно на работу ИТ-инфраструктуры, однако от нее будет частично зависеть восстановление работы технических средств.

Что требуется для разработки плана?

Важным моментом в процессе составления плана является участие высшего руководства компании. Без его поддержки практически невозможно заставить функциональные подразделения предоставить ресурсы, необходимые для разработки плана.

Существенное значение имеет также участие пользователей. Если пользователи не участвуют в процессе разработки плана - маловероятно, что план окажется действительно полезным. Их участие поможет определить некоторые важные факторы:

  • Вероятные последствия каждого бедствия для деятельности организации;
  • Вероятная продолжительность каждого возможного бедствия;
  • Ресурсы, которые необходимы для того, чтобы свести к минимуму возможные последствия;
  • "Человеческие" ресурсы.

Ведение "Плана обеспечения бесперебойной деятельности" требует постоянных затрат времени и финансовых ресурсов.

Не обновлять план так же плохо, как и не иметь его вообще!!!

Каковы этапы разработки плана?

Разработку плана обеспечения бесперебойной деятельности предприятия необходимо организовать в виде проекта, чтобы управлять задачами, сроками и конечными результатами. Основными этапами типичного проекта являются:

  • Организация выполнения проекта;
  • Оценка риска, уменьшение нежелательных последствий от наступления событий, связанных с риском, анализ последствий для бизнеса;
  • Разработка стратегии восстановления деятельности;
  • Документирование плана;
  • Обучение;
  • Имитация бедствия.
Организация выполнения проекта

Организация выполнения проекта включает в себя административное управление проектом, определение допущений, проведение совещаний и разработку политики.

Оценка риска

При оценке риска выявляются типы бедствий, которые могут произойти в каждом конкретном месте. Обследуется физическая инфраструктура здания и его окружения. Для каждого типа бедствия делается оценка возможной продолжительности и присваивается относительная величина, соответствующая вероятности их появления. Используется шкала, например, от 0 до 3; где 0 означает невероятное событие, а 3 - весьма вероятное. В результате этого выявляются области, в которых следует провести дальнейшие исследования, чтобы уменьшить последствия событий, приводящих к риску.

Анализ последствий для деятельности организации

После оценки риска проводится анализ последствий бедствия для деятельности организации, в ходе которого определяются потери из-за невозможности продолжать нормальную деятельность. Они могут быть очевидными или носить более абстрактный характер, при котором руководству придется сделать предположительную оценку потерь. В любом случае цель заключается не в том, чтобы получить точный ответ, а в том, чтобы выявить факторы, которые являются критически важными для продолжения деятельности компании. На этом этапе определяется масштаб плана обеспечения бесперебойной деятельности. Чрезмерные меры предосторожности потребуют лишних средств, а недостаточные - не обеспечат должной безопасности.

Разработка стратегии обеспечения бесперебойной деятельности

После определения требований можно принимать решение о том, как обеспечивать восстановление деятельности. Существует множество вариантов технических решений, в том числе:

  • Использование "горячего" резервного помещения. Поставщик предоставляет компании подготовленное рабочее помещение с оборудованием, средствами телекоммуникации, персоналом, осуществляющим техническую поддержку, и т.д., обычно по годовому контракту. Заказчики получают доступ к оборудованию по принципу "первый пришел - первым обслуживается".
  • Использование "холодного" резервного помещения. Компания организует работу в пустующем или арендуемом помещении, которое подготовлено к использованию. Сразу после бедствия в помещении развертывается оборудование (возможно, закупаемое у поставщиков), программное обеспечение и службы обеспечения.
  • Использование внутренних резервов. Для предоставления услуг в чрезвычайных обстоятельствах используется оборудование компании, которое расположено в ином месте.
  • Заключение соглашения о взаимной поддержке. Заключается соглашение с другой компанией о коллективном использовании ресурсов после бедствия. При этом предполагается, что резервное оборудование всегда имеет нужную производительность и вас устраивает степень защиты информации при коллективной работе.

В некоторых случаях можно использовать комбинацию этих вариантов. Крупные многонациональные компании чаще всего используют для локальных вычислительных сетей метод внутреннего резервирования. Поскольку количество имеющихся резервных помещений ограничено, может оказаться, что в случае чрезвычайных обстоятельств не окажется рабочего помещения, которое можно было бы использовать. Бедствие в масштабе региона может привести к тому, что все резервные помещения будут заняты и компании негде будет возобновить работу.

Хорошо подготовленный план обеспечивает компанию пошаговыми инструкциями, соответствующими типу и тяжести бедствия. В нем указываются функциональные группы специалистов компании, подготовленные для реализации плана. Наличие хорошо проработанного плана гарантирует, что в стрессовой ситуации после возникновения чрезвычайных обстоятельств, критически важные факторы не будут упущены.

Документация

План может документироваться различными способами. Большинство компаний все еще применяют традиционные текстовые редакторы, другие используют коммерческое программное обеспечение. Какой бы метод ни был использован, важно обеспечить строгое выполнение процедур управления внесением изменений, чтобы поддерживать план в состоянии, соответствующем реальной текущей ситуации.

Обучение

Обучение "Группы восстановления" направлено на то, чтобы каждый сотрудник знал свои функции и обязанности в случае возникновения нештатных ситуаций.

Имитация бедствия

Большинство компаний проводят испытания плана минимум один раз в полгода. Имитируя бедствия можно проверить план, найти его слабые места и отработать взаимодействие участников. Обнаружение недостатков обычно влечет за собой корректировку плана. План должен регулярно проходить испытания и корректироваться. Лишь немногие планы обеспечения бесперебойной деятельности выполняются так, как это предусматривалось первоначально. Поскольку внесение поправок в план необходимо делать регулярно, должна быть максимально упрощена процедура корректировки плана.

Что еще следует предусмотреть?

При разработке плана обеспечения бесперебойной деятельности необходимо предусмотреть следующее:

  • Если в настоящий момент план отсутствует, необходимо уведомить высшее руководство о потенциальных опасностях, которые связаны с отсутствием подготовленного и испытанного плана;
  • При наличии плана надо обеспечить его регулярное испытание - провести циклическую замену специалистов, участвующих в испытаниях. Желательно, чтобы в этом процессе приняло участие максимальное количество сотрудников;
  • Надо добиться того, чтобы руководство сделало планирование обеспечения бесперебойной деятельности одной из своих целей;
  • При выборе альтернативных рабочих помещений необходимо позаботиться, чтобы ими можно было воспользоваться при первой необходимости;
  • Не принимайте существующие системы и процедуры резервирования на веру: проведите полную экспертизу резервирования и внесите необходимые изменения. Проведите испытания процедур восстановления;
  • При определении приоритетов приложений опросите руководителей, чтобы они изложили свою точку зрения;
  • Учтите в плане все мелочи, которые могли бы помешать процессу восстановления деятельности;
  • После составления плана разработайте механизм, обеспечивающий его регулярное обновление.

Какие конкретные функциональные области следует включить в план?

План должен содержать процедуры выполнения следующих функций:

  • Ввод в действие процедур для чрезвычайных ситуаций.
  • Уведомление сотрудников, поставщиков и заказчиков.
  • Формирование группы (групп) восстановления.
  • Оценка последствий бедствия.
  • Принятие решения о реализации плана восстановления деятельности.
  • Ввод в действие процедур восстановления деятельности.
  • Переезд в альтернативное рабочее помещение (помещения).
  • Восстановление функционирования критически важных приложений.
  • Восстановление основного рабочего помещения.

Кроме того, план должен содержать документы, которые могут быть использованы персоналом, не знакомым с конкретно восстанавливаемыми функциями. Эти документы должны включать следующие данные:

  • Схемы коммутации телефонов;
  • Процедуры для аварийного отключения питания;
  • Организационная структура Центра восстановления;
  • Требования к оборудованию и снабжению Центра восстановления;
  • Конфигурация Центра восстановления;
  • Список критически важных приложений;
  • Список восстанавливаемого оборудования;
  • Сводные данные по оценке рисков.

Для реализации "Плана обеспечения бесперебойной деятельности" в нем обычно предусматривается создание в организации определенных групп (Табл. 3).

Таблица 3. Список групп для реализации "Плана"

Название группы

Группа первоначального реагирования

Определяет степень ущерба

Группа восстановления

Выполняет функции командного центра в процессе восстановления

Группа по связям с общественностью

Подготавливает сообщения для печати и поддерживает связь со средствами массовой информации

Группа управления сооружениями

Оборудует новое помещение и начинает реконструкцию поврежденного рабочего помещения

Группа кадров

Решает проблемы, связанные с командировками, переездами, травмами сотрудников и т.п.

Группа вычислительных систем

Восстанавливает производственную инфраструктуру

Группа функциональной деятельности

Координирует возобновление работы всех функциональных подразделений, участвующих в бизнесе

Группа систем передачи информации

Восстанавливает сеть связи для передачи данных

Группа учета

Координирует спасение, восстановление пострадавших учетных документов и их хранение вне рабочего помещения

Группа административной поддержки

Обеспечивает поддержку работы Группы восстановления

Способы составления плана

Для разработки плана существует три основных способа:

  1. Собственными силами.
  2. С помощью коммерческого программного обеспечения, предназначенного для составления планов обеспечения бесперебойной деятельности (демонстрационные версии таких программ можно посмотреть или скачать с веб-сайта независимого американского журнала по вопросам восстановления после бедствия Disaster Recovery Journal (см. Прил. I).
  3. Привелечние внешнего консультанта для оказания помощи или непосредственной разработки плана.

Способы отличаются по стоимости, но во всех случаях требуется выделение персонала для проведения исследований и реализации плана.

Разработка собственными силами требует наличия квалификации в области составления плана обеспечения бесперебойной деятельности. Эту квалификацию можно приобрести только путем всестороннего обучения и накопления опыта. Большинство организаций не имеют этой возможности.

Что можно сделать самостоятельно?

Приведенный ниже (неполный) перечень может дать руководству компании некоторые представления о подготовке к восстановлению своих распределенных вычислительных систем:

  • Выявите потенциальные угрозы и задайте им приоритеты в соответствии с вероятностью возникновения.
  • Оцените последствия каждого возможного бедствия и определите, чему может быть нанесен ущерб.
  • Оцените время, необходимое для восстановления, и возможный ущерб от прерывания деятельности.
  • Определите критически важные ресурсы.
  • Проведите инвентаризацию своего имущества.
  • Позаботьтесь о встроенной функции отказоустойчивости (зеркальные диски, RAID, UPS и т.п.).
  • Защитите ваши приложения и данные (защита от вирусов, создание резервных копий, хранящихся вне рабочих помещений и т.п.).
  • Поддерживайте работоспособность систем передачи данных.
  • Создайте альтернативные рабочие помещения и разработайте план получения требуемых ресурсов.
  • Подготовьте официальный план, регулярно проводите его испытания и модернизацию.

Методология разработки и примерное содержание плана обеспечения бесперебойной деятельности организации

Под Планированием бесперебойной деятельности организации в случае бедствий понимается выявление и защита критически важных бизнес-процессов и ресурсов, необходимых для поддержания деятельности организации на нужном уровне, а также разработка процедур, которые обеспечат выживание организации при нарушении ее нормальной деятельности.

Методология разработки

План обеспечения бесперебойной деятельности организации в случае бедствий не является только техническим планом - он главным образом предусматривает проведение организационных мероприятий. Поэтому в основу плана должны быть положены сведения о структуре и функциях организации, средствах, необходимых для поддержания ее деятельности, величине ущерба от невозможности нормального функционирования, лицах, которые примут на себя управление в кризисной ситуации, и процедурах, которые они будут использовать. Для структуризации процесса разработки плана необходимо использовать соответствующую методологию, что обеспечит учет всех факторов непрерывности.

Методология (как следует из рисунка) состоит из трех стадий и десяти этапов, в совокупности составляющих жизненный цикл проекта по разработке плана обеспечения непрерывности деятельности организации (содержание работ на этапах подробно расписано в следующей главе).

Планирование деятельности организации базируется на слудующих основных факторах: качества услуг, эффективности работы и возможности развития организации. Во многом оно обеспечивается технологией, принятой в организации. Поэтому важно, чтобы при выявлении критических областей деятельности организации учитывалась их зависимость от технологических составляющих.

Ранее планы на случай непредвиденных обстоятельств учитывали только бедствия, связанные с компьютерной техникой. Это очень узкий подход. Для обеспечения бесперебойной деятельности необходимо учитывать все взаимосвязанные внешние и внутренние функции, в том числе ручные методы учета и обработки информации .

Наиболее важными факторами, обеспечивающими успех планирования, являются учет всех мелочей и поэтапная разработка каждого небольшого элемента плана. Должно быть определено, на события какого масштаба рассчитан план. Если организация располагается в районе, где могут возникнуть региональные бедствия, план должен предусматривать возможность прекращения подачи электроэнергии, воды и других коммунальных услуг. В противном случае достаточно учитывать возможность бедствий лишь в масштабе здания и рассчитывать на помощь поставщиков, властей и городских структур.

Необходимо также установить "широту охвата" плана. Она зависит от многих факторов, в частности, от структуры организации, допустимых затрат, количества имеющихся зданий и т.п.

В основу методологии "Планирование бесперебойной деятельности в случае бедствий" положен прагматический подход, предусматривающий поддержание критически важных процессов. Защита всех аспектов деятельности организации от пагубных последствий в случае бедствий либо нереальна, либо связана с чрезмерными затратами.

Целями проекта по составлению плана, обеспечивающего бесперебойность и восстановление деятельности организации в случае бедствий, являются:

  • Создание методики оценки бизнес-процессов, которая обеспечит разработку плана с помощью хорошо структурированной и всеобъемлющей методологии.
  • Разработка прагматичного, экономичного и работоспособного плана, который обеспечит бесперебойность критически важных процессов в случае серьезного нарушения деятельности организации.

Эффективный план обеспечения бесперебойной деятельности является относительно недорогой формой страхования компаний от последствий возможных бедствий, и затраты на него должны рассматриваться как составляющая необходимых издержек на поддержание нормальной деятельности организации.

Примерное содержание плана

Непременным условием быстрого и успешного восстановления деятельности организации после бедствия является предварительная разработка и регулярное обновление постоянно действующего плана обеспечения бесперебойной деятельности компании. В зависимости от специфики компании и принятой в ней политики подобный план мероприятий может иметь различные формы и названия. Он может состоять из нескольких разделов, отражающих различные направления работ: план подготовки к чрезвычайным ситуациям, план действий в чрезвычайной ситуации, план резервирования и восстановления информации, план восстановления деятельности и т.п. План может также детализироваться по категориям и продолжительности чрезвычайных обстоятельств.

План включает следующие основные разделы:

  1. Основные положения плана.
  2. Оценка чрезвычайных ситуаций:
    • выявление уязвимых мест компании;
    • классификация возможных опасных событий и оценка вероятности их возникновения;
    • сценарии чрезвычайных ситуаций;
    • потенциальные источники отрицательных последствий каждой чрезвычайной ситуации и оценка величины ущерба;
    • набор критериев, на основании которых объявляется чрезвычайная ситуация.
  3. Деятельность компании в чрезвычайной ситуации:
    • первоначальное реагирование на чрезвычайную ситуацию (оценка опасного события, объявление чрезвычайной ситуации, оповещение необходимого круга лиц, ввод в действие чрезвычайного плана);
    • мероприятия, обеспечивающие бесперебойность деятельности компании в чрезвычайной ситуации и восстановление ее нормального функционирования.
  4. Поддержание готовности к возникновению чрезвычайной ситуации:
    • контроль правильности и корректировка содержания плана;
    • составление списка адресов и процедуры рассылки плана;
    • разработка программы повышения квалификации и ознакомления персонала с действиями, необходимыми для восстановления деятельности компании после бедствия;
    • подготовка к опасным событиям, обеспечение безопасности и предотвращение бедствий;
    • регулярное проведение частичных и комплексных проверок (типа пожарных учений) готовности компании к действиям в чрезвычайной ситуации и способности восстановить нормальную деятельность;
    • регулярное создание резервных копий данных, документации, бланков входных и выходных документов и основного программного обеспечения, их хранение в безопасном месте.
  5. Информационное обеспечение:
    • приоритетные функции, выполняемые компанией;
    • списки внутренних и внешних ресурсов - технических средств, программного обеспечения, средств связи, документов, офисного оборудования и персонала;
    • учетная информация о техническом, программном и другом обеспечении, необходимом для восстановления деятельности организации в случае чрезвычайной ситуации;
    • список лиц, которых необходимо оповестить о чрезвычайной ситуации с указанием адресов и телефонов;
    • вспомогательная информация - планы и схемы, маршруты перевозок, адреса и т.п.;
    • описание детальных пошаговых процедур, обеспечивающих четкое выполнение всех предусмотренных мер;
    • функции и обязанности сотрудников в случае возникновения непредвиденных обстоятельств;
    • сроки восстановления деятельности в зависимости от типа возникшей чрезвычайной ситуации;
    • смета расходов, источники финансирования.
  6. Техническое обеспечение:
    • создание и поддержание базы технических средств, обеспечивающей бесперебойную деятельность компании в чрезвычайной ситуации;
    • создание и поддержание в надлежащем состоянии резервного производственного помещения.
  7. Организационное обеспечение, состав и функции следующих групп, обеспечивающих бесперебойную деятельность в случае бедствия:
    • группы оценки чрезвычайной ситуации;
    • группы управления в кризисной ситуации;
    • группы для работ в чрезвычайной ситуации;
    • группы восстановления;
    • группы обеспечения работы в резервном производственном помещении;
    • группы административной поддержки.

Даже простое перечисление элементов плана говорит о серьезности проблемы и объеме работ по его составлению.

Этапы методологии планирования бесперебойной деятельности организации в случае бедствия

Организации, занимающиеся оценкой квалификации специалистов в определенных сферах деятельности, обычно формулируют общий свод знаний специалистов данной профессии. Такой свод знаний имеет абстрактный характер, он стабилен и независим от используемой технологии, что облегчает общение специалистов данной области и устанавливает единые требования к их квалификации.

Освоение общего свода знаний является необходимым, но не единственным доказательством профессиональных способностей. Для успешной сдачи квалификационных экзаменов, проводимых на его основе, необходимо вести профессиональную деятельность и иметь определенные навыки в данной области.

Квалификация должна соответствовать содержанию общего свода знаний.

Материал данной главы основан на разработках Международного института восстановления после бедствия (DRI International). Целью деятельности института является накопление и распространение практического опыта, формулирование базы общедоступных знаний специалистов и организаций, разрабатывающих планы мероприятий по обеспечению бесперебойного функционирования организаций и восстановлению их деятельности после бедствия.

Свод знаний состоит из 9 предметных областей, соответствующих этапам методологии планирования бесперебойной деятельности организации в случае бедствия.

Каждая область содержит следующую информацию:

  • описание предметной области,
  • функции специалиста,
  • квалификацию, которой должен обладать специалист для выполнения своих функций в данной области.

Руководство по составлению плана, обеспечивающего бесперебойное функционирование и восстановление деятельности организации после бедствия

Описание предметной области:

Руководство включает обоснование необходимости выполнения проекта, определяет организационную структуру управления проектом и структуру самого проекта.

Функции специалиста:
  1. Формирование стратегии реализации проекта, т.е. формирование требований, определение масштаба и целей проекта, юридическое обоснование, анализ примеров успешной реализации сходных проектов (best practice);
  2. Разработка бюджета проекта;
  3. Определение организационной структуры управления проектом и структуры самого проекта;
  4. Управление ходом проекта;
  5. Разработка должностных инструкций;
  6. Разработка рекомендаций для руководства и сотрудников по следующим направлениям работ:
    • сотрудничеству с другими организациями;
    • проведению переговоров;
    • поиску компромиссов;
    • выступлению в роли посредника;
    • утверждению документов.
Специалист должен уметь:
  1. Формулировать проблему.
  2. Убеждать в необходимости плана мероприятий, обеспечивающих бесперебойное функционирование организации:
    • обосновывать необходимость проекта;
    • формулировать цель проекта;
    • демонстрировать выгоды от наличия плана;
    • добиваться поддержки со стороны высшего руководства;
    • обеспечивать вовлечение сотрудников в работу над планом.
  3. Формулировать функции высшего руководства.
  4. Разбираться в структуре подчиненности и ответственности различных уровней руководства.
  5. Создавать комитет по руководству планированием:
    • формулировать его функции,
    • определять структуру,
    • обеспечивать управление его деятельностью и развитием,
    • определять его состав.
  6. Разрабатывать требования к обеспечению финансами и человеческими ресурсами.
  7. Устанавливать состав и обязанности группы (групп) планирования.
  8. Разрабатывать и координировать планы действий.
  9. Разрабатывать требования к управлению проектом и его документации.

Оценка риска и управление риском

Описание предметной области:

Выявление событий, которые могут оказать отрицательное влияние на деятельность организации, оценка возможного ущерба и определение мероприятий, необходимых для предотвращения или минимизации потерь.

Функции специалиста:
  1. Выявление потенциальных факторов риска для организации, их вероятности и последствий;
  2. Определение потребности во внешней экспертизе;
  3. Выявление уязвимых мест организации;
  4. Определение альтернативных способов уменьшения риска;
  5. Выявление заслуживающих доверия организаций, оказывающих информационные услуги;
  6. Взаимодействие с руководством с целью определения допустимых уровней риска;
  7. Составление документации и представление полученных результатов.
Специалист должен уметь:
  1. Прогнозировать последствия случайных опасных событий;
  2. Разбираться в следующих источниках потенциального ущерба:
    • естественных,
    • искусственных,
    • случайных,
    • преднамеренных,
    • внутренних,
    • внешних.
  3. Оценивать вероятность ущерба для организации в результате действия различных неблагоприятных факторов;
  4. Определять управляющие воздействия и меры предосторожности для предотвращения или минимизации потерь:
    • знать инфраструктуру и конструкцию зданий;
    • выявлять уязвимые места;
    • обнаруживать неблагоприятные факторы, уведомлять о них и уменьшать их воздействие;
    • проводить кадровые мероприятия;
    • обеспечивать безопасность и контроль доступа на охраняемую территорию;
    • формировать политику резервного архивирования;
    • обеспечивать сохранность и защиту информации, в том числе в вычислительной сети, как аппаратными, так и программными средствами;
    • управлять профилактическим обслуживанием и планировать установку оборудования;
    • обеспечивать дублирование и резервирование систем электропитания,
    • сотрудничать с внешними организациями.
  5. Использовать инструментальные средства анализа риска, позволяющие:
    • определять качественную и количественную оценку риска;
    • сопоставлять выгоды от проведения мероприятий по уменьшению риска и затраты на них;
  6. Использовать разнообразные методы и средства сбора информации:
    • бланки и анкеты;
    • опросы;
    • совещания;
    • просмотр документации;
    • обследования.
  7. Определять вероятность опасных событий, используя различные источники информации и оценивая достоверность соответствующих данных;
  8. Оценивать эффективность управляющих воздействий и мер предосторожности, т.е.:
    • определять соотношение затрат и выгод;
    • анализировать качество процедур реализации мероприятий и управления;
    • осуществлять испытания;
    • проводить ревизию функций и обязанностей.

Анализ последствий бедствий для деятельности организации

Описание предметной области:

Определение последствий нарушения нормального функционирования для организации, количественная и качественная оценка подобных последствий.

Функции специалиста:
  1. Выявление и спецификация функций (бизнес-процессов) организации;
  2. Поиск знающих и заслуживающих доверия специалистов в сфере деятельности организации;
  3. Определение критериев, по которым функции причисляются к разряду критически важных;
  4. Представление критериев руководству для утверждения;
  5. Координация работ по анализу последствий бедствия для деятельности организации;
  6. Выявление взаимосвязей функций;
  7. Определение ограничений процесса восстановления функций:
    • установление приоритетов функций;
    • задание сроков восстановления функций;
    • оценка потерь.
  8. Определение потребностей в информации;
  9. Определение потребностей в ресурсах;
  10. Определение формы отчета;
  11. Подготовка и представление результатов анализа в виде отчета.
Специалист должен уметь:
  1. Определять возможные последствия нарушения нормального функционирования организации:
    • потерю собственности (материальной, информационной);
    • перебои в предоставлении услуг и деятельности организации;
    • нарушения требований законодательства и нормативных документов.
  2. Понимать последствия для организации, касающиеся:
    • финансового положения;
    • взаимодействия с заказчиками и поставщиками;
    • имиджа в глазах общественности;
    • юридических обязательств;
    • выполнения требований и условий нормативных документов;
    • нарушения требований к охране окружающей среды;
    • оперативной деятельности;
    • персонала;
    • прочих ресурсов.
  3. Разбираться в количественных и качественных методах оценки последствий;
  4. Определять критичность функций;
  5. Проводить:
    • количественную оценку:
      • потерь собственности,
      • упущенных доходов,
      • штрафов,
      • потерь из-за нарушения движения денежных средств,
      • дебиторской задолженности,
      • кредиторской задолженности,
      • потерь человеческих ресурсов,
      • дополнительных расходов,
    • качественную оценку:
      • потерь человеческих ресурсов,
      • потерь по юридическим обязательствам,
      • социальных потерь,
      • морального ущерба,
      • утраты доверия.
  6. Определять функции, имеющие критически важное значение для организации, и их взаимосвязь.
  7. Устанавливать приоритетные функции.
  8. Определять минимальные потребности в ресурсах:
    • внутренних,
    • внешних,
    • денежных,
    • дополнительных.
  9. Определять сроки восстановления ресурсов.

Разработка стратегий восстановления деятельности организации

Описание предметной области:

Определение альтернативных стратегий восстановления деятельности организации, которые могут обеспечить сохранение критически важных функций и представление рекомендаций по их выбору.

Функции специалиста:
  1. Выявление имеющихся альтернатив, определение их преимуществ и недостатков, оценка затрат.
  2. Поиск действенных стратегий восстановления функций организации.
  3. Интеграция стратегий.
  4. Формулирование требований к хранению данных и документации во внешнем хранилище и выбор резервных помещений.
  5. Обеспечение поддержки стратегий структурными подразделениями организации.
  6. Представление стратегии руководству и обеспечение его участия в работе.
Специалист должен уметь:
  1. Определять требования к стратегии восстановления деятельности организации по следующим критериям:
    • срокам восстановления;
    • типу стратегии;
    • восстанавливаемым объектам;
    • необходимому персоналу;
    • требуемым средствам связи.
  2. Выбирать подходящую стратегию восстановления из следующих составляющих:
    • не предпринимать никаких действий;
    • отложить действия;
    • использовать ручные процедуры;
    • заключить обоюдное соглашение с другой организацией;
    • использовать резервное рабочее помещение;
    • воспользоваться услугами внешнего вычислительного центра;
    • вступить в консорциум с другими организациями;
    • организовать распределенную обработку данных;
    • использовать альтернативные средства связи.
  3. Выбирать резервное рабочее помещение (помещения) и внешнее хранилище для данных и документов:
    • устанавливать критерии выбора;
    • определять необходимые средства связи;
    • формулировать условия соглашений;
    • разрабатывать методы сравнения;
    • приобретать помещения и технические средства;
    • формулировать условия контрактов.
  4. Проводить анализ затрат и выгод.

Реагирование на чрезвычайную ситуацию

Описание предметной области:

Разработка и внедрение процедур реагирования на чрезвычайное происшествие и предотвращения его развития.

Функции специалиста:
  1. Выявление наличия в организации процедур реагирования на чрезвычайную ситуацию.
  2. Разработка процедур реагирования на чрезвычайную ситуацию в случае их отсутствия.
  3. Интеграция процедур восстановления деятельности после бедствия с процедурами реагирования на чрезвычайную ситуацию.
  4. Определение требований к управлению и контролю при ликвидации последствий чрезвычайной ситуации.
  5. Разработка процедур управления и контроля с четким определением функций, полномочий и процессов обмена информацией, необходимых для ликвидации чрезвычайной ситуации.
Специалист должен уметь:
  1. Разрабатывать процедуры реагирования на чрезвычайную ситуацию, в том числе:
    • обеспечивать готовность к чрезвычайным происшествиям:
      • разрабатывать процедуры реагирования, детализированные по типам бедствий, например:
        • природное бедствие,
        • случайное происшествие,
        • преднамеренное действие,
      • определять полномочия руководства,
      • определять средства, обеспечивающие бесперебойность управления,
      • определять функции выделенного персонала,
    • регламентировать действия в чрезвычайной ситуации, которые состоят в:
      • уведомлении о чрезвычайной ситуации,
      • эвакуации,
      • оказании медицинской помощи,
      • мероприятиях по обращению с опасными материалами,
      • борьбе с катаклизмами (огнем, затоплением и т.п.)
    • обеспечивать:
      • сохранность оборудования и помещений,
      • уменьшение причиненного ущерба,
      • проведение испытаний,
    • определять должностные обязанности,
    • подготавливать отчеты:
      • внутренние:
        • в рамках отдельного подразделения,
        • в рамках организации в целом,
      • внешние:
        • для общественности,
        • для поставщиков.
  2. Определять средства и методы управления и контроля в чрезвычайной ситуации, включая:
    • разработку проекта центра для работы в чрезвычайной ситуации и его оборудования,
    • определение полномочий по управлению и принятию решений в чрезвычайной ситуации,
    • определение необходимых средств связи (радиосвязь, курьерская связь и сотовая телефонная связь),
    • разработку методов регистрации и составления документации.
  3. Разрабатывать процедуры управления центром для работы в чрезвычайной ситуации и контроля его деятельности, охватывающие:
    • открытие центра,
    • обеспечение безопасности центра,
    • составление графика работы рабочих групп центра,
    • управление центром и контроль его деятельности,
    • закрытие центра.

Разработка и внедрение плана, обеспечивающего бесперебойное функционирование организации

Описание предметной области:

Разработка концепции, составление и внедрение плана мероприятий, обеспечивающих бесперебойное функционирование организации.

Функции специалиста:
  1. Планирование деятельности по разработке и внедрению плана.
  2. Организация работ над планом.
  3. Руководство работами над планом.
  4. Контроль и корректировка хода выполнения работ над планом.
  5. Обеспечение работ специалистами.
  6. Внедрение плана.
  7. Испытания плана.
  8. Ведение плана.
Специалист должен уметь:
  1. Определять требования к Плану:
    • применять средства планирования,
    • использовать:
      • должностные инструкции,
      • планы действий,
      • контрольные перечни,
      • матрицы,
      • формы,
      • другую вспомогательную документацию.
  2. Определять требования к руководству и оперативному управлению восстановлением деятельности:
    • концепцию группы восстановления:
      • описание,
      • организация,
      • обязанности членов группы восстановления:
        • координатора восстановления,
        • координаторов работы специализированных групп,
      • обязанности обеспечивающего персонала,
      • требования к резервному центру для работы в чрезвычайной ситуации.
  3. Определять и описывать форму и структуру основных элементов плана.
  4. Подготавливать общее введение к основным положениям плана:
    • общая информация:
      • предисловие,
      • содержание,
      • цели,
      • допущения,
      • общие сведения об обязанностях,
      • испытания,
      • сопровождение,
    • ввод плана в действие:
      • уведомление:
        • первичное,
        • вторичное,
      • процедуры объявления бедствия,
      • процедуры мобилизации,
      • концепция оценки ущерба:
        • первоначальной,
        • детальной,
    • организация группы восстановления:
      • описание,
      • состав,
      • обязанности руководителя,
    • изложение политики,
    • центр для работы в случае чрезвычайной ситуации.
  5. Подготавливать раздел об административном управлении:

    • определять функции обеспечивающих подразделений по восстановлению:
      • обеспечение человеческими ресурсами,
      • обеспечение безопасности,
      • страхование и управление рисками,
      • закупка оборудования и материалов,
      • транспортировка,
      • учет юридических аспектов,
    • регламентировать назначение координатора по связям с общественностью и средствами массовой информации, определив требуемую квалификацию и должностные обязанности, включая:
      • связь с правительственными органами,
      • связь с инвесторами,
    • подготавливать разделы, касающиеся:
      • группы восстановления:
        • состав группы,
        • обязанности членов,
        • необходимые ресурсы,
      • контрольные перечни,
      • технические процедуры.
  6. Разрабатывать план производственной деятельности организации:
    • составлять планы оперативного отдела, включая:
      • основные бизнес функции,
      • мероприятия по вводу плана в действие,
      • действия по восстановлению рабочего помещения, пострадавшего от бедствия, и его возврату в первоначальное состояние,
      • обеспечение сохранности и восстановление информации,
      • потребности конечного пользователя в средствах вычислительной техники,
    • определять элементы программы создания жизненно важных архивов,
    • подготавливать разделы плана, касающиеся действий:
      • группы восстановления:
        • состав группы,
        • обязанности,
        • необходимые ресурсы,
    • разрабатывать планы действий:
      • общие планы отдельных подразделений и индивидуальные планы сотрудников,
      • контрольные перечни,
      • технические процедуры.
  7. Разрабатывать план восстановления информационной инфраструктуры:
    • запуск функционирования резервного центра:
      • управление центром,
      • административное руководство,
      • материально-техническое снабжение,
      • установка нового оборудования,
      • техническое обслуживание,
      • поддержка решения прикладных задач,
      • создание сети,
      • передача данных по сети,
      • оперативная деятельность,
      • обеспечение транспортировки и связи между рабочими помещениями,
      • подготовка данных,
      • оперативное управление производством,
      • установление связи с конечными пользователями,
    • удовлетворение требований конечных пользователей,
    • определение элементов программы создания жизненно важных архивов,
    • планы действий:
      • общие планы отдельных подразделений и индивидуальные планы сотрудников,
      • контрольные перечни,
      • технические процедуры.
    • действия группы восстановления:
      • состав группы,
      • обязанности,
      • необходимые ресурсы.
  8. Разрабатывать планы обеспечения бесперебойной работы систем связи.
  9. Разрабатывать планы обеспечения бесперебойной работы прикладных систем конечных пользователей.
  10. Устанавливать процедуры распространения, контроля и корректировки плана.
  11. Внедрение плана:
    • разработка программы обучения сотрудников:
      • типовые рекомендации,
      • функции и обязанности сотрудников,
      • процедуры,
      • ознакомление с планом и практическое обучение предусмотренным в нем мероприятиям,
      • проведение презентаций,
    • выполнение необходимых работ:
      • приобретение дополнительного оборудования,
      • заключение контрактов,
      • подготовка резервных копий и обеспечение хранения данных и документов во внешнем хранилище,
    • разработка планов и графиков проведения испытаний, а также процедур отчетности,
    • разработка процедур ведения и обновления плана и соответствующей отчетности.

Ознакомительные программы и практическое обучение персонала организации

Описание предметной области:

Реализация программы по ознакомлению персонала с проблемой обеспечения бесперебойного функционирования организации и повышение квалификации персонала в части внедрения, реализации и ведения плана обеспечения бесперебойного функционирования организации.

Функции специалиста:
  1. Определение целей и элементов программы обучения.
  2. Задание функциональных требований к обучению.
  3. Разработка методики обучения.
  4. Разработка программы ознакомления персонала с проблемой обеспечения бесперебойного функционирования организации.
  5. Приобретение и разработка учебных пособий.
  6. Выявление и использование возможностей обучения вне организации.
  7. Определение материалов и способов ознакомления персонала с проблемой обеспечения бесперебойного функционирования организации.
Специалист должен уметь:
  1. Определять цели обучения.
  2. Разрабатывать программы обучения различных типов:
    • с использованием вычислительной техники,
    • в учебном классе,
    • на базе тестов.
  3. Разрабатывать ознакомительные программы:
    • для руководства,
    • для членов группы,
    • для вновь принятого сотрудника.
  4. Определять другие возможности обучения:
    • профессиональные конференции и семинары по планированию бесперебойного функционирования,
    • участие в работе групп пользователей,
    • публикации.

Испытания плана и проведение учений по реализации плана

Описание предметной области:

Заблаговременное планирование учений по реализации плана, проведение учений по реализации и испытанию плана, оценка и документирование результатов испытаний и учений.

Функции специалиста:
  1. Заблаговременное планирование испытаний.
  2. Координация проведения испытаний.
  3. Оценка испытаний плана.
  4. Проведение учений по реализации плана.
  5. Составление документации о результатах.
  6. Оценка результатов.
  7. Корректировка плана.
  8. Информирование руководства о результатах испытаний и их оценке.
Специалист должен уметь:
  1. Разрабатывать программу испытаний.
  2. Определять требования к испытаниям:
    • цели и критерии оценки успешности испытаний,
    • типы испытаний (преимущества и недостатки):
      • имитационное моделирование и комплексные испытания,
      • частичные,
      • функциональные,
      • с предварительным извещением,
      • без предварительного извещения,
    • определение и описание содержания испытаний,
    • развитие и расширение испытаний,
    • частота проведения испытаний,
    • обеспечение материально-технического снабжения, транспортировки и заблаговременного планирования.
  3. Разрабатывать реалистичные сценарии испытаний:
    • разрабатывать сценарии испытаний, приближенные к обстановке возможных чрезвычайных происшествий и предусматривающие разрешение всех возникающих проблем,
    • проводить для членов группы практическое обучение по выполнению новых функций с принятием решений, которые выходят за рамки их обычных должностных инструкций,
    • проводить учения по открытию резервного центра для работы в чрезвычайной ситуации, созданию средств связи, проведению регистрации и составлению документации:
      • восстановление:
        • оценка ущерба,
        • восстановление рабочих помещений,
        • восстановление оборудования,
        • создание условий работы,
        • спасение и возврат в первоначальное состояние (использование услуг специалистов),
        • страхование.
  4. Устанавливать критерии оценки результатов испытаний:
    • наблюдение,
    • регистрация,
    • оценка:
      • сопоставление ожидаемых и фактических результатов,
      • разработка рекомендаций по корректировке плана.

Ведение и обновление плана

Описание предметной области:

Разработка процедур, которые поддерживают план в актуальном состоянии, обеспечивающем бесперебойное функционирование организации.

Функции специалиста:
  1. Участие в совещаниях по стратегическому планированию.
  2. Координация работ по ведению плана.
Специалист должен уметь:
  1. Разбираться в стратегических направлениях деятельности.
  2. Устанавливать критерии корректировки плана:
    • периодическая корректировка,
    • при возникновении значительных перемен,
    • по результатам испытаний.
  3. Вести план:
    • владеть инструментальными средствами,
    • контролировать действия сотрудников,
    • проводить корректировки,
    • проводить ревизию и контроль.
  4. Вести отчетность о состоянии плана.
  5. Устанавливать процедуры доведения плана до всех сотрудников и контроля их исполнения.

Примеры планов обеспечения бесперебойной работы систем обработки информации

В настоящее время деятельность всех без исключения компаний осуществляется с использованием информационных технологий.

Восстановление локальной вычислительной сети после бедствия

Для того, чтобы восстановление функционирования ЛВС проходило организованно, быстро и без каких-либо непредвиденных задержек, необходимо иметь четкий план на случай чрезвычайных обстоятельств. Каждый план должен иметь, как минимум, следующие разделы:

Титульный лист. Официальное наименование плана, учетный номер, даты составления, изменений и утверждений, фамилии руководителей и исполнителей.

Цель. Краткое описание целей составления плана, ЛВС, для которой он предназначен. "Основные положения" плана позволяют каждому, кто возьмет план в руки, быстро получить представление о нем.

Общие стратегии. В этом разделе приводятся общее описание плана, а также:

  • Процедуры первоначальной оценки ситуации и ввода плана в действие.
  • Набор критериев, на основании которых объявляется бедствие.
  • Перечень обязанностей сотрудников при восстановлении ЛВС.
  • Общий перечень действий, выполняемых координатором восстановления ЛВС и другими ведущими сотрудниками.
  • Общий перечень восстановительных работ, обеспечивающих либо организацию работы ЛВС в резервном центре, либо восстановление ее функционирования в производственном помещении, потерпевшем ущерб.
  • Сводная оценка ущерба и сведения о необходимых работах по ремонту оборудования ЛВС.
  • Время, требуемое на восстановление функционирования.

Учетная информация. Она может содержать различные типы учетных данных. Например, стандартную конфигурацию сервера, стандартную конфигурацию рабочей станции, структуру каталогов, прочие данные о конфигурации, список идентификаторов, связанных с сервером, копии системных файлов для каждой рабочей станции, а также любые другие типы учетных данных, которые помогут осуществить восстановление ЛВС.

Состав группы восстановления после бедствия. Список всех лиц, которые будут принимать участие в восстановлении ЛВС, с указанием имени, домашнего адреса, домашнего телефона, рабочего телефона, номеров пейджера и сотового телефона, если они есть. В этот же список должны быть включены наименования, адреса и номера телефонов компаний-поставщиков. Можно включить также адреса и номера телефонов руководителя и другие "полезные" номера.

Заблаговременные мероприятия. Список мероприятий, которые нужно проводить задолго до возникновения бедствия, чтобы уменьшить опасность его возникновения и возможные последствия. Одним из таких важнейших мероприятий является создание резервных копий. В плане должно быть указано, когда осуществляется создание резервных копий, куда они пересылаются, когда пересылаются, как должна выглядеть этикетка на носителях резервных копий и все то, что может потребоваться при реальном создании резервных копий. Стандартизация этикеток и носителей облегчит работу тем, кто будет хранить копии, и тем, кому придется восстанавливать по ним информацию. Данные на этикетках должны гарантировать, что носитель может быть легко доставлен из помещения с вашей ЛВС в место внешнего хранения и обратно и что им можно будет легко пользоваться.

Процедуры восстановления ЛВС. В этом разделе указываются требуемые действия в непредвиденных обстоятельствах и мероприятия по восстановлению функционирования ЛВС в различных ситуациях. Даются рекомендации по правильному использованию материалов плана. Должно быть оставлено место для отметки о выполнении каждого этапа с указанием имени ответственного, даты и, возможно, времени выполнения. Это гарантирует, что ни один этап не будет упущен.

Ведение плана. Этот раздел должен устанавливать процедуры ведения плана, в частности частоту корректировки соответствующей документации плана и лицо, ответственное за данное действие. Кроме того, даются рекомендации по составлению плановых документов, их рассылке и обучению методам составления и ведения плана. Если процедуры ведения определяются общими процедурами, установленными в компании, на них может быть сделана ссылка.

Испытания плана. В этом разделе описывается, что должно испытываться при проверке реализуемости плана, кто должен проводить испытания, когда должны осуществляться испытания и каковы их результаты. План испытаний может быть общим или состоять из отдельных частей. Некоторые разделы этого плана могут являться разделами других общих планов.

Приложения. - Содержат различные формы, соглашения и т.п.

Даже в таком схематичном виде приведенный выше вариант плана будет весьма полезным для большинства ЛВС и не требует больших затрат на разработку, потому что может быть составлен с помощью обычного текстового редактора.

При составлении плана восстановления ЛВС после бедствия следует придерживаться известного принципа "Keep It Simple Stupid" ("Стремитесь к простоте, - не мудрствуйте"). Правда, если у вас вообще нет плана восстановления, простота, конечно же, доведена до предела, а вот насчет мудрости...

План создания резервных копий и восстановления информации в ЛВС

Когда дело касается создания резервных копий информации для вычислительной сети, некоторые организации предпочитают рисковать. Отношение, как правило, меняется, когда с ЛВС случается катастрофа.

"Время - деньги". Справедливость этой поговорки становится особенно очевидной, когда из-за отказа ЛВС нарушается нормальная деятельность всей организации. По оценке Джеффа Конца, системного администратора компании Itron Corp. (США), выпускающей портативные компьютеры, при неработоспособности ЛВС его компания теряет примерно 25000 долларов в час.

Регламенты резервного копирования могут различаться. Целесообразно создавать полные резервные копии исходных текстов программ и критически важных приложений один раз в неделю, а инкрементное копирование - каждую ночь. Для проверки качества резервных копий на ленте, нужно регулярно восстанавливать скопированную информацию на другом компьютере.

Производительность системы резервного копирования и восстановления информации не должна отставать от наращивания мощности вычислительных средств компании.

Несмотря на то, что конкретные регламенты резервного копирования и восстановления информации в разных компаниях различны, наличие четкого плана проведения соответствующих работ является абсолютно необходимым.

В плане указываются: временные регламенты создания резервных копий, места хранения, вид этикеток на носителях и все, что может потребоваться при реальной работе, связанной с восстановлением данных. Стандартизация этикеток и носителей облегчит работу тем, кто будет хранить копии, и тем, кому придется восстанавливать по ним информацию. Данные на этикетках должны гарантировать, что носитель может быть легко доставлен из помещения с вашей ЛВС в место внешнего хранения и обратно и что им можно будет легко пользоваться.

Решающее значение при составлении плана имеет определение приоритетов. После анализа затрат следует проанализировать системные требования и задать приоритеты, учитывающие такие факторы, как объем и перечень имеющихся данных, для которых нужно создавать резервные копии. На основе проведенного анализа и заданных приоритетов распределяются ресурсы системы резервного копирования.

Реализация плана создания резервных копий должна быть повседневной заботой компании.

Зачастую неэффективность этого плана выявляется только тогда, когда происходит бедствие. Чтобы этого не случилось, необходимо регулярно проводить процедуры проверки типа "пожарных учений". Поскольку эти процедуры по восстановлению информации довольно трудоемки, для проведения их испытаний рекомендуется воспользоваться специальным программным обеспечением.

Планирование действий в непредвиденных обстоятельствах для систем обработки банковской информации

В сфере обработки банковской информации планирование действий в непредвиденных обстоятельствах необходимо для того, чтобы свести к минимуму ущерб, который может быть нанесен неожиданными и нежелательными событиями, влияющими на обработку данных. Подобные ситуации складываются как в результате бедствий, которые трудно предотвратить, и вероятность возникновения которых относительно мала, так и в результате прогнозируемых и довольно часто происходящих событий, например отказов технических средств или электрического питания. Цель планирования действий в непредвиденных обстоятельствах заключается в том, чтобы свести к минимуму отрицательные последствия, независимо от масштаба нежелательных событий. Наша зависимость от вычислительных систем выросла до такой степени, что возврат к ручной обработке данных, если он вообще возможен, приведет к неприемлемым потерям времени и средств.

Отправной точкой в планировании действий в непредвиденных обстоятельствах является установление принципов, которых необходимо придерживаться при создании такого плана. Успешная реализация плана может дать огромные выгоды. Для предотвращения губительных последствий любых бедствий необходимо:

  • знать взаимосвязи между всеми элементами цикла обработки информации;
  • иметь общие представления о вероятности каждого неблагоприятного события;
  • заблаговременно принять меры, направленные на минимизацию размера потерь;
  • сохранять резервные копии файлов;
  • совершенствовать условия функционирования системы обработки данных;
  • регулярно обновлять документацию;
  • обеспечить стандартизацию технического и программного обеспечения;
  • разработать процедуры на случай чрезвычайных ситуаций;
  • учитывать в технической политике требования к резервированию и восстановлению системы.

В плане должен быть описан поэтапный процесс плавного и максимально быстрого возобновления деятельности.

В плане действий в непредвиденных обстоятельствах необходимо предусмотреть его увязку с планом готовности к чрезвычайным ситуациям и их предупреждения. Эти планы следует разрабатывать во взаимосвязи с учетом приемлемой степени риска и затрат.

Основной целью составления плана действий в непредвиденных обстоятельствах является распределение обязанностей (кто, что, когда и как должен делать) для сохранения работоспособности организации.

Проект плана следует предоставить для анализа и утверждения высшему руководству.

Роль руководства

При составлении плана требуется значительный вклад со стороны подразделений, занимающихся обработкой данных. Однако процесс планирования в целом должен начинаться и заканчиваться на уровне высшего руководства.

Высшее руководство хорошо понимает уязвимость современной банковской технологии, базирующейся на вычислительной технике, и в связи с этим осознает необходимость составления плана действий на случай непредвиденных обстоятельств. Основная функция руководства - поддержка подобного планирования и назначение подразделения, которое должно этим заниматься.

Первым шагом является подготовка меморандума, отражающего позицию руководства. Такой меморандум может, например, гласить: "Каждое оперативное и административное подразделение несет ответственность за компьютерные системы сбора и обработки данных, от которых зависит работа банка. Поскольку эти системы обеспечивают функционирование банка, руководители оперативных подразделений должны понимать, что для них безостановочная работа компьютерных систем имеет большее значение, чем для руководителей подразделений, отвечающих за обработку данных". Разработка плана требует времени, терпения и прямого участия руководителей всех уровней. Нужно сформировать руководящий комитет из представителей всех направлений деятельности, который будет давать рекомендации по вопросам политики.

Для непосредственного составления плана действий в непредвиденных обстоятельствах можно создать особое подразделение, состоящее из руководителя и небольшой группы помощников. После окончания разработки плана руководитель группы может быть назначен координатором по планированию действий в непредвиденных обстоятельствах, подчиненным руководству службы обработки данных.

Заметим, что участие руководства должно быть постоянным, только в этом случае можно предотвратить устаревание плана и сохранить его пригодным к использованию.

Составление плана действий в непредвиденных обстоятельствах

План действий в непредвиденных обстоятельствах не может быть разработан одним человеком. Для гарантии успеха координатор должен иметь не только поддержку со стороны руководства, но и группу подчиненных. Эти сотрудники должны обладать определенным набором знаний в данной области. Нужно иметь в виду, что в случае бедствия восстановление работоспособности потребует затрат времени и средств, а одной из целей плана будет являться минимизация этих затрат.

В плане обязательно должны быть указаны следующие сведения:

  • имена, адреса и номера телефонов ведущих сотрудников;
  • цели и обязанности сотрудников при восстановлении деятельности;
  • списки необходимых внешних ресурсов, включая технические средства, программное обеспечение, средства связи, данные, документы, офисное оборудование, документацию и персонал;
  • вспомогательная информация - маршруты перевозок, карты, адреса и т.п.;
  • процедуры, детально описывающие, как должны проводиться мобилизация персонала и восстановительные работы;
  • административная деятельность по координации работ, связанных с восстановлением;
  • процедуры постоянной корректировки и испытаний плана;
  • список адресов для рассылки плана.

Детализировать план нужно до такой степени, чтобы максимально упростить принятие решений.

Следует ежеквартально проводить актуализацию плана, поддерживая точность приведенных в нем сведений. Аналогичным образом регулярно уточняется потребность в технических средствах и программном обеспечении для основных и резервных производственных помещений. Ответственность за ведение, испытания, обновление и рассылку плана возлагается на координатора. Испытания можно проводить в два этапа: сначала испытывать каждый элемент плана, а затем имитировать бедствие и испытать план целиком. При этом очень важным фактором остаются затраты.

Руководство должно исходить из того, что неблагоприятные события рано или поздно неизбежны. В связи с этим необходимо осуществить затраты, направленные на принятие мер предосторожности, которые сведут к минимуму отрицательные последствия неблагоприятных событий. Эти затраты в некоторой степени можно оправдать, если использовать план действий в непредвиденных обстоятельствах в целях маркетинга: демонстрировать крупным клиентам, что такой план существует и постоянно корректируется, обеспечивая тем самым бесперебойное функционирование банка в любых обстоятельствах.

Распространено мнение, что затраты на подобное планирование обычно не должны превышать 1% общих затрат на обработку данных, однако их конкретная величина устанавливается в соответствии с политикой организации.

Обследование деятельности

Перед составлением плана необходимо провести обследование деятельности банка, чтобы определить:

  • список жизненно важных прикладных задач и их приоритеты;
  • список ресурсов, обеспечивающих обработку данных, и их приоритеты;
  • потенциально опасные события и вероятность их наступления;
  • возможные денежные убытки в случае чрезвычайных ситуаций.

К возможным опасным событиям относятся:

  • отказ системы кондиционирования воздуха;
  • отказ электрического питания;
  • отказ оборудования;
  • отказ системы телекоммуникации;
  • наводнение;
  • пожар;
  • гражданские беспорядки;
  • вандализм или саботаж;
  • кража;
  • пикетирование компании;
  • чрезвычайные происшествия, которые приводят к повреждению здания, оборудования и материалов;
  • забастовки;
  • локальные военные конфликты.

В плане должны быть описаны конкретные действия, которые необходимо предпринять в каждом из выбранных, в качестве возможных угроз, обстоятельств.

Косвенные убытки в результате подобных внешних воздействий трудно оценить количественно, однако можно указать некоторые их потенциальные источники:

  • увеличение эксплуатационных расходов;
  • потеря клиентов;
  • потеря имущества;
  • публикация неблагоприятной информации;
  • потеря прибыли;
  • утрата престижа;
  • потеря конкурентоспособности;
  • невыполнение требований законов и нормативных документов.
Приоритетность прикладных задач

Чтобы установить порядок, в котором следует решать производственные задачи при ограниченном количестве ресурсов, для каждой из них должен быть установлен приоритет.

Список приоритетов может, например, быть таким:

  • Приоритет 1 - задания, которые должны выполняться в соответствии с установленным графиком.
  • Приоритет 2 - задания, которые могут выполняться при наличии времени и ресурсов.
  • Приоритет 3 - задания, которые не должны выполняться в случае бедствия.

Окончательное решение о приоритетах принимает руководство с учетом рекомендаций руководящего комитета. После их определения необходимо указать ресурсы, требуемые для выполнения этих заданий (персонал, материалы, оборудование). Все эти данные вносятся в план действий в непредвиденных обстоятельствах.

Условия функционирования

В плане надо указать ресурсы, необходимые для обработки данных:

  • конфигурацию технических средств;
  • системную конфигурацию;
  • сеть телеобработки;
  • программное обеспечение, включая системное, прикладное и для передачи данных;
  • документацию (для программ, эксплуатации и пользователя);
  • потребности в персонале.

При этом нужно учитывать и будущее развитие системы обработки данных.

Хранение документации и данных вне производственного помещения

Это одна из самых важных частей плана! Резервное место хранения должно быть безопасным и удаленным от основного помещения. В плане необходимо предусмотреть наличие резервных экземпляров следующих документов и данных:

  • документации на прикладные системы, программы и операционную систему,
  • исходных текстов программ и объектных кодов,
  • библиотек процедур,
  • библиотеки операционной системы,
  • основных файлов,
  • файлов изменений,
  • форм всех входных и выходных документов в достаточном количестве,
  • руководства для действий в непредвиденных обстоятельствах,
  • учетной ведомости технических средств,
  • программного обеспечения.

При покупке пакетов программ следует по возможности приобретать тексты программ на исходном языке, чтобы обезопасить себя от непредвиденного прекращения поставщиком своей деятельности.

Продолжительность чрезвычайной ситуации

Не менее важным фактором является длительность периода неработоспособности. Нужно предусмотреть варианты различной продолжительности неработоспособности системы и для каждого из них разработать свой план действий.

Эти варианты делятся на три основные категории:

  • кратковременная неработоспособность (до 6 часов);
  • неработоспособность средней продолжительности (от 6 до 24 часов);
  • длительная неработоспособность (свыше 24 часов).

Решение о конкретной величине периодов должно принимать руководство.

Как правило, кратковременная неработоспособность не требует переезда в резервное производственное помещение, но влечет за собой изменение графика работы сотрудников, оборудования, транспорта и т.д. Однако иногда оценить период неработоспособности бывает трудно. В этом случае благоразумно сразу же начать подготовку к переезду в резервное производственное помещение, чтобы при необходимости его можно было быстро осуществить. Для этой цели руководство должно постоянно контролировать ситуацию и определять, когда нужно приступить к выполнению плана на случай бедствия более высокой категории. Заблаговременное предупреждение о вводе в действие другого плана сделает переход в следующий режим работы плавным и облегчит работу тем, кто его реализует.

Восстановление вычислительного центра

Планирование и выполнение работ, связанных с реализацией плана действий в непредвиденных обстоятельствах, требует больших усилий. Не меньше усилий потребуется и на обратный переезд в исходное помещение, здесь нужна такая же организованность. До некоторой степени можно сказать, что план действий в непредвиденных обстоятельствах реализуется дважды: первый раз - при переезде в резервное производственное помещение, а второй раз - при переезде в исходное место.

Каждый план действий в непредвиденных обстоятельствах всегда разрабатывается с учетом конкретных условий, в которых функционирует система обработки данных, и имеющихся технических ресурсов. Тем не менее, план должен охватывать все аспекты, перечисленные выше.

Разработка и ведение плана действий в непредвиденных обстоятельствах является чрезвычайно кропотливым, сложным и ответственным делом. Однако эти затраты труда и средств нельзя считать выброшенными на ветер, потому что для банковских систем, как ни для каких других, справедлив принцип "Время - деньги!" и от быстроты восстановления их нормальной деятельности может зависеть будущее банка.

Заключение

Руководители организации или компании являются хранителями ее интересов. Они должны применять качественные методы управления, которые обеспечат получение прибыли, должное качество продукции и услуг, стабильность и развитие организации в интересах заказчиков, служащих и инвесторов. Если нештатная ситуация может поставить под вопрос само существование организации, то вряд ли ее руководство справляется со своими обязанностями.

При отсутствии эффективного "Плана обеспечения бесперебойной деятельности организации в случае нештатных ситуаций" могут возникнуть следующие проблемы и опасности:

  • Прерывание деятельности организации, которое влечет за собой неспособность обслуживания имеющихся заказчиков, потерю перспектив для бизнеса, уменьшение существующего круга заказчиков, утрату престижа и потерю конкурентоспособности.
  • Финансовый ущерб из-за невозможности обрабатывать счета дебиторов, штрафов за задержку платежей, упущенных скидок, неспособности обновлять балансы счетов и потерянных или неучтенных продаж.
  • Юридическая ответственность из-за невыполнения обязательств по контрактам.
  • Прекращение деятельности организации.

Под "планированием бесперебойной деятельности организации в случае нештатных ситуаций" понимается "выявление и защита критически важных бизнес-процессов и ресурсов, необходимых для поддержания деятельности организации на нужном уровне, а также разработка процедур, которые обеспечат выживание организации при нарушении ее нормальной деятельности".

Для обеспечения бесперебойной деятельности необходимо учитывать все взаимосвязанные внешние и внутренние функции, в том числе ручные методы учета и обработки информации.

Целями проекта по составлению плана, обеспечивающего бесперебойность и восстановление деятельности организации в случае бедствий, являются:

  • Оценка бизнес-процессов, которая обеспечит разработку плана с помощью хорошо структурированной и всеобъемлющей методологии.
  • Разработка экономичного и работоспособного плана, который обеспечит бесперебойность критически важных бизнес-процессов в случае серьезного нарушения деятельности организации.
  • Минимизация последствий любого бедствия для организации.

Эффективный план обеспечения бесперебойной деятельности является относительно недорогой формой страхования компаний от последствий возможных бедствий, и затраты на него должны рассматриваться как составляющая необходимых издержек на поддержание нормальной деятельности организации.

. Источники информации по проблемам обеспечения бесперебойной деятельности организаций в случае бедствий

В настоящее время в России нет государственной организации, которая систематически занимается вопросами распространения знаний в области обеспечения бесперебойной деятельности организаций и компаний в случае бедствий. В тоже время в Интернет имеется множество WEB-серверов, посвященных данному вопросу, перечислим только несколько из них:

  1. http://www.bcp.ru - русскоязычный информационный портал по вопросам управления и планирования непрерывности бизнеса. Его создали и ведут сертифицированные специалисты в области управления непрерывностью бизнеса (квалификация MBCI по версии международного института непрерывности бизнеса). В Англии the Business Continuity Institute, BCI, http://www.the bci.org, из российского представительства компании KPMG, а также аудита и контроля информационных систем (квалификация CISA по версии Международной ассоциации аудита и контроля информационных систем), Information Systems Audit and Control Assosiation, ISACA, http://www.isaca.org .
  2. http://www.dr.org - сервер Международного института восстановления после бедствия (Disaster Recovery Institute International - DRI International, ранее DRI).

    Международный институт восстановления после бедствия (DRI International) был создан в 1988 г. при Вашингтонском университете. Он является некоммерческой организацией, которая занимается обучением и выдачей квалификационных свидетельств в области восстановления деятельности организаций после бедствия.

    Основными направлениями деятельности института являются:

    • создание соответствующего Общего свода знаний и распространение информации;
    • первичное обучение в области обеспечения бесперебойной деятельности организации в случае бедствия;
    • непрерывное повышение квалификации специалистов;
    • выполнение роли ведущей организации по экспертизе соответствующих стандартов.
  3. http://www.drj.com - сервер независимого американского журнала по вопросам восстановления после бедствия (Disaster Recovery Journal).

    Disaster Recovery Journal, или DRJ - журнал по вопросам восстановления после бедствия, выпускается с 1987 года. Он имеет более 40 000 подписчиков и содержит почти 100 страниц.

    С 1989 г. DRJ проводит ежегодные конференции. В настоящее время в них принимает участие свыше 2000 человек, приезжающих со всего мира, эти конференции являются крупнейшими в данной области.

    Web-сервер DRJ помимо статей из двух последних номеров журнала содержит массу полезной информации: телеконференцию, описание продуктов и консультационных услуг, список фирм и организаций, работающих в рассматриваемой области, список Web-серверов на данную тему и т.д.

    http://www.fema.gov - сервер Федерального агентства по управлению чрезвычайными ситуациями США (Federal Emergency Management Agency - FEMA).

    На сервере имеется раздел, посвященный проблеме уменьшения пагубных последствий бедствия, информация о происшедших бедствиях, телеконференции по различным темам, данные о конференциях и семинарах, перечень курсов обучения, проводимых FEMA, справочная литература и т.п.

  4. http://www.iaem.com - сервер Международной ассоциации менеджеров чрезвычайных ситуаций. Это некоммерческая образовательная организация, распространяющая знания по методам спасения жизни людей и имущества в чрезвычайных обстоятельствах.
  5. http://www.sba.gov/disaster - раздел сервера Администрации малого бизнеса США, посвященный планированию непрерывности бизнеса.

Для разработки плана существует три основных способа:

Собственными силами.

С помощью коммерческого программного обеспечения, предназначенного для составления планов обеспечения бесперебойной деятельности (демонстрационные версии таких программ можно посмотреть или скачать с веб-сайта независимого американского журнала по вопросам восстановления после бедствия Disaster Recovery Journal.

Привлечение внешнего консультанта для оказания помощи или непосредственной разработки плана.

Способы отличаются по стоимости, но во всех случаях требуется выделение персонала для проведения исследований и реализации плана.

Разработка собственными силами требует наличия квалификации в области составления плана обеспечения бесперебойной деятельности. Эту квалификацию можно приобрести только путем всестороннего обучения и накопления опыта. Большинство организаций не имеют этой возможности.

Разработку плана обеспечения бесперебойной деятельности предприятия необходимо организовать в виде проекта, чтобы управлять задачами, сроками и конечными результатами. Основными этапами типичного проекта являются:

Организация выполнения проекта;

Оценка риска, уменьшение нежелательных последствий от наступления событий, связанных с риском, анализ последствий для бизнеса;

Разработка стратегии восстановления деятельности;

Документирование плана;

Обучение;

Имитация бедствия.

Организация выполнения проекта

Организация выполнения проекта включает в себя административное управление проектом, определение допущений, проведение совещаний и разработку политики .

Оценка риска. При оценке риска выявляются типы бедствий, которые могут произойти в каждом конкретном месте. Обследуется физическая инфраструктура здания и его окружения. Для каждого типа бедствия делается оценка возможной продолжительности и присваивается относительная величина, соответствующая вероятности их появления. Используется шкала, например, от 0 до 3; где 0 означает невероятное событие, а 3 -- весьма вероятное. В результате этого выявляются области, в которых следует провести дальнейшие исследования, чтобы уменьшить последствия событий, приводящих к риску.

Анализ последствий для деятельности организации. После оценки риска проводится анализ последствий бедствия для деятельности организации, в ходе которого определяются потери из-за невозможности продолжать нормальную деятельность. Они могут быть очевидными или носить более абстрактный характер, при котором руководству придется сделать предположительную оценку потерь. В любом случае цель заключается не в том, чтобы получить точный ответ, а в том, чтобы выявить факторы, которые являются критически важными для продолжения деятельности компании. На этом этапе определяется масштаб плана обеспечения бесперебойной деятельности. Чрезмерные меры предосторожности потребуют лишних средств, а недостаточные -- не обеспечат должной безопасности.

Разработка стратегии обеспечения бесперебойной деятельности. После определения требований можно принимать решение о том, как обеспечивать восстановление деятельности. Существует множество вариантов технических решений, в том числе:

Использование "горячего" резервного помещения. Поставщик предоставляет компании подготовленное рабочее помещение с оборудованием, средствами телекоммуникации, персоналом, осуществляющим техническую поддержку, и т.д., обычно по годовому контракту. Заказчики получают доступ к оборудованию по принципу "первый пришел -- первым обслуживается".

Использование "холодного" резервного помещения. Компания организует работу в пустующем или арендуемом помещении, которое подготовлено к использованию. Сразу после бедствия в помещении развертывается оборудование (возможно, закупаемое у поставщиков), программное обеспечение и службы обеспечения.

Использование внутренних резервов. Для предоставления услуг в чрезвычайных обстоятельствах используется оборудование компании, которое расположено в ином месте.

Заключение соглашения о взаимной поддержке. Заключается соглашение с другой компанией о коллективном использовании ресурсов после бедствия. При этом предполагается, что резервное оборудование всегда имеет нужную производительность и вас устраивает степень защиты информации при коллективной работе.

В некоторых случаях можно использовать комбинацию этих вариантов. Крупные многонациональные компании чаще всего используют для локальных вычислительных сетей метод внутреннего резервирования. Поскольку количество имеющихся резервных помещений ограничено, может оказаться, что в случае чрезвычайных обстоятельств не окажется рабочего помещения, которое можно было бы использовать. Бедствие в масштабе региона может привести к тому, что все резервные помещения будут заняты и компании негде будет возобновить работу.

Хорошо подготовленный план обеспечивает компанию пошаговыми инструкциями, соответствующими типу и тяжести бедствия. В нем указываются функциональные группы специалистов компании, подготовленные для реализации плана. Наличие хорошо проработанного плана гарантирует, что в стрессовой ситуации после возникновения чрезвычайных обстоятельств, критически важные факторы не будут упущены.

Документация. План может документироваться различными способами. Большинство компаний все еще применяют традиционные текстовые редакторы, другие используют коммерческое программное обеспечение. Какой бы метод ни был использован, важно обеспечить строгое выполнение процедур управления внесением изменений, чтобы поддерживать план в состоянии, соответствующем реальной текущей ситуации.

Обучение. Обучение "Группы восстановления" направлено на то, чтобы каждый сотрудник знал свои функции и обязанности в случае возникновения нештатных ситуаций.

Имитация бедствия. Большинство компаний проводят испытания плана минимум один раз в полгода. Имитируя бедствия можно проверить план, найти его слабые места и отработать взаимодействие участников. Обнаружение недостатков обычно влечет за собой корректировку плана. План должен регулярно проходить испытания и корректироваться. Лишь немногие планы обеспечения бесперебойной деятельности выполняются так, как это предусматривалось первоначально. Поскольку внесение поправок в план необходимо делать регулярно, должна быть максимально упрощена процедура корректировки плана .

При разработке плана обеспечения бесперебойной деятельности необходимо предусмотреть следующее:

Если в настоящий момент план отсутствует, необходимо уведомить высшее руководство о потенциальных опасностях, которые связаны с отсутствием подготовленного и испытанного плана;

При наличии плана надо обеспечить его регулярное испытание -- провести циклическую замену специалистов, участвующих в испытаниях. Желательно, чтобы в этом процессе приняло участие максимальное количество сотрудников;

Надо добиться того, чтобы руководство сделало планирование обеспечения бесперебойной деятельности одной из своих целей;

При выборе альтернативных рабочих помещений необходимо позаботиться, чтобы ими можно было воспользоваться при первой необходимости;

Не принимайте существующие системы и процедуры резервирования на веру: проведите полную экспертизу резервирования и внесите необходимые изменения. Проведите испытания процедур восстановления;

При определении приоритетов приложений опросите руководителей, чтобы они изложили свою точку зрения;

Учтите в плане все мелочи, которые могли бы помешать процессу восстановления деятельности;

После составления плана разработайте механизм, обеспечивающий его регулярное обновление.

Также план должен содержать процедуры выполнения следующих функций:

Ввод в действие процедур для чрезвычайных ситуаций.

Уведомление сотрудников, поставщиков и заказчиков.

Формирование группы (групп) восстановления.

Оценка последствий бедствия.

Принятие решения о реализации плана восстановления деятельности.

Ввод в действие процедур восстановления деятельности.

Переезд в альтернативное рабочее помещение (помещения).

Восстановление функционирования критически важных приложений.

Восстановление основного рабочего помещения.

Кроме того, план должен содержать документы, которые могут быть использованы персоналом, не знакомым с конкретно восстанавливаемыми функциями. Эти документы должны включать следующие данные:

Схемы коммутации телефонов;

Процедуры для аварийного отключения питания;

Организационная структура Центра восстановления;

Требования к оборудованию и снабжению Центра восстановления;

Конфигурация Центра восстановления;

Список критически важных приложений;

Список восстанавливаемого оборудования;

Сводные данные по оценке рисков.

Проводе комплексный анализ представим описание плана по обеспечению непрерывной деятельности в организации. План включает следующие основные разделы:

а) Основные положения плана.

б) Оценка чрезвычайных ситуаций:

Выявление уязвимых мест компании;

Классификация возможных опасных событий и оценка вероятности их возникновения;

Сценарии чрезвычайных ситуаций;

Потенциальные источники отрицательных последствий каждой чрезвычайной ситуации и оценка величины ущерба;

Набор критериев, на основании которых объявляется чрезвычайная ситуация.

в) Деятельность компании в чрезвычайной ситуации:

Первоначальное реагирование на чрезвычайную ситуацию (оценка опасного события, объявление чрезвычайной ситуации, оповещение необходимого круга лиц, ввод в действие чрезвычайного плана);

Мероприятия, обеспечивающие бесперебойность деятельности компании в чрезвычайной ситуации и восстановление ее нормального функционирования.

г) Поддержание готовности к возникновению чрезвычайной ситуации:

Контроль правильности и корректировка содержания плана;

Составление списка адресов и процедуры рассылки плана;

Разработка программы повышения квалификации и ознакомления персонала с действиями, необходимыми для восстановления деятельности компании после бедствия;

Подготовка к опасным событиям, обеспечение безопасности и предотвращение бедствий;

Регулярное проведение частичных и комплексных проверок (типа пожарных учений) готовности компании к действиям в чрезвычайной ситуации и способности восстановить нормальную деятельность;

Регулярное создание резервных копий данных, документации, бланков входных и выходных документов и основного программного обеспечения, их хранение в безопасном месте.

д) Информационное обеспечение:

Приоритетные функции, выполняемые компанией;

Списки внутренних и внешних ресурсов -- технических средств, программного обеспечения, средств связи, документов, офисного оборудования и персонала;

Учетная информация о техническом, программном и другом обеспечении, необходимом для восстановления деятельности организации в случае чрезвычайной ситуации;

Список лиц, которых необходимо оповестить о чрезвычайной ситуации с указанием адресов и телефонов;

Вспомогательная информация -- планы и схемы, маршруты перевозок, адреса и т.п.;

Описание детальных пошаговых процедур, обеспечивающих четкое выполнение всех предусмотренных мер;

Функции и обязанности сотрудников в случае возникновения непредвиденных обстоятельств;

Сроки восстановления деятельности в зависимости от типа возникшей чрезвычайной ситуации;

Смета расходов, источники финансирования.

е) Техническое обеспечение:

Создание и поддержание базы технических средств, обеспечивающей бесперебойную деятельность компании в чрезвычайной ситуации;

Создание и поддержание в надлежащем состоянии резервного производственного помещения.

ж) Организационное обеспечение, состав и функции следующих групп, обеспечивающих бесперебойную деятельность в случае бедствия:

Группы оценки чрезвычайной ситуации;

Группы управления в кризисной ситуации;

Группы для работ в чрезвычайной ситуации;

Группы восстановления;

Группы обеспечения работы в резервном производственном помещении;

Группы административной поддержки.

Таким образом план обеспечения непрерывной деятельности организации представляет собой детальный перечень мероприятий, которые должны быть выполнены до, во время и после бедствия. Этот план документируется и испытывается, чтобы удостовериться в его работоспособности в изменяющихся условиях.

План служит руководством к действию во время кризиса и гарантирует, что ни один важный аспект не будет упущен. Профессионально составленный план направляет действия даже неопытных сотрудников.

Наличие детального, регулярно испытываемого плана поможет оградить любую организацию от судебных исков по поводу халатности. Само существование плана служит доказательством того, что руководство компании не пренебрегло подготовкой к возможным бедствиям.

Основные выгоды от составления детального плана обеспечения бесперебойной деятельности состоят в следующем:

Минимизация потенциальных финансовых потерь;

Уменьшение юридической ответственности;

Сокращение времени нарушения нормальной работы;

Обеспечение стабильности деятельности организации;

Организованное восстановление деятельности;

Сведение к минимуму суммы страховых взносов;

Уменьшение нагрузки на ведущих сотрудников;

Лучшая сохранность имущества;

Обеспечение безопасности персонала и заказчиков;

Соблюдение требований законов и инструкций.

Разработка плана по обеспечению непрерывности и восстановлению деятельности предприятия

3.2 План обеспечения бесперебойной деятельности организации в случае нештатных ситуаций

Для разработки плана существует три основных способа:

Собственными силами.

С помощью коммерческого программного обеспечения, предназначенного для составления планов обеспечения бесперебойной деятельности (демонстрационные версии таких программ можно посмотреть или скачать с веб-сайта независимого американского журнала по вопросам восстановления после бедствия Disaster Recovery Journal.

Привлечение внешнего консультанта для оказания помощи или непосредственной разработки плана.

Способы отличаются по стоимости, но во всех случаях требуется выделение персонала для проведения исследований и реализации плана.

Разработка собственными силами требует наличия квалификации в области составления плана обеспечения бесперебойной деятельности. Эту квалификацию можно приобрести только путем всестороннего обучения и накопления опыта. Большинство организаций не имеют этой возможности.

Разработку плана обеспечения бесперебойной деятельности предприятия необходимо организовать в виде проекта, чтобы управлять задачами, сроками и конечными результатами. Основными этапами типичного проекта являются:

Организация выполнения проекта;

Оценка риска, уменьшение нежелательных последствий от наступления событий, связанных с риском, анализ последствий для бизнеса;

Разработка стратегии восстановления деятельности;

Документирование плана;

Обучение;

Имитация бедствия.

Организация выполнения проекта

Организация выполнения проекта включает в себя административное управление проектом, определение допущений, проведение совещаний и разработку политики .

Оценка риска. При оценке риска выявляются типы бедствий, которые могут произойти в каждом конкретном месте. Обследуется физическая инфраструктура здания и его окружения. Для каждого типа бедствия делается оценка возможной продолжительности и присваивается относительная величина, соответствующая вероятности их появления. Используется шкала, например, от 0 до 3; где 0 означает невероятное событие, а 3 -- весьма вероятное. В результате этого выявляются области, в которых следует провести дальнейшие исследования, чтобы уменьшить последствия событий, приводящих к риску.

Анализ последствий для деятельности организации. После оценки риска проводится анализ последствий бедствия для деятельности организации, в ходе которого определяются потери из-за невозможности продолжать нормальную деятельность. Они могут быть очевидными или носить более абстрактный характер, при котором руководству придется сделать предположительную оценку потерь. В любом случае цель заключается не в том, чтобы получить точный ответ, а в том, чтобы выявить факторы, которые являются критически важными для продолжения деятельности компании. На этом этапе определяется масштаб плана обеспечения бесперебойной деятельности. Чрезмерные меры предосторожности потребуют лишних средств, а недостаточные -- не обеспечат должной безопасности.

Разработка стратегии обеспечения бесперебойной деятельности. После определения требований можно принимать решение о том, как обеспечивать восстановление деятельности. Существует множество вариантов технических решений, в том числе:

Использование "горячего" резервного помещения. Поставщик предоставляет компании подготовленное рабочее помещение с оборудованием, средствами телекоммуникации, персоналом, осуществляющим техническую поддержку, и т.д., обычно по годовому контракту. Заказчики получают доступ к оборудованию по принципу "первый пришел -- первым обслуживается".

Использование "холодного" резервного помещения. Компания организует работу в пустующем или арендуемом помещении, которое подготовлено к использованию. Сразу после бедствия в помещении развертывается оборудование (возможно, закупаемое у поставщиков), программное обеспечение и службы обеспечения.

Использование внутренних резервов. Для предоставления услуг в чрезвычайных обстоятельствах используется оборудование компании, которое расположено в ином месте.

Заключение соглашения о взаимной поддержке. Заключается соглашение с другой компанией о коллективном использовании ресурсов после бедствия. При этом предполагается, что резервное оборудование всегда имеет нужную производительность и вас устраивает степень защиты информации при коллективной работе.

В некоторых случаях можно использовать комбинацию этих вариантов. Крупные многонациональные компании чаще всего используют для локальных вычислительных сетей метод внутреннего резервирования. Поскольку количество имеющихся резервных помещений ограничено, может оказаться, что в случае чрезвычайных обстоятельств не окажется рабочего помещения, которое можно было бы использовать. Бедствие в масштабе региона может привести к тому, что все резервные помещения будут заняты и компании негде будет возобновить работу.

Хорошо подготовленный план обеспечивает компанию пошаговыми инструкциями, соответствующими типу и тяжести бедствия. В нем указываются функциональные группы специалистов компании, подготовленные для реализации плана. Наличие хорошо проработанного плана гарантирует, что в стрессовой ситуации после возникновения чрезвычайных обстоятельств, критически важные факторы не будут упущены.

Документация. План может документироваться различными способами. Большинство компаний все еще применяют традиционные текстовые редакторы, другие используют коммерческое программное обеспечение. Какой бы метод ни был использован, важно обеспечить строгое выполнение процедур управления внесением изменений, чтобы поддерживать план в состоянии, соответствующем реальной текущей ситуации.

Обучение. Обучение "Группы восстановления" направлено на то, чтобы каждый сотрудник знал свои функции и обязанности в случае возникновения нештатных ситуаций.

Имитация бедствия. Большинство компаний проводят испытания плана минимум один раз в полгода. Имитируя бедствия можно проверить план, найти его слабые места и отработать взаимодействие участников. Обнаружение недостатков обычно влечет за собой корректировку плана. План должен регулярно проходить испытания и корректироваться. Лишь немногие планы обеспечения бесперебойной деятельности выполняются так, как это предусматривалось первоначально. Поскольку внесение поправок в план необходимо делать регулярно, должна быть максимально упрощена процедура корректировки плана .

При разработке плана обеспечения бесперебойной деятельности необходимо предусмотреть следующее:

Если в настоящий момент план отсутствует, необходимо уведомить высшее руководство о потенциальных опасностях, которые связаны с отсутствием подготовленного и испытанного плана;

При наличии плана надо обеспечить его регулярное испытание -- провести циклическую замену специалистов, участвующих в испытаниях. Желательно, чтобы в этом процессе приняло участие максимальное количество сотрудников;

Надо добиться того, чтобы руководство сделало планирование обеспечения бесперебойной деятельности одной из своих целей;

При выборе альтернативных рабочих помещений необходимо позаботиться, чтобы ими можно было воспользоваться при первой необходимости;

Не принимайте существующие системы и процедуры резервирования на веру: проведите полную экспертизу резервирования и внесите необходимые изменения. Проведите испытания процедур восстановления;

При определении приоритетов приложений опросите руководителей, чтобы они изложили свою точку зрения;

Учтите в плане все мелочи, которые могли бы помешать процессу восстановления деятельности;

После составления плана разработайте механизм, обеспечивающий его регулярное обновление.

Также план должен содержать процедуры выполнения следующих функций:

Ввод в действие процедур для чрезвычайных ситуаций.

Уведомление сотрудников, поставщиков и заказчиков.

Формирование группы (групп) восстановления.

Оценка последствий бедствия.

Принятие решения о реализации плана восстановления деятельности.

Ввод в действие процедур восстановления деятельности.

Переезд в альтернативное рабочее помещение (помещения).

Восстановление функционирования критически важных приложений.

Восстановление основного рабочего помещения.

Кроме того, план должен содержать документы, которые могут быть использованы персоналом, не знакомым с конкретно восстанавливаемыми функциями. Эти документы должны включать следующие данные:

Схемы коммутации телефонов;

Процедуры для аварийного отключения питания;

Организационная структура Центра восстановления;

Требования к оборудованию и снабжению Центра восстановления;

Конфигурация Центра восстановления;

Список критически важных приложений;

Список восстанавливаемого оборудования;

Сводные данные по оценке рисков.

Проводе комплексный анализ представим описание плана по обеспечению непрерывной деятельности в организации. План включает следующие основные разделы:

а) Основные положения плана.

б) Оценка чрезвычайных ситуаций:

Выявление уязвимых мест компании;

Классификация возможных опасных событий и оценка вероятности их возникновения;

Сценарии чрезвычайных ситуаций;

Потенциальные источники отрицательных последствий каждой чрезвычайной ситуации и оценка величины ущерба;

Набор критериев, на основании которых объявляется чрезвычайная ситуация.

в) Деятельность компании в чрезвычайной ситуации:

Первоначальное реагирование на чрезвычайную ситуацию (оценка опасного события, объявление чрезвычайной ситуации, оповещение необходимого круга лиц, ввод в действие чрезвычайного плана);

Мероприятия, обеспечивающие бесперебойность деятельности компании в чрезвычайной ситуации и восстановление ее нормального функционирования.

г) Поддержание готовности к возникновению чрезвычайной ситуации:

Контроль правильности и корректировка содержания плана;

Составление списка адресов и процедуры рассылки плана;

Разработка программы повышения квалификации и ознакомления персонала с действиями, необходимыми для восстановления деятельности компании после бедствия;

Подготовка к опасным событиям, обеспечение безопасности и предотвращение бедствий;

Регулярное проведение частичных и комплексных проверок (типа пожарных учений) готовности компании к действиям в чрезвычайной ситуации и способности восстановить нормальную деятельность;

Регулярное создание резервных копий данных, документации, бланков входных и выходных документов и основного программного обеспечения, их хранение в безопасном месте.

д) Информационное обеспечение:

Приоритетные функции, выполняемые компанией;

Списки внутренних и внешних ресурсов -- технических средств, программного обеспечения, средств связи, документов, офисного оборудования и персонала;

Учетная информация о техническом, программном и другом обеспечении, необходимом для восстановления деятельности организации в случае чрезвычайной ситуации;

Список лиц, которых необходимо оповестить о чрезвычайной ситуации с указанием адресов и телефонов;

Вспомогательная информация -- планы и схемы, маршруты перевозок, адреса и т.п.;

Описание детальных пошаговых процедур, обеспечивающих четкое выполнение всех предусмотренных мер;

Функции и обязанности сотрудников в случае возникновения непредвиденных обстоятельств;

Сроки восстановления деятельности в зависимости от типа возникшей чрезвычайной ситуации;

Смета расходов, источники финансирования.

е) Техническое обеспечение:

Создание и поддержание базы технических средств, обеспечивающей бесперебойную деятельность компании в чрезвычайной ситуации;

Создание и поддержание в надлежащем состоянии резервного производственного помещения.

ж) Организационное обеспечение, состав и функции следующих групп, обеспечивающих бесперебойную деятельность в случае бедствия:

Группы оценки чрезвычайной ситуации;

Группы управления в кризисной ситуации;

Группы для работ в чрезвычайной ситуации;

Группы восстановления;

Группы обеспечения работы в резервном производственном помещении;

Группы административной поддержки.

Таким образом план обеспечения непрерывной деятельности организации представляет собой детальный перечень мероприятий, которые должны быть выполнены до, во время и после бедствия. Этот план документируется и испытывается, чтобы удостовериться в его работоспособности в изменяющихся условиях.

План служит руководством к действию во время кризиса и гарантирует, что ни один важный аспект не будет упущен. Профессионально составленный план направляет действия даже неопытных сотрудников.

Наличие детального, регулярно испытываемого плана поможет оградить любую организацию от судебных исков по поводу халатности. Само существование плана служит доказательством того, что руководство компании не пренебрегло подготовкой к возможным бедствиям.

Основные выгоды от составления детального плана обеспечения бесперебойной деятельности состоят в следующем:

Минимизация потенциальных финансовых потерь;

Уменьшение юридической ответственности;

Сокращение времени нарушения нормальной работы;

Обеспечение стабильности деятельности организации;

Организованное восстановление деятельности;

Сведение к минимуму суммы страховых взносов;

Уменьшение нагрузки на ведущих сотрудников;

Лучшая сохранность имущества;

Обеспечение безопасности персонала и заказчиков;

Соблюдение требований законов и инструкций.

Анализ деятельности предприятия "Бипэк-Авто"

В случае возникновения загорания или пожара, или же случае признаков загорания или пожара,работник обязан: сообщить немедленно по телефону 101 следующее: точный адрес (улица, номер здания или сторения, этаж) что горит (электроустановка...

Информационно-документационное обеспечение принятия стратегических решений в организации (на примере ОАО "Родина")

Организация документационного обеспечения принятия стратегических решений предприятия - это комплекс мероприятий, направленных на создание и поддержание условий...

Очень важна роль общественно-экономической формации в формировании социально-психологического климата производственного коллектива. В соответствии с этими наиболее значимыми факторами...

Планирование производственно-хозяйственной деятельности

В условиях функционирования рыночных отношений предприятия изучают конъюнктуру рынка, возможности потенциальных партнеров, движение цен и на их основе организуют материально-техническое обеспечение собственного производства...

Применение аутплейсмента при высвобождении персонала

Разработка антикризисной стратегии на предприятии (на материалах ОАО "ГМС Насосы")

ОАО «ГМС - Насосы» является крупным предприятием, существующим более 60 лет. Предприятие известно на рынке как успешное, эффективно работающее, выпускающее высокого качества насосов...

Разработка бизнес-плана реализации стратегии деятельности коммерческой организации

Каждая фирма, начиная свою деятельность, обязана четко представить потребность на перспективу в финансовых, материальных, трудовых и интеллектуальных ресурсах, источники их получения...

Разработка плана по обеспечению непрерывности и восстановлению деятельности предприятия

В настоящее время почти все компании в значительной степени зависят от компьютерных технологий или автоматизированных систем...

Разработка методов предупреждения конфликтов в организации. Глава 1. Теоретические аспекты управления конфликтами в организации 1.1 Анализ понятия конфликт Среди современных авторов...

Социально-психологические методы предотвращения конфликтов в коллективе учреждения СКС

Способы управления конфликтными ситуациями

В туристическом бизнесе конфликты встречаются довольно часто и проявляются наиболее четко и ярко...

Если Вы слепо доверяете надежности своего "винчестера", то, поверь-
те, наступит день, когда Вы об этом пожалеете. У любой механической
системы (а жесткий диск таковой и является) есть свой запас прочно-
сти. Что произойдет после выработки ресурса, точно никто не пред-
скажет, однако на лучшее можете не рассчитывать: самая важная для Вас
информация наверняка пропадет безвозвратно. В Windows NT Server
встроены механизмы, обеспечивающие отказоустойчивость системы:

для особо надежной работы с диском, резервного копирования, под-
держки работы с источниками бесперебойного питания, выбора рабо-
тоспособной конфигурации и восстановления системы со специально-
го диска. Но как быть, если из строя вышел сам компьютер? Чтобы это
не отразилось на Вашей работе, рекомендуются кластерные решения.

Как видите, в системе достаточно много средств обеспечения беспере-
бойной работы. Возможно, кто-то даже спросит: зачем так много раз-
ных, на первый взгляд, дублирующих друг друга, механизмов - ведь это
повышает стоимость системы? Почему раз кластеры обеспечивают
столь высокую степень надежности, не использовать их повсеместно?

В таблице 5-1 показаны различные виды сбоев, которые могут проис-
ходить в сети предприятия, а также методы их предотвращения или
минимизации неприятных последствий.

Таблица 5-1
Источник сбоя Кластерное решение Другие решения
Сетевой концентратор Применимо, если каждый -
из узлов подключен
к своему концентратору
Напряжение питания - Источник беспере-
бойного питания
Подключение к серверу Применимо -
Жесткий диск - RAID, отказо-
устойчивые диски
Аппаратура сервера Применимо -
(процессор, память
и др.)
Серверное ПО Применимо -
Маршрутизаторы, - Дублирующие
выделенные линии и др. маршруты и линии
Коммутируемые - Пулы модемов
соединения
Клиентские - Несколько клиентов
компьютеры с одинаковыми
уровнями доступа


Таблица хорошо показывает, что хотя кластеры и обеспечивают высо-
кую степень надежности сервера, но не являются панацеей. К тому же
они поддерживаются только версией для предприятий (Windows NT
Server Enterprise Edition). Требуются дополнительные механизмы. Рас-
смотрим средства обеспечения бесперебойной работы, встроенные в
Windows NT Server 5.0.

Средства повышения надежности работы
с диском

Если Вы регулярно пользовались такими программами как CHKDSK или
Norton disk Doctor, то наверняка обращали внимание на иногда обна-
руживаемые на жестких дисках "плохие области" (bad blocks), которые
эти программы помечают как недоступные. Причин появления таких
областей несколько, начиная от некачественного диска и кончая неко-
торыми видами вирусов. Но какова бы ни была причина, результат все-
гда один - сокращение доступного рабочего пространства на диске.
Если же Вы своевременно не продиагностировали диск, то последствия
могут быть еще печальнее: Вы потеряете данные, записанные на по-
врежденный участок, а, в самом худшем случае, операционная система
утратит работоспособность. Поэтому, если в Вашем компьютере толь-
ко один жесткий диск или Вы не используете технологии, описанные
далее в этой главе, первейшей заботой должна стать регулярная про-
верка состояния диска.

Замечание. Современные компьютерные системы, выпускаемые из-
вестными производителями, зачастую обладают встроенными средства-
ми контроля за состоянием дисков и оповещения операционной сис-
темы и администратора о надвигающейся угрозе. Примером могут слу-
жить компьютеры Compaq Proliant, где о предстоящем крахе диска из-
вещается не только операционная система, но и оператор, на пейджер
которого посылается предупреждающий сигнал.

Проверка состояния жесткого диска

Для проверки жесткого диска используется встроенная утилита CHKDSK,
запускаемая из командной строки. Для поиска плохих секторов необ-
ходимо запускать ее с ключом /R. При этом, правда, следует помнить,
что операция может длиться несколько часов. Но если Вы производите
ее регулярно, то о наличии сбойных секторов можете косвенно судить
по резко возросшему времени проверки.

CHKDSK [[ path ]filenanie] ],

Указывает диск, который надо проверить;

Filename - указывает файлы для проверки фрагментации (только на
FAT);

. /F - исправляет ошибки на диске;

. /V - для FAT показывает полное имя и путь к файлам на диске; для
NTFS - также сообщения об очистке;

. /R - определяет плохие сектора и восстанавливает читаемую ин-
формацию;

. /L: size - только для NTFS: устанавливает размер файла журнала в
килобайтах, если размер не указан, подразумевается активный.

Внимание! Если во время работы системы выполнение программы
CHKDSK невозможно (например, на выбранном диске находится файл
подкачки), Вам будет предложено перенести ее исполнение на момент
загрузки системы. Если Вы согласитесь, то при следующей перезагруз-
ке будет выполнена полная проверка диска.

Помимо команды CHKDSK в Windows NT 5.0 для проверки диска име-
ется графическая утилита. Чтобы ее вызвать, необходимо щелкнуть
правой кнопкой мыши имя диска в папке My Computer и в появившем-
ся меню выбрать команду Properties. В диалоговом окне надо выбрать
вкладку Tools и щелкнуть кнопку Check Now. Для полной проверки
диска следует отметить оба флажка: Automatically fix filesystem
errors
и Scan and attempt recovery of bad sectors.


Диалоговое окно проверки состояния жестких дисков

Чтобы обезопасить себя от разного рода неприятностей, связанных с
отказами дисковой системы на сервере, лучше использовать средства,
повышающие надежность их работы. К средствам Windows NT, обеспе-
чивающих повышенную надежность при работе с диском, относятся:

зеркализация дисков, дублирование дисков, чередование дисков с кон-
тролем четности и замена секторов (в "горячем" режиме).

Технология RAID (избыточный массив
недорогих дисков)

Средства повышения надежности работы с дисками имеют промыш-
ленный стандарт и подразделяются на несколько уровней использова-
ния избыточных массивов недорогих дисков (RAID) (см. таблицу 5-2).
Каждый из уровней обладает различным сочетанием производительно-
сти, надежности и стоимости. В Windows NT Server 5.0 обеспечивается
поддержка RAID уровней 0,1 и 5.


Чередование дисков

Этот уровень (RAIDO) обеспечивает чередование между различными
разделами диска. При этом файл как бы "размазан" по нескольким
физическим дискам. Данный метод может увеличить производитель-
ность работы с диском, особенно, когда диски подключены к разным

контроллерам дисков. Так как этот подход нс обеспечивает избы точ-
ности, его нельзя назвать в полной мере RAID. При выходе из строя
любого раздела в массиве все данные будут потеряны. Для реализации
метода требуется от 2 до 32 дисков. Увеличение производительности
достигается только при использовании разных контроллеров диска.


Уровень О: чередование дисков

Зеркализация и дублирование дисков

Зеркальная копия диска или раздел создаются средствами RAID уровня 1:

зеркализацией или дублированием. Зеркальное отражение дисков дей-
ствует на уровне разделов. Любой раздел, включая загрузочный или
системный, может быть зеркально отражен. Это простейший метод
повышения надежности работы с диском. Чаше всего, зеркализация -
самый дорогой метод обеспечения надежности, так как при нем задей-
ствовано всего лишь 50 процентов объема жесткого диска. Однако в
большинстве одноранговых или небольших серверных сетей такой
способ дешев за счет использования всего двух дисков.

Дублирование дисков - зеркализация с применением дополнительно-
го адаптера на вторичном дисководе - обеспечивает отказоустойчи-
вость и при сбое контроллера, и при сбое диска. Кроме того, дублиро-
вание может повысить производительность.

Подобно зеркализации, дублирование выполняется на уровне раздела.
Для Windows NT не существует различия между зеркализацией и дуб-
лированием - вопрос лишь в местонахождении другого раздела.

Здесь уместно остановиться и прояснить ситуацию, с которой доволь-
но часто встречаются администраторы при зеркализации системного
загрузочного диска. Случается, что при выходе из строя одного из дис-
ков принимается решение эксплуатировать систему с другим, остав-
шимся. При этом предполагается, что поскольку второй диск является
зеркальной копией первого, то никаких дополнительных мер предпри-
нимать не надо - достаточно просто загрузить компьютер. Тут-то и
находится камень преткновения: если данный раздел диска не являет-


Для активизации раздела надо воспользоваться либо утилитой FDISK,
входящей в поставку любой версии MS-DOS (для разделов FAT), либо
слепком Disk Administrator.

Чередование дисков с записью кода коррекции

RAID уровня 2 работает так: блок данных при записи на диск разбива-
ется на несколько частей, каждая из которых записывается на отдель-
ный диск. Одновременно создается код коррекции, который также запи-
сывается на разные диски. Потерянные данные можно восстановить по
коду коррекции с помощью специального математического алгоритма.

Этот метод требует выделения на диске больше места для хранения
кода коррекции, чем для информации о четности. В Windows NT Server
данный метод не используется.

Чередование дисков с записью кода коррекции
в виде четности

RAID уровня 3 аналогичен уровню 2 за тем исключением, что код кор-
рекции заменен информацией о четности, записываемой на один диск.
Таким образом, дисковое пространство используется лучше. В Windows
NT Server этот уровень также не применяется.

Чередование дисков большими блоками.
Хранение четности на одном диске

RAID уровня 4 записывает целые блоки данных на каждый диск в мас-
сиве. Отдельный диск используется для хранения информации о чет-
ности. Всякий раз при записи блока информация о четности должна
быть считана, изменена, а затем записана вновь. Этот метод больше
годится для операций записи больших блоков, чем для обработки тран-
закций. В Windows NT Server он не применяется.

Чередование дисков с записью информации
о четности на все диски

RAID уровня 5 применяется в большинстве современных отказоустой-
чивых систем. От остальных уровней он отличается тем, что информа-
ция о четности записывается на все диски массива. При этом данные и
соответствующая им информация о четности всегда располагаются на
разных дисках. Если один из дисков выходит из строя, оставшейся
информации достаточно для полного восстановления данных.

Чередование дисков с четностью обеспечивает наивысшую производи-
тельность операций чтения. Но при выходе из строя диска скорость
чтения резко снижается, поскольку нужно выполнять восстановление
данных. Из-за циркуляции информации о четности операции записи
требуют в три раза больше памяти по сравнению с обычной записью.

Этот механизм поддерживает от 3 до 32 дисков. В набор чередования
могут входить все разделы, кроме загрузочного (системного).


Уровень 5: чередование диска с четностью

При использовании массива RAID5 в кластерах в качестве общего ре-
сурса (подробнее об это будет рассказано далее) наибольшая надеж-
ность и производительность достигается в том случае, когда каждый из
дисков подключен к своему контроллеру SCSI.


Подключение массива RAID в кластер

Базовые и динамические дисковые тома

В Windows NT 5.0 введены новые понятия: базового и динамического
тома.
На базовых дисках можно выполнять следующие операции:

Создавать и удалять первичные и расширенные разделы и логичес-
кие диски;

Отмечать раздел как активный;

Удалять наборы томов;

Разбивать зеркализацию в зеркальном наборе;

Восстанавливать зеркальные наборы;

Восстанавливать наборы дисков с чередованием с сохранением ин-
формации о четности;

Делать диски динамическими;

Превращать тома и разделы в динамические.

Некоторые операции можно выполнять только на динамических дис-
ках, а именно:

Создавать и удалять простые тома, зеркальные тома, тома с чередо-
ванием и RAID-5;

Расширять тома;

Удалять зеркало из зеркального тома;

Исправлять зеркальные тома;

Исправлять тома RAID-5.

Чтобы превратить диск в динамический, выберите его в слепке консо-
ли управления Disk Management и щелкните правой кнопкой мыши. В
контекстном меню выберите команду Initialize Disk. Далее следуйте
указаниям программы.

В первой бета-версии Windows NT 5.0 не поддерживается преобразо-
вание разделов диска в динамические. Эта возможность будет реализо-
вана во второй бета-версии.

Внимание! Динамические диски не доступны из MS-DOS или Windows.

Замена секторов в "горячем режиме"

В Windows NT Server можно восстанавливать сектора в процессе рабо-
ты. При форматировании тома файловая система проверяет все секто-
ра и, обнаружив дефектные, помечает их для исключения из дальней-
шей работы. Если плохой сектор обнаружен в процессе записи (чте-
ния), отказоустойчивый драйвер пытается перенести данные в другой
сектор, а первый - отметить как сбойный. Если перенос удается, фай-
ловая система не предупреждает о проблеме. Эта процедура возможна
только на дисках SCSI.




1. Определяет сбойный сектор

2. Перемещает данные в хороший сектор

3. Помечает сбойный сектор

Замена секторов

Исправление ошибок

Описанные возможности отказоустойчивых конфигураций обеспечи-
ваются при установке в системе драйвера FTDISK. В общем случае воз-
можности по обнаружению и исправлению дисковых ошибок опреде-
ляются рядом факторов. В таблице 5-3 перечислены возможные вари-
анты конфигурации и соответствующие им возможности "работы над
ошибками".

Таблица 5-3
Описание Отказоустойчивый том Обычный том
FTDISK установлен; FTDISK FTDISK
тип жесткого диска восстанавливает не восстанавливает
SCSI; резервные данные данные
сектора в наличии
FTDISK замещает FTDISK сообщает
плохие сектора файловой системе
о плохом секторе
Файловой системе не NTFS переназначает
известно об ошибке кластеры; во время
чтения данные теряются
FTDISK установлен; FTDISK FTDISK
тип жесткого диска восстанавливает не восстанавливает
не-SCSI; резервные данные данные
сектора отсутствуют
FTDISK посылает FTDISK сообщает
данные и сообщение файловой системе
о плохом секторе о плохом секторе
файловой системе
NTPS переназначает NTFS переназначает
кластеры кластеры; во время
чтения данные теряются
FTDISK не установлен; - Драйвер диска сообщает
тип диска любой файловой системе
о плохом секторе
NTFS переназначает
кластеры; во время
чтения данные теряются


Резервное копирование

Windows NT 5.0, так же, как и предыдущие версии, обладает встроен-
ной программой резервного копирования. Однако новая версия отли-
чается рядом функциональных возможностей, среди которых можно
назвать поддержку различных видов носителей резервной копии (а не
только магнитной ленты), встроенную возможность составления рас-
писания резервного копирования, программу-мастер резервирования
(восстановления), а также новый пользовательский интерфейс.

Программа Windows NT Backup

Windows NT Backup позволяет пользователям выполнять резервное
копирование и восстановление данных на локальный накопитель на
магнитной ленте (стример), на любой жесткий или гибкий диск, на
устройство хранения на магнитооптических дисках и, вообще, на лю-
бое устройство хранения информации, поддерживаемое операционной
системой. Перечислим основные возможности программы:

Резервное копирование и восстановление данных, расположенных
на разделах NTFS, FAT и FAT32 как на локальном, так и на удаленном
компьютере;

Выбор отдельных томов, каталогов или файлов, подлежащих копи-
рованию (восстановлению), а также просмотр подробной информа-
ции о файлах;

Выбор носителя, на который будет выполняться резервное копи-
рование: магнитная лента, диск, гибкий диск, магнитооптический
носитель и др.;

Выбор дополнительной проверки правильности записи (восста-
новления);

Обычные операции резервного копирования: нормальное (normal),
копирование (copy), приращение (incremental), разница (differen-
tial), ежедневное (daily);

Размещение на одном носителе нескольких записей и их объедине-
ние или замещение;

Создание командного файла для автоматизации резервного копиро-
вания;

Планирование операций резервного копирования по времени;

Просмотр полного каталога резервных копий и выбор файлов и
каталогов, подлежащих восстановлению;

Выбор диска назначения и каталога, в который будет выполняться
восстановление;

Использование программы-мастера резервного копирования (вос-
становления) ;

Сохранение информации об операциях резервирования (восстанов-
ления) в журнале и последующий ее просмотр в Event Viewer.

Интерфейс программы

Если в предыдущих версиях Windows NT для запуска программы резерв-
ного копирования требовалось найти соответствующий значок в груп-
пе средств администрирования, то теперь доступ к ней осуществляется
подобно тому, как в Windows 95- Щелкните правой кнопкой мыши зна-
чок, соответствующий жесткому диску, и выберите в контекстном меню
команду Properties, а затем в появившемся диалоговом окне Disk Pro-
perties
- вкладку Tools. Затем следует щелкнуть в разделе Backup
кнопку Backup now,
и на экране появится окно программы резервно-
го копирования.

Внимание! Для резервного копирования необходимо, чтобы в сис-
теме был запущен сервис Media support service. В первой бета-версии
Windows NT 5.0 он не запускается по умолчанию. Запустите его через
слепок консоли управления Service Management.


Интерфейс программы Windows NT Backup

В левой части окна Вы можете видеть дерево устройств Вашего компь-
ютера и сети, к которой он подсоединен. В правой части показан спи-
сок папок и файлов, находящихся в выбранной Вами папке. В нижней
части окна можно указать вид носителя, на который будет выполнять-
ся резервное копирование, тип резервного копирования, параметры.
Там же находится кнопка Schedule, с помощью которой можно про-
смотреть существующее расписание операций копирования.

Если Вы уверены, что знаете, какие параметры и как необходимо за-
дать, то можете смело приступать к работе. Если нет - воспользуйтесь
приглашением, которое появится над описанным окном программы, и
выберите нужную программу-мастер.


Приглашение начать резервное копирование

Параметры резервного копирования
(восстановления)

К доступным параметрам резервного копирования (восстановления)
относятся:

Тип резервного копирования;

Параметры регистрации в журнале;

Файлы, не подлежащие резервированию;

Параметры восстановления.

Для определения этих параметров либо щелкните кнопку Options в
нижней части окна программы, либо выберите одноименную команду
в меню Tools. На экране появится диалоговое окно Options.


Диалоговое окно Options, вкладка Backup Type

Вы можете выбрать: выполнять ли резервное копирование всех отме-
ченных файлов (All selected files) или только новых или измененных
(New and changed/lies only).

В первом случае копируются все выделенные файлы (даже те, которые,
например, уже были скопированы несколько дней назад и с тех пор не
изменились). Понятно, что время выполнения резервирования в дан-
ном случае зависит только от общего объема отмеченных файлов. У Вас
также имеется возможность поставить переключатель в положение,
предписывающее отмечать модификацию файла (Normal backup type.
Backup all files. Clear the modified/lag.)
или не делать этого (Copy
backup type. Backup all files. Don t clear the modified flag.).
Второй
тип позволяет значительно сократить время резервного копирования.

Помимо разностного резервирования и резервирования с приращени-
ем эффективно ежедневное резервное копирование. При этом копиру-

ются только файлы, создание или последняя модификация которых
датированы сегодняшним числом.

Запись в журнал информации о резервном копировании необходима
для контроля за этой процедурой, отслеживания сообщений об ошиб-
ках и выяснения их причины. Параметры регистрации в журнале зада-
ются в том же диалоговом окне Options, на вкладке Backup logging.


Диалоговое окно Options, вкладка Backup logging

По умолчанию предлагается записывать в журнал только наиболее об-
щую информацию (summary details): загрузка ленты, начало резервно-
го копирования, ошибка доступа к файлу и т. п. Вы можете либо ука-
зать на необходимость регистрации всех событий (включая имена
файлов и каталогов), либо отказаться от записи в журнал вообще. Вот
пример записи без подробностей;

Operation: Backup

Active Device; File

Media Name: "Media created on 15.11.97"

Backup set ft1 on media Ш

Backup Method: Normal

Backup started on 15.11,97 at 16:03.
Backup completed on 15.11.97 at 16:03.
Directories: 2
Files: 5
Bytes: 21,192
Time: 1 second.

Operation: Verify After Backup

Verify Type: Cyclic Redundancy Check

Active Device: File

Active Device: D:\WINNT5\SYSTEM32\Backup.bkf

Backup set HI on media ff1

Backup description: "Set created on 15.11.97 at 16:03"

Verify started on 15.11.97 at 16:03.

Verify completed on 15.11.97 at 16:03.

Time: 2 seconds.

Operation: Restore

Restore started on 15.11.97 at 16:05,

Warning: File New Bitmap Image.bmp was skipped

Warning: File New Rich Text Document, rtf was skipped

Warning: File New Text Document.txt was skipped

Warning: File New WordPad Document.doc was skipped

Warning: File tracking,log was skipped

Restore completed on 15.11.97 at 16:05.

Time: 3 seconds.

Время выполнения резервного копирования не имеет особого значе-
ния, если объем файлов не велик. Однако при ежедневном резервиро-
вании файлов и каталогов нескольких корпоративных серверов, общий
объем дискового пространства, которых может составлять сотни гига-
байт или даже терабайты, для копирования может не хватить целой
ночи. Один из способов сокращения времени - исключение из про-
цесса копирования файлов, которые не модифицируются вообще, либо
редко и из централизованного источника. Например, в системных ка-
талогах может быть много файлов шрифтов, курсоров, картинок и т. п.

Для исключения таких файлов из списка копируемых, выберите в диа-
логовом окне Options вкладку Exclude Files и укажите расширения
всех файлов, для которых не надо делать резервную копию.


Диалоговое окно Options, вклидка Exclude files

Восстановление файлов не является какой-то уж очень сложной зада-
чей, но требует внимательного отношения. Не исключено, что файлы,
хранящиеся на диске, содержат более свежую информацию, чем запи-
санные в архиве. Восстановив данные из архива на место существую-
щих, Вы безвозвратно потеряете то, что было сделано с момента пос-
леднего резервирования.

Именно поэтому не рекомендуется замещать файлы на диске хранимы-
ми в архиве по умолчанию. У Вас есть выбор: замещать только те фай-
лы, дата которых старше, чем дата файлов из архива; или замещать все
файлы без разбора.


Диалоговое окно Options, вкладка Restore options

Выполнение резервного копирования

После определения параметров резервного копирования можно при-
ступить непосредственно к самой процедуре.

Внимание! Если Вы выполняете резервирование в файл, то укажите
имя файла-приемника. Этот файл будет называться в дальнейшем но-
сителем (media),
несмотря на то, что в физическом смысле он не яв-
ляется носителем, а сам располагается на носителе, например, на жес-
тком диске. Термин "носитель" не должен Вас смущать, когда програм-
ма задает вопрос типа "Заместить все содержимое носителя?". Речь в
данном случае идет только о файле-приемнике.

Для начала резервного копирования щелкните кнопку Start в програм-
ме Windows NT Backup. Появится диалоговое окно Backup Informa-
tion,
предлагающее уточнить некоторые дополнительные параметры.


Диалоговое окно Backup Information

Задать параметры Вам помогут следующие элементы окна:

Флажок Restrict access to owner or administrator - если он от-
мечен, то доступ к носителю будет запрещен для владельцев файлов
или администраторов;

Флажок Backup local Registry - если он отмечен, то будет создана
резервная копия реестра на локальной машине;

Поле Set description - в него Вы можете ввести название резерви-
руемой информации; при восстановлении это название будет пере-
числено в списке доступных наборов;

. фляжок Append this backup to the media - отметив его, Вы укаже-
те программе на необходимость добавления новой информации к
уже хранимой в архиве;

Флажок Replace the data on the media with this backup - отме-
тив его, Вы укажете программе на необходимость замещения всей
предыдущей информации на носителе новой; в случае использова-
ния в качестве носителя магнитной ленты будет создано новое ог-
лавление и данные будут записаны с начала ленты, в случае исполь-
зования файла на диске - переписано содержимое файла;

В поле Use this media name следует ввести имя носителя;

Кнопка Advanced открывает возможность ввести дополнительные
параметры в диалоговом окне Advanced backup options,


Диалоговое окно Advanced Backup Options

С помощью диалогового окна Advanced Backup Options Вы можете
потребовать:

Выполнить резервное копирование службы каталогов;

Выполнить резервное копирование данных иерархичного хранилища;

Проверить данные после резервирования;

Использовать компрессию на аппаратном уровне (если это допуска-
ет Ваше оборудование);

Выбрать один из описанных ранее типов резервного копирования.

После определения всех перечисленных параметров начнется процесс
резервного копирования файлов на указанный носитель.

Планирование резервного копирования

В предыдущих версиях Windows NT для планирования времени резер-
вного копирования требовалось использовать системный планировщик
(команда AT). Новая версия имеет встроенный планировщик, который
позволяет задать начальные день и время резервирования, указать, яв-
ляется ли данная операция регулярной, если да, то с какой периодич-
ностью и в течение какого времени должна выполняться. Все эти пара-
метры задаются для каждого резервного копирования в диалоговом
окне Scheduled Job Options.


Диалоговое окно Scheduled Job Options

Например, если Вы хотите выполнять резервное копирование домаш-
них каталогов пользователей каждую ночь, то, создав соответствующее
задание на резервирование, определите для него:

. Start date - текущее число;

. Start time - 12:00 (надеясь, что в полночь" все пользователи уже
разошлись по домам, где отдыхают, а не работают с файлами в сво-
их домашних каталогах);

Отметьте флажок Run more then once,

. Frequency - ежедневно (daily), интервал - 1 день.

Также следует указать учетную запись, имеющую доступ к данному за-
данию на резервное копирование. Эта учетная запись должна обладать
соответствующей привилегией.


Расписание заданий резервного копирования

Программа указывает полночь "по-американски", то есть в 12.00 AM.

В результате должно получиться расписание, изображенное на преды-
дущем рисунке. На этом графике также присутствует еще одно задание,
выполняемое каждый понедельник.

Поддержка источников
бесперебойного питания

Источники бесперебойного питания (UPS) поддерживают работоспо-
собность системы при сбоях питания за счет энергии аккумуляторных
батарей. В Windows NT встроен сервис UPS, позволяющий выполнять
определенные действия в системе при поступлении сигналов от источ-
ника бесперебойного питания. Кроме встроенного сервиса, сторонние
производители UPS предлагают дополнительные продукты, обеспечи-
вающие большую функциональность.

Сервис UPS Windows NT определяет сбои напряжения питания, предуп-
реждает о них пользователя и корректно заглушает систему при исто-
щении источника резервного питания.

Настройка параметров этого сервиса производится в разделе UPS па-
нели управления.


Диалоговое окно настройки параметров UPS
К настраиваемым параметрам относятся:

Последовательный порт, к которому подключен источник беспере-
бойного питания;

Сигнал от UPS при сбое напряжения питания;

Предупреждение от UPS при снижении уровня зарядки батарей;

Сигнал от сервиса UPS для выключения источника бесперебойного
питания;

Командный файл, выполняемый перед выключением компьютера;

Ожидаемое время работы и перезарядки батарей;

Временные интервалы для предупреждающих сообщений.

Сервис UPS должен использоваться совместно с сервисами Alerter, Mes-
senger и Журналом регистрации. При этом все события, связанные с
сервисом UPS (например, сбой питания или сбой подключения источ-
ника бесперебойного питания) будут занесены в журнал регистрации,
а определенные пользователи будут уведомлены о них по сети. С по-
мощью параметра Server на панели управления можно назначить
пользователей и (или) компьютеры, которые будут получать эти уве-
домления.

Кластеры серверов

В общем случае кластером называется группа независимых систем,
работающих как единое целое. Клиент взаимодействует с кластером как
с одним сервером. Кластеры используются как для повышения доступ-
ности, так и для наращиваемости.

Доступность. Когда система, входящая в кластер выходит из строя,
программное обеспечение кластера распределяет работу, выполнявшу-
юся этой системой, между другими системами кластера.

В качестве примера рассмотрим работу современного супермаркета.
Сердце этого бизнеса - расчетные центры. Кассовые аппараты долж-
ны быть постоянно подключены к базе данных магазина, хранящей
информацию о продуктах, кодах, названиях и ценах. Если связь рвется,
теряется возможность обслуживать клиентов, ухудшается репутация
торговой организации, падает прибыль.

Кластерная технология повысит доступность системы. Можно предло-
жить использование двух систем, подключенных к многопортовому
дисковому массиву, на котором располагается база данных. В случае
сбоя сервера А резервная система (сервер Б) автоматически "подхва-
тит" соединение так, что пользователи и не заметят, что произошел
сбой. Таким образом, комбинация технологий обеспечения повышен-
ной надежности работы с диском, стандартно используемых в Windows
NT Server (чередование, дублирование и т. д) с кластерной технологи-
ей гарантирует доступность системы.


Наращиваемость. Когда общая загрузка достигает предела возмож-
ностей систем, составляющих кластер, последний можно нарастить, до-
бавив дополнительную систему. Ранее для этого пользователи вынуж-
дены были приобретать дорогостоящие компьютеры, позволяющие ус-
танавливать дополнительные процессоры, диски и память. Кластеры
позволяют увеличивать производительность, просто добавляя новые
системы по мере необходимости.

В качестве примера наращиваемости рассмотрим ситуацию, типичную
в финансовом бизнесе. Всю полноту ответственности за работу финан-
совой или банковской сети несет главный технический специалист. Он
отлично понимает, что малейший сбой системы повлечет за собой
колоссальные финансовые потери и град упреков в его адрес. Если же
система работает безукоризненно, то на нее постепенно будет перекла-
дываться все больше и больше задач, и, несомненно, однажды возмож-
ности системы будут исчерпаны. Потребуется разработка и создание
новой системы.

До недавнего времени подобные соображения приводили к тому, что
технические специалисты крупных банков, вынужденные заранее ^зак-
ладываться" на огромный рост вычислительных потребностей, созда-
вали системы на базе больших мэйнфреймов и мини-ЭВМ.

Кластерная технология на базе Windows NT Server предоставляет по-
трясающую возможность - отказаться от дорогостоящего оборудова-
ния и использовать широко распространенную систему на самых обыч-
ных аппаратных платформах. Мощность кластера наращивается про-
стым добавлением в него еще одной системы.


Наращиваемость кластеров

Традиционная архитектура предоставления
высокой доступности

Сегодня для повышения доступности компьютерных систем использу-
ется несколько подходов. Наиболее типичен метод дублирования сис-
тем с полностью тиражируемыми компонентами. Программное обес-
печение постоянно отслеживает состояние работающей системы, а
вторая система все это время простаивает. В случае сбоя первой систе-

мы происходит переключение на вторую. Такой подход, с одной сто-
роны, значительно повышает стоимость оборудования без повышения
производительности системы в целом, а, с другой - не гарантирует от
ошибок в приложениях.

Традиционная архитектура обеспечения
наращиваемости

Для обеспечения наращиваемости сегодня также применяется несколь-
ко подходов. Один из способов создания системы с наращиваемой
производительностью - использование симметричной мультипроцес-
сорной обработки (SMP). В SMP-системах несколько процессоров ис-
пользуют общую память и устройства ввода-вывода. В традиционной
модели, известной как модель совместного использования памяти,
выполняется одна копия операционной системы, а процессы приклад-
ных задач работают так, как будто в системе лишь один процессор. При
запуске в такой системе приложений, не использующих общие данные,
достигается высокая степень наращиваемости.

Тормозят использование систем с симметричной обработкой, в основ-
ном, физические ограничения скорости работы шины и доступа к па-
мяти. По мере увеличения скорости работы процессоров возрастает их
стоимость. Сегодня пользователь, пожелавший добавить в конфигура-
цию два-четыре процессора (не говоря уж о большем числе) должен
заплатить значительную сумму, совершенно непропорциональную вы-
годе, получаемой от увеличения числа процессоров.

Архитектура кластера

Кластеры могут иметь разные формы. Например, в качестве кластера
может выступать несколько компьютеров, связанных по сети Ethernet.
Пример кластера высокого уровня - высокопроизводительные много-
процессорные SMP-системы, связанные между собой высокоскорост-
ной шиной связи и ввода-вывода. В обоих случаях увеличение вычис-
лительной мощности достигается постепенно, добавлением очередной
системы. С точки зрения клиента, кластер представляется в виде одно-
го сервера или образа одной системы, хотя реально состоит из не-
скольких компьютеров.

Сегодня в кластерах используются, в основном, две модели: с общими
дисками и без общих компонентов.

Модель с общими дисками

В модели с общими дисками, программное обеспечение, исполняемое
на любой из систем, входящих в кластер, имеет доступ к ресурсам си-
стем кластера. Если двум системам нужны одни и те же данные, то пос-
ледние либо дважды считываются с диска, либо копируются с одной си-
стемы на другую. В SMP-системах приложение должно синхронизовать

и превратить в последовательный вид доступ к общим данным. Обыч-
но организующую роль при синхронизации играет диспетчер распре-
деленных блокировок DLM (Distributed Lock Manager).
Сервис DLM по-
зволяет приложениям отслеживать обращения к ресурсам кластера.
Если к одному ресурсу обращается более двух систем одновременно,
то диспетчер распознает и предотвращает потенциальный конфликт.
Процессы DLM могут приводить к дополнительному графику сообще-
ний в сети и снизить производительность. Один из способов избежать
этого эффекта - использование программной модели без общих ком-
понентов.

Модель без общих компонентов

В модели без общих компонентов каждая система, входящая в кластер,
владеет подмножеством ресурсов кластера. В конкретный момент вре-
мени только одна система имеет доступ к определенному ресурсу, хотя
при сбоях другая динамически определяемая система может вступить
во владение этим ресурсом. Запросы от клиентов автоматически пере-
направляются к системам, владеющим необходимым ресурсом.

Например, если в запросе клиента содержится обращение к ресурсам,
находящимся во владении нескольких систем, одна система выбирает-
ся для обслуживания запросов (ее называют хост-система). Затем эта
система анализирует запрос и передает подзапросы соответствующим
системам. Те выполняют полученную часть запроса и возвращают ре-
зультат хост-системе, которая формирует окончательный результат и
отсылает его клиенту.

Одиночный системный запрос к хост-системе описывает высокоуров-
невую функцию, порождающую системную активность, а внутриклас-
терный трафик не генерируется до тех пор, пока не будет сформиро-
ван конечный результат. Использование приложения, распределенно-
го между несколькими входящими в кластер системами, позволяет пре-
одолеть технические ограничения, присущие одному компьютеру.

Обе модели: и с общим диском, и без общих компонентов, - могут
использоваться в пределах одного кластера. Некоторые программы
лучше всего используют возможности кластера в рамках модели с об-
щим диском. К таким приложениям относятся задачи, требующие ин-
тенсивного доступа к данным, а также задачи, которые трудно разде-
лить на части. Приложения, для которых важна наращиваемость, раци-
ональней исполнять на модели без общих компонентов.

Серверы кластерных приложений

Итак, кластеры предоставляют доступность и наращиваемость для всех
серверных приложений. В свою очередь, специальные "кластерные"
приложения могут использовать все преимущества кластеров. Серверы
баз данных могут быть улучшены за счет добавления либо функций

координации доступа к общим данным в кластерах с общим диском,
либо функций разделения запросов на более простые запросы в клас-
терах без общих компонентов. В последних сервер баз данных сможет
использовать все преимущества разделения данных путем параллель-
ных запросов. Дополнительно серверные приложения могут быть рас-
ширены функциями автоматического определения неработающих ком-
понентов и инициации быстрого восстановления.

Исторически, для создания кластерных приложений использовались
мониторы обработки транзакций. Монитор транзакций отвечает за
перенаправление клиентских запросов к соответствующим серверам
внутри кластера, распределение запросов между серверами и коорди-
нацию транзакций между серверами кластера. Монитор транзакций
также может заниматься балансировкой нагрузки, автоматическим пе-
реподключением и повторением исполнения запроса в случае сбоя на
сервере, а также принимать участие в процессе восстановления после
сбоев.

Модели кластеров Windows NT

Текущая реализация кластеров для Windows NT поддерживает работу
двух связанных между собой особым образом серверов. Если на одном
из серверов происходит сбой или он отключается, то второй начинает
исполнять его функции. Кроме того, кластеризация обеспечивает ба-
лансировку нагрузки, распределение процессов между серверами. По
принципу настройки на использование тех или иных свойств, класте-
ры Windows NT можно разделить на пять моделей:

. модель 1 - высокая доступность и статическая балансировка на-
грузки;

. модель 2 - "горячий резерв" и максимальная доступность;

. модель 3 - частичная кластеризация;

. модель 4 - только виртуальный сервер (без переключения);

. модель 5 - гибридная.

Давайте вкратце рассмотрим эти модели.

Модель 1: высокая доступность и статическая
балансировка нагрузки

В этой модели обеспечивается высокая доступность; а также произво-
дительность: приемлемая - при одном неработающем узле, и высо-
кая - при обоих работающих; а также максимальное использование
аппаратных ресурсов.

Каждый их двух узлов предоставляет в сеть свой собственный набор
ресурсов в виде виртуальных серверов, к которым имеют доступ кли-
енты. Производительность каждого из узлов подобрана таким образом,
что обеспечивает оптимальную производительность для ресурсов, но

только до тех пор, пока оба узла работоспособны. При сбое одного
сервера исполнение всех кластерных ресурсов переключается на дру-
гой, производительность резко понижается, однако все ресурсы по-
прежнему доступны для клиентов.


Конфигурация модели 1

Например, эта модель может применяться при совместном использо-
вании файлов и принтеров. На каждом из узлов создаются независи-
мые группы с файловыми и принтерными ресурсами. При сбое одного
из узлов все управление его ресурсами берет на себя оставшийся. Пос-
ле восстановления узел возвращает себе свою часть работы, В резуль-
тате клиенты имеют постоянный доступ как ко всем файловым ресур-
сам кластера, так и ко всем очередям печати.

Рассмотрим другой пример использования этой модели. Допустим, на
предприятии имеется почтовый сервер, на котором установлен Mic-
rosoft Exchange. В пиковые моменты нагрузки сервер не справляется и
отключается. Поскольку почта должна функционировать непрерывно,
можно предложить следующее решение. Сервер, на котором исполня-
ется Microsoft Exchange, объединяется в кластер с сервером, на кото-
ром в нормальном режиме работает приложение доступа к данным. В
момент сбоя почтового сервера его роль временно принимает на себя
второй сервер кластера. Но, подчеркиваю, это лишь временно, и сразу
после перезагрузки основного почтового сервера вся работа по обра-

ботке почты вновь передается ему. Аналогично может выполняться пе-
реключение программы работы с базами данных.

Модель 2: "горячий резерв"
и максимальная доступность

При такой модели обеспечивается максимальная доступность и произ-
водительность, но за счет вложений в оборудование, которое большую
часть времени простаивает. Один из узлов кластера, называемый пер-
вичным,
обслуживает всех клиентов, в то время как второй использует-
ся в качестве "горячего резерва".

Когда происходит сбой первичного узла, второй незамедлительно за-
пускает сервисы, исполнявшиеся на первом, и обеспечивает при этом
производительность, максимально близкую к производительности пер-
вичного узла.


Модель с "горячим резервированием"

Эта модель наилучшим образом подходит для наиболее важных для
организации приложений. Например, это может быть сервер Web, об-
служивающий тысячи клиентов и предоставляющий доступ к важней-
шей информации. В таком случае стоимость узла, дежурящего в режи-
ме "горячего резерва", все равно значительно ниже потерь, возможных
в случае прекращения доступа к данным.

Модель 3: частичная кластеризация

Данная модель позволяет использовать на серверах, составляющих кла-
стер, приложения, для которых не будет выполняться переключение в
случае сбоя. Ресурсы таких приложений располагаются не на общем, а

на локальном диске сервера. В случае сбоя сервера эти приложения
становятся недоступными.


Модель частичной кластеризации

Эта модель подходит, если приложения, работающие на одном из сер-
веров, входящем в кластер, используются не часто и их постоянная
доступность не столь необходима. Например, это может быть какое-
либо бухгалтерское приложение или расчетная задача.

Иногда случается, что модель переключения, обеспечиваемая Microsoft
Cluster Server, не годится для некоторых приложений. (Например, при
исполнении расчетной задачи переключение с узла на узел все равно
прервет процесс вычислений). Для таких приложений необходимы
иные, специфичные механизмы обеспечения бесперебойной работы.

Модель 4: только виртуальный сервер
(без переключения)

Строго говоря, эту модель трудно назвать кластером. В ней использу-
ется только один сервер, переключение которого в случае сбоя не вы-
полняется.

С другой стороны, все ресурсы организованы так, что для пользовате-
ля они предстают в виде ресурсов разных виртуальных серверов. По-
этому вместо поиска нужных ресурсов на различных серверах в сети
пользователь осуществляет доступ только к одному.

В случае сбоя сервера программное обеспечение кластера запускает
необходимые сервисы в указанном порядке сразу после перезагрузки.

В будущем такой узел может быть соединен с другим для организации
полноценного кластера.


Модель с одним виртуальным сервером

Модель 5: гибридное решение

Последняя модель - гибрид предыдущих. В самом деле, при достаточ-
ном запасе мощности можно использовать преимущества всех моделей
в одной и обеспечить самые разные сценарии переключения в случае
сбоя.

На рисунке показан возможный пример гибридного решения, в кото-
ром на обоих узлах кластера имеются переключаемые ресурсы, непе-
реключаемые приложения и сервисы, а также виртуальные серверы.


Гибридное решение

Установка Microsoft Cluster Server

Установить программное обеспечение поддержки кластеризации очень
просто. Выполнение программы установки на двух компьютерах зай-
мет у Вас не более 10 минут. Однако, как и в любом деле, лучше семь
раз отмерить, и один раз - отрезать. В данном случае это означает, что
перед установкой ПО необходимо тщательно соблюсти некоторые
начальные условия и сконфигурировать серверы соответствующим
образом.

Прежде чем начать

Для установки MSCS (Microsoft Cluster Server) необходимо иметь следу-
ющее оборудование.

1. Два компьютера произвольной конфигурации. Характеристики
компьютеров могут различаться. Например, один имеет процессор

Pentium Pro с тактовой частотой 200 Мгц, объем ОЗУ - 256Мб, встро-
енный жесткий диск объемом 2 Гб. Второй - процессор Pentium II с
тактовой частотой 233 Мгц, объем ОЗУ б4Мб и встроенный жесткий
диск объемом 1 Гб. Разброс характеристик определяется используе-
мой Вами моделью: от практически идентичных (для режима "горя-
чего резервирования") до совершенно различных (для режима час-
тичной кластеризации).

2. В каждом компьютере должно быть не менее одного SCSI-адап-
тера,
к которому будут подключаться общие диски. К этим адапте-
рам применяется одно жесткое требование: они должны обеспечи-
вать такой режим работы, который позволяет не инициализировать
шину при перезагрузке. В ряде случаев с этой целью может понадо-
биться отключить BIOS адаптера.

Другим требованием является то, что SCSI ID одного из компьюте-
ров должен быть обязательно равен шести, а другого - семи.

Отдельного рассмотрения заслуживает вопрос терминирования
шины. Оно должно выполняться таким образом, чтобы никак не
зависеть от работоспособности любого из компьютеров. По этой
причине внутренние терминаторы SCSI-адаптера не подходят. Тер-
минаторы должны находиться снаружи. Можно предложить два ва-
рианта с расположением общих дисков:

между серверами;

на одном конце.

В первом случае на обоих концах шины подключение к серверам
должно осуществляться с помощью так называемых Y-кабелей.


Связь с промежуточным расположением устройств хранения

Во втором случае два сервера связаны между собой так, что сервер,
более удаленный от общих дисков, подключается с помощью Y-ка-
беля, а дисковый накопитель - с помощью обычного кабеля, но
имеет либо внутреннюю терминацию, либо специальный разъем для
подключения внешнего терминатора.


Связь серверов с расположением общих дисков на одном конце

3. Не меыее 2 сетевых плат в каждом компьютере. Узлы в кластере
должны быть связаны между собой надежным каналом, называемым
интерконнектом (interconnect). По этому каналу они обменивают-
ся друг с другом информацией о своем состоянии. Предположим, в
качестве такого канала используется та же самая сетевая плата, что
и для доступа к ресурсам кластера. В этом случае велика вероятность,
что в моменты загрузки сети будет происходить ложное срабатыва-
ние процедуры переключения. При обоих работоспособных серве-
рах информация об их состоянии просто не будет доходить от од-
ного к другому. В результате оба сервера инициируют процесс пе-
реключения, что, вполне вероятно, приведет к сбою системы.


Именно поэтому рекомендуется использовать для интерконнекта
отдельный сетевой канал. Для более высокой надежности желатель-
но организовать несколько таких каналов. В любом случае, считай-
те, что для Вас дороже: стоимость потерянной на время информа-
ции или стоимость нескольких сетевых плат.

Взаимодействие между кластерами осуществляется по протоколу
TCP/IP. Поэтому Вам понадобится назначить адреса для сетевых карт
интерконнекта. Для этой цели можно использовать специальные
зарезервированные адреса:

10.0.0.1 - 10.255.255.254;

172.16.0.1 - 172.31.255.254;

192.168.0.1 - 192.168.255-254.

4. Общим дискам в серверах должны быть присвоены одинаковые
буквы.
Например, если в одном из серверов локальные диски име-
ют буквы С, D и Е, а в другом - С, D, Е, F и G, то первый общий диск
в обеих системах должен быть диском Н.

Внимание! Все общие диски должны иметь формат NTFS.

Присвоение букв дискам выполняется по очереди. Сначала загружа-
ется один сервер, а второй остается выключенным. С помощью слеп-
ка Disk Management назначается нужная буква. После этого первый
сервер выключается, загружается второй и назначается та же самая
буква для выбранного раздела диска.

После того, как выполнены все перечисленные условия, можно устанав-
ливать ПО MSCS.

Процедура установки

Процедура проста: сначала выполняют установку на одном узле, а по
ее завершении - на втором. Для установки необходимо зарегистриро-
ваться в домене с административными правами.

Устанавливать ПО надо на локальный, а не на общий диск. В процессе
установки ПО на первый сервер надо указать имя, под которым клас-
тер будет доступен для клиентов, имена дисков, предназначаемых для
использования в качестве общих ресурсов, сетевые карты и их назна-
чение (для связи с клиентами, для интерконнекта или для того и друго-
го), адреса IP и маску.

Процедура установки на второй сервер аналогична, за тем исключени-
ем, что вместо формирования нового кластера надо подключиться к
уже существующему.

Администрирование кластера

Для администрирования кластера используется программа Cluster Admi-
nistrator. Она может быть установлена как на любом из узлов, входящих
в кластер, так и на произвольной рабочей станции.

Интерфейс программы весьма напоминает интерфейс консоли управ-
ления с загруженным слепком, однако теперь администратор класте-
ров не является слепком ММС.


Окно Cluster Administrator

Окно состоит из двух частей. В левой части в виде древовидной струк-
туры представлены элементы кластера: группы, доступные ресурсы,
сетевые интерфейсы, узлы и т. д. В правой - содержимое той или иной
ветви древовидной структуры кластера.

На панели инструментов есть кнопка, позволяющая подключиться к
любому кластеру для управления им. С помощью администратора кла-
стера можно выполнять следующие операции:

Создавать новый ресурс;

Создавать и модифицировать группу ресурсов кластера;

Управлять сетевыми интерфейсами;

Управлять ресурсами каждого из узлов в отдельности;

Имитировать сбой в работе ресурса;

Останавливать работу отдельных групп;

Перемещать ресурсы между группами.

Большинство функций выполняется с помощью программ-мастеров.
Поскольку данная книга не ставит перед собой задачу подменить доку-
ментацию, мы лишь кратко рассмотрим некоторые операции.

Создание новой группы ресурсов

Создавая новую группу ресурсов, необходимо помимо ее имени, ука-
зать предпочтительного владельца. Выбор зависит от типа используе-
мой модели кластера. Добиваясь высокой доступности, можно указать
в качестве владельцев оба узла. При обеспечении "горячего резерва"
предпочтительным владельцем должен стать основной узел.


Назначение предпочтительного владельца группы ресурсов

Создание нового ресурса

В Microsoft Cluster Server можно создавать ресурсы одного из следую-
щих типов:

Координатор распределенных транзакций;

Совместно используемый файловый ресурс;

Приложение общего вида;

Сервис общего вида;

Виртуальный корень Internet Information Server;

Адрес IP;

Сервер очередей (Microsoft Message Queue Server);

Сетевое имя;

Физический диск;

Спулер печати;

Сервис таймера.


Добавление нового ресурса

Например, если Вы хотите добавить новый виртуальный корень для
своего сервера Web, то необходимо создать ресурс типа US Virtual Root.

Определение взаимозависимости ресурсов

Очевидно, что ресурсы кластера не могут запускаться в произвольном
порядке. Те сервисы, от которых зависит работа остальных, должны
стартовать раньше.


Определение зависимости загрузки ресурсов

Так, прежде чем сделать виртуальный корень сервера Web доступным
для пользователей, необходимо выполнить, по крайней мере, две опе-
рации: определить диск, на котором физически располагается каталог,
являющийся виртуальным корнем, и назначить адрес IP. Соответствен-
но эти два ресурса необходимо назначить определяющими для вирту-
ального сервера.

Определение свойств ресурса

Наконец, после того, как задана последовательность загрузки ресурсов,
можно определить свойства вновь создаваемого ресурса. Окно свойств
существенно различается в зависимости от типа ресурса. Например, на
рисунке показано определение параметров виртуального корня серве-
ра Web. Для него указывается полный путь на диске, имя, под которым
он будет доступен для клиентов, а также тип доступа.


Определение специфичных параметров ресурса

Редактирование свойств ресурсов

Свойства любого ресурса можно отредактировать. Для этого необходи-
мо щелкнуть имя ресурса правой кнопкой мыши и в контекстном меню
выбрать команду Properties. Появится диалоговое окно, подобное
изображенному на рисунке.


Модификация свойств f)ecvl)ca

В этом диалоговом окне можно изменить следующие параметры:

Имя и описание ресурса;

Возможных владельцев ресурса (на уровне серверов);

Последовательность загрузки сервисов, влияющих на работу редак-
тируемого ресурса;

Параметры перезапуска ресурса в случае сбоя;

Интервалы опроса;

Командную строку и параметры запуска.

Проверка работоспособности

Для проверки работоспособности созданной группы ресурсов в адми-
нистраторе кластера предусмотрена возможность имитации сбоя. На-
пример, для проверки работоспособности виртуального корня серве-
ра Web его исполнение переносится на другой узел командой меню.

В течение последующих минут администратор увидит в окне Cluster
Administrator,
как система распознает остановку сервиса, иницииру-
ет его запуск на другом узле и, после запуска всех определяющих сер-
висов, запускает выбранный ресурс. Клиенты заметят лишь небольшую
(одну-две минуты) задержку.

Хотя параметры перезапуска можно редактировать, не рекомендуется
уменьшать время проверки работоспособности, так как небольшие
паузы в работе могут быть расценены как сбой кластера.

Заключение

Windows NT 5.0 унаследовала от предыдущих версий все возможности
обеспечения бесперебойной работы. Средства поддержки отказоустой-
чивых дисковых томов, поддержка источников бесперебойного пита-
ния, улучшенная версия программы резервного копирования удачно
дополняются кластерными технологиями.

Несомненно, что перечисленные возможности в совокупности с под-
держкой аппаратных средств отказоустойчивости позволяют говорить
о Windows NT Server 5.0 как о серверной операционной системе, впол-
не способной удовлетворить потребности предприятий, где требуется
высокий уровень надежности.

Нажав на кнопку "Скачать архив", вы скачаете нужный вам файл совершенно бесплатно.
Перед скачиванием данного файла вспомните о тех хороших рефератах, контрольных, курсовых, дипломных работах, статьях и других документах, которые лежат невостребованными в вашем компьютере. Это ваш труд, он должен участвовать в развитии общества и приносить пользу людям. Найдите эти работы и отправьте в базу знаний.
Мы и все студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будем вам очень благодарны.

Чтобы скачать архив с документом, в поле, расположенное ниже, впишите пятизначное число и нажмите кнопку "Скачать архив"

### ## ### # ###
# # ## # # ## # #
# # # # # # # #
# # # # # # # #
# # ##### # # # #
# # # # # # #
### ### ##### # ###

Введите число, изображенное выше:

Подобные документы

    Социально-экономическое оздоровление финансово-хозяйственной деятельности. Стратегический анализ положения предприятия. Анализ внутренней и внешней среды предприятия. Горизонтальный анализ актива и пассива баланса. Анализ отчета о прибылях и убытках.

    курсовая работа , добавлен 22.12.2011

    Экономический анализ хозяйственной деятельности. Анализ аналитического баланса, финансовой устойчивости организации, актива и пассива баланса, качества собственного капитала, основных средств, дебиторской и кредиторской задолженности, доходов и расходов.

    курсовая работа , добавлен 23.01.2013

    Краткая экономическая характеристика и оценка результатов деятельности ООО "Куброс". Состав и структура источников формирования имущества организации. Расчеты с поставщиками и покупателями, организация кассовых операций. Финансовое планирование фирмы.

    отчет по практике , добавлен 24.12.2014

    Анализ системы управления и оплаты труда. Органы управления предприятием и структура управления персоналом. Организация экономической работы. Основные показатели финансово-хозяйственной деятельности. Анализ доходов и прибыли.

    курсовая работа , добавлен 14.09.2006

    Оценка структуры и динамики имущества предприятия и источников его формирования. Взаимосвязь показателей актива и пассива баланса. Анализ ликвидности и платежеспособности, показателей финансовой устойчивости и вероятности банкротства предприятия.

    курсовая работа , добавлен 02.11.2011

    Роль анализа финансово-хозяйственной деятельности в управлении предприятием. Состав и структура баланса ООО "Элегия", показатели оценки его платежеспособности и ликвидности. Разработка мероприятий по стабилизации финансового состояния предприятия.

    курсовая работа , добавлен 20.12.2015

    Описание деятельности грузового порта. Расчет производительности труда, динамики и структуры актива и пассива баланса, фонда оплаты труда. Оценка показателей платежеспособности предприятия, эффективности использования капитала, кредитоспособности.

    курсовая работа , добавлен 09.06.2015

    Сущность и методики анализа финансового состояния организации. Характеристика и анализ бухгалтерского баланса ООО "Изумруд", структура его актива и пассива. Оценка отчета о прибылях и убытках и показателей хозяйственно-экономической деятельности.

    курсовая работа , добавлен 27.06.2012