Бесперебойная работа системы по резервному копированию. Практическая работа анализ финансово-хозяйственной деятельности

Если Вы слепо доверяете надежности своего "винчестера", то, поверь-
те, наступит день, когда Вы об этом пожалеете. У любой механической
системы (а жесткий диск таковой и является) есть свой запас прочно-
сти. Что произойдет после выработки ресурса, точно никто не пред-
скажет, однако на лучшее можете не рассчитывать: самая важная для Вас
информация наверняка пропадет безвозвратно. В Windows NT Server
встроены механизмы, обеспечивающие отказоустойчивость системы:

для особо надежной работы с диском, резервного копирования, под-
держки работы с источниками бесперебойного питания, выбора рабо-
тоспособной конфигурации и восстановления системы со специально-
го диска. Но как быть, если из строя вышел сам компьютер? Чтобы это
не отразилось на Вашей работе, рекомендуются кластерные решения.

Как видите, в системе достаточно много средств обеспечения беспере-
бойной работы. Возможно, кто-то даже спросит: зачем так много раз-
ных, на первый взгляд, дублирующих друг друга, механизмов - ведь это
повышает стоимость системы? Почему раз кластеры обеспечивают
столь высокую степень надежности, не использовать их повсеместно?

В таблице 5-1 показаны различные виды сбоев, которые могут проис-
ходить в сети предприятия, а также методы их предотвращения или
минимизации неприятных последствий.

Таблица 5-1
Источник сбоя Кластерное решение Другие решения
Сетевой концентратор Применимо, если каждый -
из узлов подключен
к своему концентратору
Напряжение питания - Источник беспере-
бойного питания
Подключение к серверу Применимо -
Жесткий диск - RAID, отказо-
устойчивые диски
Аппаратура сервера Применимо -
(процессор, память
и др.)
Серверное ПО Применимо -
Маршрутизаторы, - Дублирующие
выделенные линии и др. маршруты и линии
Коммутируемые - Пулы модемов
соединения
Клиентские - Несколько клиентов
компьютеры с одинаковыми
уровнями доступа


Таблица хорошо показывает, что хотя кластеры и обеспечивают высо-
кую степень надежности сервера, но не являются панацеей. К тому же
они поддерживаются только версией для предприятий (Windows NT
Server Enterprise Edition). Требуются дополнительные механизмы. Рас-
смотрим средства обеспечения бесперебойной работы, встроенные в
Windows NT Server 5.0.

Средства повышения надежности работы
с диском

Если Вы регулярно пользовались такими программами как CHKDSK или
Norton disk Doctor, то наверняка обращали внимание на иногда обна-
руживаемые на жестких дисках "плохие области" (bad blocks), которые
эти программы помечают как недоступные. Причин появления таких
областей несколько, начиная от некачественного диска и кончая неко-
торыми видами вирусов. Но какова бы ни была причина, результат все-
гда один - сокращение доступного рабочего пространства на диске.
Если же Вы своевременно не продиагностировали диск, то последствия
могут быть еще печальнее: Вы потеряете данные, записанные на по-
врежденный участок, а, в самом худшем случае, операционная система
утратит работоспособность. Поэтому, если в Вашем компьютере толь-
ко один жесткий диск или Вы не используете технологии, описанные
далее в этой главе, первейшей заботой должна стать регулярная про-
верка состояния диска.

Замечание. Современные компьютерные системы, выпускаемые из-
вестными производителями, зачастую обладают встроенными средства-
ми контроля за состоянием дисков и оповещения операционной сис-
темы и администратора о надвигающейся угрозе. Примером могут слу-
жить компьютеры Compaq Proliant, где о предстоящем крахе диска из-
вещается не только операционная система, но и оператор, на пейджер
которого посылается предупреждающий сигнал.

Проверка состояния жесткого диска

Для проверки жесткого диска используется встроенная утилита CHKDSK,
запускаемая из командной строки. Для поиска плохих секторов необ-
ходимо запускать ее с ключом /R. При этом, правда, следует помнить,
что операция может длиться несколько часов. Но если Вы производите
ее регулярно, то о наличии сбойных секторов можете косвенно судить
по резко возросшему времени проверки.

CHKDSK [[ path ]filenanie] ],

Указывает диск, который надо проверить;

Filename - указывает файлы для проверки фрагментации (только на
FAT);

. /F - исправляет ошибки на диске;

. /V - для FAT показывает полное имя и путь к файлам на диске; для
NTFS - также сообщения об очистке;

. /R - определяет плохие сектора и восстанавливает читаемую ин-
формацию;

. /L: size - только для NTFS: устанавливает размер файла журнала в
килобайтах, если размер не указан, подразумевается активный.

Внимание! Если во время работы системы выполнение программы
CHKDSK невозможно (например, на выбранном диске находится файл
подкачки), Вам будет предложено перенести ее исполнение на момент
загрузки системы. Если Вы согласитесь, то при следующей перезагруз-
ке будет выполнена полная проверка диска.

Помимо команды CHKDSK в Windows NT 5.0 для проверки диска име-
ется графическая утилита. Чтобы ее вызвать, необходимо щелкнуть
правой кнопкой мыши имя диска в папке My Computer и в появившем-
ся меню выбрать команду Properties. В диалоговом окне надо выбрать
вкладку Tools и щелкнуть кнопку Check Now. Для полной проверки
диска следует отметить оба флажка: Automatically fix filesystem
errors
и Scan and attempt recovery of bad sectors.


Диалоговое окно проверки состояния жестких дисков

Чтобы обезопасить себя от разного рода неприятностей, связанных с
отказами дисковой системы на сервере, лучше использовать средства,
повышающие надежность их работы. К средствам Windows NT, обеспе-
чивающих повышенную надежность при работе с диском, относятся:

зеркализация дисков, дублирование дисков, чередование дисков с кон-
тролем четности и замена секторов (в "горячем" режиме).

Технология RAID (избыточный массив
недорогих дисков)

Средства повышения надежности работы с дисками имеют промыш-
ленный стандарт и подразделяются на несколько уровней использова-
ния избыточных массивов недорогих дисков (RAID) (см. таблицу 5-2).
Каждый из уровней обладает различным сочетанием производительно-
сти, надежности и стоимости. В Windows NT Server 5.0 обеспечивается
поддержка RAID уровней 0,1 и 5.


Чередование дисков

Этот уровень (RAIDO) обеспечивает чередование между различными
разделами диска. При этом файл как бы "размазан" по нескольким
физическим дискам. Данный метод может увеличить производитель-
ность работы с диском, особенно, когда диски подключены к разным

контроллерам дисков. Так как этот подход нс обеспечивает избы точ-
ности, его нельзя назвать в полной мере RAID. При выходе из строя
любого раздела в массиве все данные будут потеряны. Для реализации
метода требуется от 2 до 32 дисков. Увеличение производительности
достигается только при использовании разных контроллеров диска.


Уровень О: чередование дисков

Зеркализация и дублирование дисков

Зеркальная копия диска или раздел создаются средствами RAID уровня 1:

зеркализацией или дублированием. Зеркальное отражение дисков дей-
ствует на уровне разделов. Любой раздел, включая загрузочный или
системный, может быть зеркально отражен. Это простейший метод
повышения надежности работы с диском. Чаше всего, зеркализация -
самый дорогой метод обеспечения надежности, так как при нем задей-
ствовано всего лишь 50 процентов объема жесткого диска. Однако в
большинстве одноранговых или небольших серверных сетей такой
способ дешев за счет использования всего двух дисков.

Дублирование дисков - зеркализация с применением дополнительно-
го адаптера на вторичном дисководе - обеспечивает отказоустойчи-
вость и при сбое контроллера, и при сбое диска. Кроме того, дублиро-
вание может повысить производительность.

Подобно зеркализации, дублирование выполняется на уровне раздела.
Для Windows NT не существует различия между зеркализацией и дуб-
лированием - вопрос лишь в местонахождении другого раздела.

Здесь уместно остановиться и прояснить ситуацию, с которой доволь-
но часто встречаются администраторы при зеркализации системного
загрузочного диска. Случается, что при выходе из строя одного из дис-
ков принимается решение эксплуатировать систему с другим, остав-
шимся. При этом предполагается, что поскольку второй диск является
зеркальной копией первого, то никаких дополнительных мер предпри-
нимать не надо - достаточно просто загрузить компьютер. Тут-то и
находится камень преткновения: если данный раздел диска не являет-


Для активизации раздела надо воспользоваться либо утилитой FDISK,
входящей в поставку любой версии MS-DOS (для разделов FAT), либо
слепком Disk Administrator.

Чередование дисков с записью кода коррекции

RAID уровня 2 работает так: блок данных при записи на диск разбива-
ется на несколько частей, каждая из которых записывается на отдель-
ный диск. Одновременно создается код коррекции, который также запи-
сывается на разные диски. Потерянные данные можно восстановить по
коду коррекции с помощью специального математического алгоритма.

Этот метод требует выделения на диске больше места для хранения
кода коррекции, чем для информации о четности. В Windows NT Server
данный метод не используется.

Чередование дисков с записью кода коррекции
в виде четности

RAID уровня 3 аналогичен уровню 2 за тем исключением, что код кор-
рекции заменен информацией о четности, записываемой на один диск.
Таким образом, дисковое пространство используется лучше. В Windows
NT Server этот уровень также не применяется.

Чередование дисков большими блоками.
Хранение четности на одном диске

RAID уровня 4 записывает целые блоки данных на каждый диск в мас-
сиве. Отдельный диск используется для хранения информации о чет-
ности. Всякий раз при записи блока информация о четности должна
быть считана, изменена, а затем записана вновь. Этот метод больше
годится для операций записи больших блоков, чем для обработки тран-
закций. В Windows NT Server он не применяется.

Чередование дисков с записью информации
о четности на все диски

RAID уровня 5 применяется в большинстве современных отказоустой-
чивых систем. От остальных уровней он отличается тем, что информа-
ция о четности записывается на все диски массива. При этом данные и
соответствующая им информация о четности всегда располагаются на
разных дисках. Если один из дисков выходит из строя, оставшейся
информации достаточно для полного восстановления данных.

Чередование дисков с четностью обеспечивает наивысшую производи-
тельность операций чтения. Но при выходе из строя диска скорость
чтения резко снижается, поскольку нужно выполнять восстановление
данных. Из-за циркуляции информации о четности операции записи
требуют в три раза больше памяти по сравнению с обычной записью.

Этот механизм поддерживает от 3 до 32 дисков. В набор чередования
могут входить все разделы, кроме загрузочного (системного).


Уровень 5: чередование диска с четностью

При использовании массива RAID5 в кластерах в качестве общего ре-
сурса (подробнее об это будет рассказано далее) наибольшая надеж-
ность и производительность достигается в том случае, когда каждый из
дисков подключен к своему контроллеру SCSI.


Подключение массива RAID в кластер

Базовые и динамические дисковые тома

В Windows NT 5.0 введены новые понятия: базового и динамического
тома.
На базовых дисках можно выполнять следующие операции:

Создавать и удалять первичные и расширенные разделы и логичес-
кие диски;

Отмечать раздел как активный;

Удалять наборы томов;

Разбивать зеркализацию в зеркальном наборе;

Восстанавливать зеркальные наборы;

Восстанавливать наборы дисков с чередованием с сохранением ин-
формации о четности;

Делать диски динамическими;

Превращать тома и разделы в динамические.

Некоторые операции можно выполнять только на динамических дис-
ках, а именно:

Создавать и удалять простые тома, зеркальные тома, тома с чередо-
ванием и RAID-5;

Расширять тома;

Удалять зеркало из зеркального тома;

Исправлять зеркальные тома;

Исправлять тома RAID-5.

Чтобы превратить диск в динамический, выберите его в слепке консо-
ли управления Disk Management и щелкните правой кнопкой мыши. В
контекстном меню выберите команду Initialize Disk. Далее следуйте
указаниям программы.

В первой бета-версии Windows NT 5.0 не поддерживается преобразо-
вание разделов диска в динамические. Эта возможность будет реализо-
вана во второй бета-версии.

Внимание! Динамические диски не доступны из MS-DOS или Windows.

Замена секторов в "горячем режиме"

В Windows NT Server можно восстанавливать сектора в процессе рабо-
ты. При форматировании тома файловая система проверяет все секто-
ра и, обнаружив дефектные, помечает их для исключения из дальней-
шей работы. Если плохой сектор обнаружен в процессе записи (чте-
ния), отказоустойчивый драйвер пытается перенести данные в другой
сектор, а первый - отметить как сбойный. Если перенос удается, фай-
ловая система не предупреждает о проблеме. Эта процедура возможна
только на дисках SCSI.




1. Определяет сбойный сектор

2. Перемещает данные в хороший сектор

3. Помечает сбойный сектор

Замена секторов

Исправление ошибок

Описанные возможности отказоустойчивых конфигураций обеспечи-
ваются при установке в системе драйвера FTDISK. В общем случае воз-
можности по обнаружению и исправлению дисковых ошибок опреде-
ляются рядом факторов. В таблице 5-3 перечислены возможные вари-
анты конфигурации и соответствующие им возможности "работы над
ошибками".

Таблица 5-3
Описание Отказоустойчивый том Обычный том
FTDISK установлен; FTDISK FTDISK
тип жесткого диска восстанавливает не восстанавливает
SCSI; резервные данные данные
сектора в наличии
FTDISK замещает FTDISK сообщает
плохие сектора файловой системе
о плохом секторе
Файловой системе не NTFS переназначает
известно об ошибке кластеры; во время
чтения данные теряются
FTDISK установлен; FTDISK FTDISK
тип жесткого диска восстанавливает не восстанавливает
не-SCSI; резервные данные данные
сектора отсутствуют
FTDISK посылает FTDISK сообщает
данные и сообщение файловой системе
о плохом секторе о плохом секторе
файловой системе
NTPS переназначает NTFS переназначает
кластеры кластеры; во время
чтения данные теряются
FTDISK не установлен; - Драйвер диска сообщает
тип диска любой файловой системе
о плохом секторе
NTFS переназначает
кластеры; во время
чтения данные теряются


Резервное копирование

Windows NT 5.0, так же, как и предыдущие версии, обладает встроен-
ной программой резервного копирования. Однако новая версия отли-
чается рядом функциональных возможностей, среди которых можно
назвать поддержку различных видов носителей резервной копии (а не
только магнитной ленты), встроенную возможность составления рас-
писания резервного копирования, программу-мастер резервирования
(восстановления), а также новый пользовательский интерфейс.

Программа Windows NT Backup

Windows NT Backup позволяет пользователям выполнять резервное
копирование и восстановление данных на локальный накопитель на
магнитной ленте (стример), на любой жесткий или гибкий диск, на
устройство хранения на магнитооптических дисках и, вообще, на лю-
бое устройство хранения информации, поддерживаемое операционной
системой. Перечислим основные возможности программы:

Резервное копирование и восстановление данных, расположенных
на разделах NTFS, FAT и FAT32 как на локальном, так и на удаленном
компьютере;

Выбор отдельных томов, каталогов или файлов, подлежащих копи-
рованию (восстановлению), а также просмотр подробной информа-
ции о файлах;

Выбор носителя, на который будет выполняться резервное копи-
рование: магнитная лента, диск, гибкий диск, магнитооптический
носитель и др.;

Выбор дополнительной проверки правильности записи (восста-
новления);

Обычные операции резервного копирования: нормальное (normal),
копирование (copy), приращение (incremental), разница (differen-
tial), ежедневное (daily);

Размещение на одном носителе нескольких записей и их объедине-
ние или замещение;

Создание командного файла для автоматизации резервного копиро-
вания;

Планирование операций резервного копирования по времени;

Просмотр полного каталога резервных копий и выбор файлов и
каталогов, подлежащих восстановлению;

Выбор диска назначения и каталога, в который будет выполняться
восстановление;

Использование программы-мастера резервного копирования (вос-
становления) ;

Сохранение информации об операциях резервирования (восстанов-
ления) в журнале и последующий ее просмотр в Event Viewer.

Интерфейс программы

Если в предыдущих версиях Windows NT для запуска программы резерв-
ного копирования требовалось найти соответствующий значок в груп-
пе средств администрирования, то теперь доступ к ней осуществляется
подобно тому, как в Windows 95- Щелкните правой кнопкой мыши зна-
чок, соответствующий жесткому диску, и выберите в контекстном меню
команду Properties, а затем в появившемся диалоговом окне Disk Pro-
perties
- вкладку Tools. Затем следует щелкнуть в разделе Backup
кнопку Backup now,
и на экране появится окно программы резервно-
го копирования.

Внимание! Для резервного копирования необходимо, чтобы в сис-
теме был запущен сервис Media support service. В первой бета-версии
Windows NT 5.0 он не запускается по умолчанию. Запустите его через
слепок консоли управления Service Management.


Интерфейс программы Windows NT Backup

В левой части окна Вы можете видеть дерево устройств Вашего компь-
ютера и сети, к которой он подсоединен. В правой части показан спи-
сок папок и файлов, находящихся в выбранной Вами папке. В нижней
части окна можно указать вид носителя, на который будет выполнять-
ся резервное копирование, тип резервного копирования, параметры.
Там же находится кнопка Schedule, с помощью которой можно про-
смотреть существующее расписание операций копирования.

Если Вы уверены, что знаете, какие параметры и как необходимо за-
дать, то можете смело приступать к работе. Если нет - воспользуйтесь
приглашением, которое появится над описанным окном программы, и
выберите нужную программу-мастер.


Приглашение начать резервное копирование

Параметры резервного копирования
(восстановления)

К доступным параметрам резервного копирования (восстановления)
относятся:

Тип резервного копирования;

Параметры регистрации в журнале;

Файлы, не подлежащие резервированию;

Параметры восстановления.

Для определения этих параметров либо щелкните кнопку Options в
нижней части окна программы, либо выберите одноименную команду
в меню Tools. На экране появится диалоговое окно Options.


Диалоговое окно Options, вкладка Backup Type

Вы можете выбрать: выполнять ли резервное копирование всех отме-
ченных файлов (All selected files) или только новых или измененных
(New and changed/lies only).

В первом случае копируются все выделенные файлы (даже те, которые,
например, уже были скопированы несколько дней назад и с тех пор не
изменились). Понятно, что время выполнения резервирования в дан-
ном случае зависит только от общего объема отмеченных файлов. У Вас
также имеется возможность поставить переключатель в положение,
предписывающее отмечать модификацию файла (Normal backup type.
Backup all files. Clear the modified/lag.)
или не делать этого (Copy
backup type. Backup all files. Don t clear the modified flag.).
Второй
тип позволяет значительно сократить время резервного копирования.

Помимо разностного резервирования и резервирования с приращени-
ем эффективно ежедневное резервное копирование. При этом копиру-

ются только файлы, создание или последняя модификация которых
датированы сегодняшним числом.

Запись в журнал информации о резервном копировании необходима
для контроля за этой процедурой, отслеживания сообщений об ошиб-
ках и выяснения их причины. Параметры регистрации в журнале зада-
ются в том же диалоговом окне Options, на вкладке Backup logging.


Диалоговое окно Options, вкладка Backup logging

По умолчанию предлагается записывать в журнал только наиболее об-
щую информацию (summary details): загрузка ленты, начало резервно-
го копирования, ошибка доступа к файлу и т. п. Вы можете либо ука-
зать на необходимость регистрации всех событий (включая имена
файлов и каталогов), либо отказаться от записи в журнал вообще. Вот
пример записи без подробностей;

Operation: Backup

Active Device; File

Media Name: "Media created on 15.11.97"

Backup set ft1 on media Ш

Backup Method: Normal

Backup started on 15.11,97 at 16:03.
Backup completed on 15.11.97 at 16:03.
Directories: 2
Files: 5
Bytes: 21,192
Time: 1 second.

Operation: Verify After Backup

Verify Type: Cyclic Redundancy Check

Active Device: File

Active Device: D:\WINNT5\SYSTEM32\Backup.bkf

Backup set HI on media ff1

Backup description: "Set created on 15.11.97 at 16:03"

Verify started on 15.11.97 at 16:03.

Verify completed on 15.11.97 at 16:03.

Time: 2 seconds.

Operation: Restore

Restore started on 15.11.97 at 16:05,

Warning: File New Bitmap Image.bmp was skipped

Warning: File New Rich Text Document, rtf was skipped

Warning: File New Text Document.txt was skipped

Warning: File New WordPad Document.doc was skipped

Warning: File tracking,log was skipped

Restore completed on 15.11.97 at 16:05.

Time: 3 seconds.

Время выполнения резервного копирования не имеет особого значе-
ния, если объем файлов не велик. Однако при ежедневном резервиро-
вании файлов и каталогов нескольких корпоративных серверов, общий
объем дискового пространства, которых может составлять сотни гига-
байт или даже терабайты, для копирования может не хватить целой
ночи. Один из способов сокращения времени - исключение из про-
цесса копирования файлов, которые не модифицируются вообще, либо
редко и из централизованного источника. Например, в системных ка-
талогах может быть много файлов шрифтов, курсоров, картинок и т. п.

Для исключения таких файлов из списка копируемых, выберите в диа-
логовом окне Options вкладку Exclude Files и укажите расширения
всех файлов, для которых не надо делать резервную копию.


Диалоговое окно Options, вклидка Exclude files

Восстановление файлов не является какой-то уж очень сложной зада-
чей, но требует внимательного отношения. Не исключено, что файлы,
хранящиеся на диске, содержат более свежую информацию, чем запи-
санные в архиве. Восстановив данные из архива на место существую-
щих, Вы безвозвратно потеряете то, что было сделано с момента пос-
леднего резервирования.

Именно поэтому не рекомендуется замещать файлы на диске хранимы-
ми в архиве по умолчанию. У Вас есть выбор: замещать только те фай-
лы, дата которых старше, чем дата файлов из архива; или замещать все
файлы без разбора.


Диалоговое окно Options, вкладка Restore options

Выполнение резервного копирования

После определения параметров резервного копирования можно при-
ступить непосредственно к самой процедуре.

Внимание! Если Вы выполняете резервирование в файл, то укажите
имя файла-приемника. Этот файл будет называться в дальнейшем но-
сителем (media),
несмотря на то, что в физическом смысле он не яв-
ляется носителем, а сам располагается на носителе, например, на жес-
тком диске. Термин "носитель" не должен Вас смущать, когда програм-
ма задает вопрос типа "Заместить все содержимое носителя?". Речь в
данном случае идет только о файле-приемнике.

Для начала резервного копирования щелкните кнопку Start в програм-
ме Windows NT Backup. Появится диалоговое окно Backup Informa-
tion,
предлагающее уточнить некоторые дополнительные параметры.


Диалоговое окно Backup Information

Задать параметры Вам помогут следующие элементы окна:

Флажок Restrict access to owner or administrator - если он от-
мечен, то доступ к носителю будет запрещен для владельцев файлов
или администраторов;

Флажок Backup local Registry - если он отмечен, то будет создана
резервная копия реестра на локальной машине;

Поле Set description - в него Вы можете ввести название резерви-
руемой информации; при восстановлении это название будет пере-
числено в списке доступных наборов;

. фляжок Append this backup to the media - отметив его, Вы укаже-
те программе на необходимость добавления новой информации к
уже хранимой в архиве;

Флажок Replace the data on the media with this backup - отме-
тив его, Вы укажете программе на необходимость замещения всей
предыдущей информации на носителе новой; в случае использова-
ния в качестве носителя магнитной ленты будет создано новое ог-
лавление и данные будут записаны с начала ленты, в случае исполь-
зования файла на диске - переписано содержимое файла;

В поле Use this media name следует ввести имя носителя;

Кнопка Advanced открывает возможность ввести дополнительные
параметры в диалоговом окне Advanced backup options,


Диалоговое окно Advanced Backup Options

С помощью диалогового окна Advanced Backup Options Вы можете
потребовать:

Выполнить резервное копирование службы каталогов;

Выполнить резервное копирование данных иерархичного хранилища;

Проверить данные после резервирования;

Использовать компрессию на аппаратном уровне (если это допуска-
ет Ваше оборудование);

Выбрать один из описанных ранее типов резервного копирования.

После определения всех перечисленных параметров начнется процесс
резервного копирования файлов на указанный носитель.

Планирование резервного копирования

В предыдущих версиях Windows NT для планирования времени резер-
вного копирования требовалось использовать системный планировщик
(команда AT). Новая версия имеет встроенный планировщик, который
позволяет задать начальные день и время резервирования, указать, яв-
ляется ли данная операция регулярной, если да, то с какой периодич-
ностью и в течение какого времени должна выполняться. Все эти пара-
метры задаются для каждого резервного копирования в диалоговом
окне Scheduled Job Options.


Диалоговое окно Scheduled Job Options

Например, если Вы хотите выполнять резервное копирование домаш-
них каталогов пользователей каждую ночь, то, создав соответствующее
задание на резервирование, определите для него:

. Start date - текущее число;

. Start time - 12:00 (надеясь, что в полночь" все пользователи уже
разошлись по домам, где отдыхают, а не работают с файлами в сво-
их домашних каталогах);

Отметьте флажок Run more then once,

. Frequency - ежедневно (daily), интервал - 1 день.

Также следует указать учетную запись, имеющую доступ к данному за-
данию на резервное копирование. Эта учетная запись должна обладать
соответствующей привилегией.


Расписание заданий резервного копирования

Программа указывает полночь "по-американски", то есть в 12.00 AM.

В результате должно получиться расписание, изображенное на преды-
дущем рисунке. На этом графике также присутствует еще одно задание,
выполняемое каждый понедельник.

Поддержка источников
бесперебойного питания

Источники бесперебойного питания (UPS) поддерживают работоспо-
собность системы при сбоях питания за счет энергии аккумуляторных
батарей. В Windows NT встроен сервис UPS, позволяющий выполнять
определенные действия в системе при поступлении сигналов от источ-
ника бесперебойного питания. Кроме встроенного сервиса, сторонние
производители UPS предлагают дополнительные продукты, обеспечи-
вающие большую функциональность.

Сервис UPS Windows NT определяет сбои напряжения питания, предуп-
реждает о них пользователя и корректно заглушает систему при исто-
щении источника резервного питания.

Настройка параметров этого сервиса производится в разделе UPS па-
нели управления.


Диалоговое окно настройки параметров UPS
К настраиваемым параметрам относятся:

Последовательный порт, к которому подключен источник беспере-
бойного питания;

Сигнал от UPS при сбое напряжения питания;

Предупреждение от UPS при снижении уровня зарядки батарей;

Сигнал от сервиса UPS для выключения источника бесперебойного
питания;

Командный файл, выполняемый перед выключением компьютера;

Ожидаемое время работы и перезарядки батарей;

Временные интервалы для предупреждающих сообщений.

Сервис UPS должен использоваться совместно с сервисами Alerter, Mes-
senger и Журналом регистрации. При этом все события, связанные с
сервисом UPS (например, сбой питания или сбой подключения источ-
ника бесперебойного питания) будут занесены в журнал регистрации,
а определенные пользователи будут уведомлены о них по сети. С по-
мощью параметра Server на панели управления можно назначить
пользователей и (или) компьютеры, которые будут получать эти уве-
домления.

Кластеры серверов

В общем случае кластером называется группа независимых систем,
работающих как единое целое. Клиент взаимодействует с кластером как
с одним сервером. Кластеры используются как для повышения доступ-
ности, так и для наращиваемости.

Доступность. Когда система, входящая в кластер выходит из строя,
программное обеспечение кластера распределяет работу, выполнявшу-
юся этой системой, между другими системами кластера.

В качестве примера рассмотрим работу современного супермаркета.
Сердце этого бизнеса - расчетные центры. Кассовые аппараты долж-
ны быть постоянно подключены к базе данных магазина, хранящей
информацию о продуктах, кодах, названиях и ценах. Если связь рвется,
теряется возможность обслуживать клиентов, ухудшается репутация
торговой организации, падает прибыль.

Кластерная технология повысит доступность системы. Можно предло-
жить использование двух систем, подключенных к многопортовому
дисковому массиву, на котором располагается база данных. В случае
сбоя сервера А резервная система (сервер Б) автоматически "подхва-
тит" соединение так, что пользователи и не заметят, что произошел
сбой. Таким образом, комбинация технологий обеспечения повышен-
ной надежности работы с диском, стандартно используемых в Windows
NT Server (чередование, дублирование и т. д) с кластерной технологи-
ей гарантирует доступность системы.


Наращиваемость. Когда общая загрузка достигает предела возмож-
ностей систем, составляющих кластер, последний можно нарастить, до-
бавив дополнительную систему. Ранее для этого пользователи вынуж-
дены были приобретать дорогостоящие компьютеры, позволяющие ус-
танавливать дополнительные процессоры, диски и память. Кластеры
позволяют увеличивать производительность, просто добавляя новые
системы по мере необходимости.

В качестве примера наращиваемости рассмотрим ситуацию, типичную
в финансовом бизнесе. Всю полноту ответственности за работу финан-
совой или банковской сети несет главный технический специалист. Он
отлично понимает, что малейший сбой системы повлечет за собой
колоссальные финансовые потери и град упреков в его адрес. Если же
система работает безукоризненно, то на нее постепенно будет перекла-
дываться все больше и больше задач, и, несомненно, однажды возмож-
ности системы будут исчерпаны. Потребуется разработка и создание
новой системы.

До недавнего времени подобные соображения приводили к тому, что
технические специалисты крупных банков, вынужденные заранее ^зак-
ладываться" на огромный рост вычислительных потребностей, созда-
вали системы на базе больших мэйнфреймов и мини-ЭВМ.

Кластерная технология на базе Windows NT Server предоставляет по-
трясающую возможность - отказаться от дорогостоящего оборудова-
ния и использовать широко распространенную систему на самых обыч-
ных аппаратных платформах. Мощность кластера наращивается про-
стым добавлением в него еще одной системы.


Наращиваемость кластеров

Традиционная архитектура предоставления
высокой доступности

Сегодня для повышения доступности компьютерных систем использу-
ется несколько подходов. Наиболее типичен метод дублирования сис-
тем с полностью тиражируемыми компонентами. Программное обес-
печение постоянно отслеживает состояние работающей системы, а
вторая система все это время простаивает. В случае сбоя первой систе-

мы происходит переключение на вторую. Такой подход, с одной сто-
роны, значительно повышает стоимость оборудования без повышения
производительности системы в целом, а, с другой - не гарантирует от
ошибок в приложениях.

Традиционная архитектура обеспечения
наращиваемости

Для обеспечения наращиваемости сегодня также применяется несколь-
ко подходов. Один из способов создания системы с наращиваемой
производительностью - использование симметричной мультипроцес-
сорной обработки (SMP). В SMP-системах несколько процессоров ис-
пользуют общую память и устройства ввода-вывода. В традиционной
модели, известной как модель совместного использования памяти,
выполняется одна копия операционной системы, а процессы приклад-
ных задач работают так, как будто в системе лишь один процессор. При
запуске в такой системе приложений, не использующих общие данные,
достигается высокая степень наращиваемости.

Тормозят использование систем с симметричной обработкой, в основ-
ном, физические ограничения скорости работы шины и доступа к па-
мяти. По мере увеличения скорости работы процессоров возрастает их
стоимость. Сегодня пользователь, пожелавший добавить в конфигура-
цию два-четыре процессора (не говоря уж о большем числе) должен
заплатить значительную сумму, совершенно непропорциональную вы-
годе, получаемой от увеличения числа процессоров.

Архитектура кластера

Кластеры могут иметь разные формы. Например, в качестве кластера
может выступать несколько компьютеров, связанных по сети Ethernet.
Пример кластера высокого уровня - высокопроизводительные много-
процессорные SMP-системы, связанные между собой высокоскорост-
ной шиной связи и ввода-вывода. В обоих случаях увеличение вычис-
лительной мощности достигается постепенно, добавлением очередной
системы. С точки зрения клиента, кластер представляется в виде одно-
го сервера или образа одной системы, хотя реально состоит из не-
скольких компьютеров.

Сегодня в кластерах используются, в основном, две модели: с общими
дисками и без общих компонентов.

Модель с общими дисками

В модели с общими дисками, программное обеспечение, исполняемое
на любой из систем, входящих в кластер, имеет доступ к ресурсам си-
стем кластера. Если двум системам нужны одни и те же данные, то пос-
ледние либо дважды считываются с диска, либо копируются с одной си-
стемы на другую. В SMP-системах приложение должно синхронизовать

и превратить в последовательный вид доступ к общим данным. Обыч-
но организующую роль при синхронизации играет диспетчер распре-
деленных блокировок DLM (Distributed Lock Manager).
Сервис DLM по-
зволяет приложениям отслеживать обращения к ресурсам кластера.
Если к одному ресурсу обращается более двух систем одновременно,
то диспетчер распознает и предотвращает потенциальный конфликт.
Процессы DLM могут приводить к дополнительному графику сообще-
ний в сети и снизить производительность. Один из способов избежать
этого эффекта - использование программной модели без общих ком-
понентов.

Модель без общих компонентов

В модели без общих компонентов каждая система, входящая в кластер,
владеет подмножеством ресурсов кластера. В конкретный момент вре-
мени только одна система имеет доступ к определенному ресурсу, хотя
при сбоях другая динамически определяемая система может вступить
во владение этим ресурсом. Запросы от клиентов автоматически пере-
направляются к системам, владеющим необходимым ресурсом.

Например, если в запросе клиента содержится обращение к ресурсам,
находящимся во владении нескольких систем, одна система выбирает-
ся для обслуживания запросов (ее называют хост-система). Затем эта
система анализирует запрос и передает подзапросы соответствующим
системам. Те выполняют полученную часть запроса и возвращают ре-
зультат хост-системе, которая формирует окончательный результат и
отсылает его клиенту.

Одиночный системный запрос к хост-системе описывает высокоуров-
невую функцию, порождающую системную активность, а внутриклас-
терный трафик не генерируется до тех пор, пока не будет сформиро-
ван конечный результат. Использование приложения, распределенно-
го между несколькими входящими в кластер системами, позволяет пре-
одолеть технические ограничения, присущие одному компьютеру.

Обе модели: и с общим диском, и без общих компонентов, - могут
использоваться в пределах одного кластера. Некоторые программы
лучше всего используют возможности кластера в рамках модели с об-
щим диском. К таким приложениям относятся задачи, требующие ин-
тенсивного доступа к данным, а также задачи, которые трудно разде-
лить на части. Приложения, для которых важна наращиваемость, раци-
ональней исполнять на модели без общих компонентов.

Серверы кластерных приложений

Итак, кластеры предоставляют доступность и наращиваемость для всех
серверных приложений. В свою очередь, специальные "кластерные"
приложения могут использовать все преимущества кластеров. Серверы
баз данных могут быть улучшены за счет добавления либо функций

координации доступа к общим данным в кластерах с общим диском,
либо функций разделения запросов на более простые запросы в клас-
терах без общих компонентов. В последних сервер баз данных сможет
использовать все преимущества разделения данных путем параллель-
ных запросов. Дополнительно серверные приложения могут быть рас-
ширены функциями автоматического определения неработающих ком-
понентов и инициации быстрого восстановления.

Исторически, для создания кластерных приложений использовались
мониторы обработки транзакций. Монитор транзакций отвечает за
перенаправление клиентских запросов к соответствующим серверам
внутри кластера, распределение запросов между серверами и коорди-
нацию транзакций между серверами кластера. Монитор транзакций
также может заниматься балансировкой нагрузки, автоматическим пе-
реподключением и повторением исполнения запроса в случае сбоя на
сервере, а также принимать участие в процессе восстановления после
сбоев.

Модели кластеров Windows NT

Текущая реализация кластеров для Windows NT поддерживает работу
двух связанных между собой особым образом серверов. Если на одном
из серверов происходит сбой или он отключается, то второй начинает
исполнять его функции. Кроме того, кластеризация обеспечивает ба-
лансировку нагрузки, распределение процессов между серверами. По
принципу настройки на использование тех или иных свойств, класте-
ры Windows NT можно разделить на пять моделей:

. модель 1 - высокая доступность и статическая балансировка на-
грузки;

. модель 2 - "горячий резерв" и максимальная доступность;

. модель 3 - частичная кластеризация;

. модель 4 - только виртуальный сервер (без переключения);

. модель 5 - гибридная.

Давайте вкратце рассмотрим эти модели.

Модель 1: высокая доступность и статическая
балансировка нагрузки

В этой модели обеспечивается высокая доступность; а также произво-
дительность: приемлемая - при одном неработающем узле, и высо-
кая - при обоих работающих; а также максимальное использование
аппаратных ресурсов.

Каждый их двух узлов предоставляет в сеть свой собственный набор
ресурсов в виде виртуальных серверов, к которым имеют доступ кли-
енты. Производительность каждого из узлов подобрана таким образом,
что обеспечивает оптимальную производительность для ресурсов, но

только до тех пор, пока оба узла работоспособны. При сбое одного
сервера исполнение всех кластерных ресурсов переключается на дру-
гой, производительность резко понижается, однако все ресурсы по-
прежнему доступны для клиентов.


Конфигурация модели 1

Например, эта модель может применяться при совместном использо-
вании файлов и принтеров. На каждом из узлов создаются независи-
мые группы с файловыми и принтерными ресурсами. При сбое одного
из узлов все управление его ресурсами берет на себя оставшийся. Пос-
ле восстановления узел возвращает себе свою часть работы, В резуль-
тате клиенты имеют постоянный доступ как ко всем файловым ресур-
сам кластера, так и ко всем очередям печати.

Рассмотрим другой пример использования этой модели. Допустим, на
предприятии имеется почтовый сервер, на котором установлен Mic-
rosoft Exchange. В пиковые моменты нагрузки сервер не справляется и
отключается. Поскольку почта должна функционировать непрерывно,
можно предложить следующее решение. Сервер, на котором исполня-
ется Microsoft Exchange, объединяется в кластер с сервером, на кото-
ром в нормальном режиме работает приложение доступа к данным. В
момент сбоя почтового сервера его роль временно принимает на себя
второй сервер кластера. Но, подчеркиваю, это лишь временно, и сразу
после перезагрузки основного почтового сервера вся работа по обра-

ботке почты вновь передается ему. Аналогично может выполняться пе-
реключение программы работы с базами данных.

Модель 2: "горячий резерв"
и максимальная доступность

При такой модели обеспечивается максимальная доступность и произ-
водительность, но за счет вложений в оборудование, которое большую
часть времени простаивает. Один из узлов кластера, называемый пер-
вичным,
обслуживает всех клиентов, в то время как второй использует-
ся в качестве "горячего резерва".

Когда происходит сбой первичного узла, второй незамедлительно за-
пускает сервисы, исполнявшиеся на первом, и обеспечивает при этом
производительность, максимально близкую к производительности пер-
вичного узла.


Модель с "горячим резервированием"

Эта модель наилучшим образом подходит для наиболее важных для
организации приложений. Например, это может быть сервер Web, об-
служивающий тысячи клиентов и предоставляющий доступ к важней-
шей информации. В таком случае стоимость узла, дежурящего в режи-
ме "горячего резерва", все равно значительно ниже потерь, возможных
в случае прекращения доступа к данным.

Модель 3: частичная кластеризация

Данная модель позволяет использовать на серверах, составляющих кла-
стер, приложения, для которых не будет выполняться переключение в
случае сбоя. Ресурсы таких приложений располагаются не на общем, а

на локальном диске сервера. В случае сбоя сервера эти приложения
становятся недоступными.


Модель частичной кластеризации

Эта модель подходит, если приложения, работающие на одном из сер-
веров, входящем в кластер, используются не часто и их постоянная
доступность не столь необходима. Например, это может быть какое-
либо бухгалтерское приложение или расчетная задача.

Иногда случается, что модель переключения, обеспечиваемая Microsoft
Cluster Server, не годится для некоторых приложений. (Например, при
исполнении расчетной задачи переключение с узла на узел все равно
прервет процесс вычислений). Для таких приложений необходимы
иные, специфичные механизмы обеспечения бесперебойной работы.

Модель 4: только виртуальный сервер
(без переключения)

Строго говоря, эту модель трудно назвать кластером. В ней использу-
ется только один сервер, переключение которого в случае сбоя не вы-
полняется.

С другой стороны, все ресурсы организованы так, что для пользовате-
ля они предстают в виде ресурсов разных виртуальных серверов. По-
этому вместо поиска нужных ресурсов на различных серверах в сети
пользователь осуществляет доступ только к одному.

В случае сбоя сервера программное обеспечение кластера запускает
необходимые сервисы в указанном порядке сразу после перезагрузки.

В будущем такой узел может быть соединен с другим для организации
полноценного кластера.


Модель с одним виртуальным сервером

Модель 5: гибридное решение

Последняя модель - гибрид предыдущих. В самом деле, при достаточ-
ном запасе мощности можно использовать преимущества всех моделей
в одной и обеспечить самые разные сценарии переключения в случае
сбоя.

На рисунке показан возможный пример гибридного решения, в кото-
ром на обоих узлах кластера имеются переключаемые ресурсы, непе-
реключаемые приложения и сервисы, а также виртуальные серверы.


Гибридное решение

Установка Microsoft Cluster Server

Установить программное обеспечение поддержки кластеризации очень
просто. Выполнение программы установки на двух компьютерах зай-
мет у Вас не более 10 минут. Однако, как и в любом деле, лучше семь
раз отмерить, и один раз - отрезать. В данном случае это означает, что
перед установкой ПО необходимо тщательно соблюсти некоторые
начальные условия и сконфигурировать серверы соответствующим
образом.

Прежде чем начать

Для установки MSCS (Microsoft Cluster Server) необходимо иметь следу-
ющее оборудование.

1. Два компьютера произвольной конфигурации. Характеристики
компьютеров могут различаться. Например, один имеет процессор

Pentium Pro с тактовой частотой 200 Мгц, объем ОЗУ - 256Мб, встро-
енный жесткий диск объемом 2 Гб. Второй - процессор Pentium II с
тактовой частотой 233 Мгц, объем ОЗУ б4Мб и встроенный жесткий
диск объемом 1 Гб. Разброс характеристик определяется используе-
мой Вами моделью: от практически идентичных (для режима "горя-
чего резервирования") до совершенно различных (для режима час-
тичной кластеризации).

2. В каждом компьютере должно быть не менее одного SCSI-адап-
тера,
к которому будут подключаться общие диски. К этим адапте-
рам применяется одно жесткое требование: они должны обеспечи-
вать такой режим работы, который позволяет не инициализировать
шину при перезагрузке. В ряде случаев с этой целью может понадо-
биться отключить BIOS адаптера.

Другим требованием является то, что SCSI ID одного из компьюте-
ров должен быть обязательно равен шести, а другого - семи.

Отдельного рассмотрения заслуживает вопрос терминирования
шины. Оно должно выполняться таким образом, чтобы никак не
зависеть от работоспособности любого из компьютеров. По этой
причине внутренние терминаторы SCSI-адаптера не подходят. Тер-
минаторы должны находиться снаружи. Можно предложить два ва-
рианта с расположением общих дисков:

между серверами;

на одном конце.

В первом случае на обоих концах шины подключение к серверам
должно осуществляться с помощью так называемых Y-кабелей.


Связь с промежуточным расположением устройств хранения

Во втором случае два сервера связаны между собой так, что сервер,
более удаленный от общих дисков, подключается с помощью Y-ка-
беля, а дисковый накопитель - с помощью обычного кабеля, но
имеет либо внутреннюю терминацию, либо специальный разъем для
подключения внешнего терминатора.


Связь серверов с расположением общих дисков на одном конце

3. Не меыее 2 сетевых плат в каждом компьютере. Узлы в кластере
должны быть связаны между собой надежным каналом, называемым
интерконнектом (interconnect). По этому каналу они обменивают-
ся друг с другом информацией о своем состоянии. Предположим, в
качестве такого канала используется та же самая сетевая плата, что
и для доступа к ресурсам кластера. В этом случае велика вероятность,
что в моменты загрузки сети будет происходить ложное срабатыва-
ние процедуры переключения. При обоих работоспособных серве-
рах информация об их состоянии просто не будет доходить от од-
ного к другому. В результате оба сервера инициируют процесс пе-
реключения, что, вполне вероятно, приведет к сбою системы.


Именно поэтому рекомендуется использовать для интерконнекта
отдельный сетевой канал. Для более высокой надежности желатель-
но организовать несколько таких каналов. В любом случае, считай-
те, что для Вас дороже: стоимость потерянной на время информа-
ции или стоимость нескольких сетевых плат.

Взаимодействие между кластерами осуществляется по протоколу
TCP/IP. Поэтому Вам понадобится назначить адреса для сетевых карт
интерконнекта. Для этой цели можно использовать специальные
зарезервированные адреса:

10.0.0.1 - 10.255.255.254;

172.16.0.1 - 172.31.255.254;

192.168.0.1 - 192.168.255-254.

4. Общим дискам в серверах должны быть присвоены одинаковые
буквы.
Например, если в одном из серверов локальные диски име-
ют буквы С, D и Е, а в другом - С, D, Е, F и G, то первый общий диск
в обеих системах должен быть диском Н.

Внимание! Все общие диски должны иметь формат NTFS.

Присвоение букв дискам выполняется по очереди. Сначала загружа-
ется один сервер, а второй остается выключенным. С помощью слеп-
ка Disk Management назначается нужная буква. После этого первый
сервер выключается, загружается второй и назначается та же самая
буква для выбранного раздела диска.

После того, как выполнены все перечисленные условия, можно устанав-
ливать ПО MSCS.

Процедура установки

Процедура проста: сначала выполняют установку на одном узле, а по
ее завершении - на втором. Для установки необходимо зарегистриро-
ваться в домене с административными правами.

Устанавливать ПО надо на локальный, а не на общий диск. В процессе
установки ПО на первый сервер надо указать имя, под которым клас-
тер будет доступен для клиентов, имена дисков, предназначаемых для
использования в качестве общих ресурсов, сетевые карты и их назна-
чение (для связи с клиентами, для интерконнекта или для того и друго-
го), адреса IP и маску.

Процедура установки на второй сервер аналогична, за тем исключени-
ем, что вместо формирования нового кластера надо подключиться к
уже существующему.

Администрирование кластера

Для администрирования кластера используется программа Cluster Admi-
nistrator. Она может быть установлена как на любом из узлов, входящих
в кластер, так и на произвольной рабочей станции.

Интерфейс программы весьма напоминает интерфейс консоли управ-
ления с загруженным слепком, однако теперь администратор класте-
ров не является слепком ММС.


Окно Cluster Administrator

Окно состоит из двух частей. В левой части в виде древовидной струк-
туры представлены элементы кластера: группы, доступные ресурсы,
сетевые интерфейсы, узлы и т. д. В правой - содержимое той или иной
ветви древовидной структуры кластера.

На панели инструментов есть кнопка, позволяющая подключиться к
любому кластеру для управления им. С помощью администратора кла-
стера можно выполнять следующие операции:

Создавать новый ресурс;

Создавать и модифицировать группу ресурсов кластера;

Управлять сетевыми интерфейсами;

Управлять ресурсами каждого из узлов в отдельности;

Имитировать сбой в работе ресурса;

Останавливать работу отдельных групп;

Перемещать ресурсы между группами.

Большинство функций выполняется с помощью программ-мастеров.
Поскольку данная книга не ставит перед собой задачу подменить доку-
ментацию, мы лишь кратко рассмотрим некоторые операции.

Создание новой группы ресурсов

Создавая новую группу ресурсов, необходимо помимо ее имени, ука-
зать предпочтительного владельца. Выбор зависит от типа используе-
мой модели кластера. Добиваясь высокой доступности, можно указать
в качестве владельцев оба узла. При обеспечении "горячего резерва"
предпочтительным владельцем должен стать основной узел.


Назначение предпочтительного владельца группы ресурсов

Создание нового ресурса

В Microsoft Cluster Server можно создавать ресурсы одного из следую-
щих типов:

Координатор распределенных транзакций;

Совместно используемый файловый ресурс;

Приложение общего вида;

Сервис общего вида;

Виртуальный корень Internet Information Server;

Адрес IP;

Сервер очередей (Microsoft Message Queue Server);

Сетевое имя;

Физический диск;

Спулер печати;

Сервис таймера.


Добавление нового ресурса

Например, если Вы хотите добавить новый виртуальный корень для
своего сервера Web, то необходимо создать ресурс типа US Virtual Root.

Определение взаимозависимости ресурсов

Очевидно, что ресурсы кластера не могут запускаться в произвольном
порядке. Те сервисы, от которых зависит работа остальных, должны
стартовать раньше.


Определение зависимости загрузки ресурсов

Так, прежде чем сделать виртуальный корень сервера Web доступным
для пользователей, необходимо выполнить, по крайней мере, две опе-
рации: определить диск, на котором физически располагается каталог,
являющийся виртуальным корнем, и назначить адрес IP. Соответствен-
но эти два ресурса необходимо назначить определяющими для вирту-
ального сервера.

Определение свойств ресурса

Наконец, после того, как задана последовательность загрузки ресурсов,
можно определить свойства вновь создаваемого ресурса. Окно свойств
существенно различается в зависимости от типа ресурса. Например, на
рисунке показано определение параметров виртуального корня серве-
ра Web. Для него указывается полный путь на диске, имя, под которым
он будет доступен для клиентов, а также тип доступа.


Определение специфичных параметров ресурса

Редактирование свойств ресурсов

Свойства любого ресурса можно отредактировать. Для этого необходи-
мо щелкнуть имя ресурса правой кнопкой мыши и в контекстном меню
выбрать команду Properties. Появится диалоговое окно, подобное
изображенному на рисунке.


Модификация свойств f)ecvl)ca

В этом диалоговом окне можно изменить следующие параметры:

Имя и описание ресурса;

Возможных владельцев ресурса (на уровне серверов);

Последовательность загрузки сервисов, влияющих на работу редак-
тируемого ресурса;

Параметры перезапуска ресурса в случае сбоя;

Интервалы опроса;

Командную строку и параметры запуска.

Проверка работоспособности

Для проверки работоспособности созданной группы ресурсов в адми-
нистраторе кластера предусмотрена возможность имитации сбоя. На-
пример, для проверки работоспособности виртуального корня серве-
ра Web его исполнение переносится на другой узел командой меню.

В течение последующих минут администратор увидит в окне Cluster
Administrator,
как система распознает остановку сервиса, иницииру-
ет его запуск на другом узле и, после запуска всех определяющих сер-
висов, запускает выбранный ресурс. Клиенты заметят лишь небольшую
(одну-две минуты) задержку.

Хотя параметры перезапуска можно редактировать, не рекомендуется
уменьшать время проверки работоспособности, так как небольшие
паузы в работе могут быть расценены как сбой кластера.

Заключение

Windows NT 5.0 унаследовала от предыдущих версий все возможности
обеспечения бесперебойной работы. Средства поддержки отказоустой-
чивых дисковых томов, поддержка источников бесперебойного пита-
ния, улучшенная версия программы резервного копирования удачно
дополняются кластерными технологиями.

Несомненно, что перечисленные возможности в совокупности с под-
держкой аппаратных средств отказоустойчивости позволяют говорить
о Windows NT Server 5.0 как о серверной операционной системе, впол-
не способной удовлетворить потребности предприятий, где требуется
высокий уровень надежности.

В последнее время в банках растет использование труда резервных бригад, так как это дает возможность организовать непрерывную работу без привлечения сотрудников к работе в выходные дни и без сверхурочной работы основного персонала. Как же организовать работу резервных бригад? По каким правилам строится суммированный учет рабочего времени для них и для остальных категорий сотрудников?

Когда применяется суммированный учет рабочего времени?

Суммированный учет используется для тех позиций, которые должны обеспечить бесперебойную работу банка за пределами стандартных 8 часов в день. Если банк работает не с 9:00 до 17:00, то продолжительность рабочего дня самого банка должна быть обеспечена персоналом, который работает в это время.

Здесь, как правило, есть два варианта:

Работнику устанавливается большая продолжительность рабочего дня, но для выходных и рабочих дней вводится скользящий график, например два через два по 12 часов в день;

Время удлиненного рабочего дня банка делится между двумя бригадами, например: одна бригада сотрудников работает с 8:00 до 16:00, а вторая - с 16:00 до 23:00.

В любом случае если обеспечить нормальную продолжительность рабочей недели (40 часов) таким работникам нельзя, работодатель согласно ст. 104 Трудового кодекса Российской Федерации (далее - ТК РФ) имеет право установить суммированный учет рабочего времени с продолжительностью учетного периода не более года.

Как определить продолжительность учетного периода?

Если по итогам специальной оценки условий труда была выявлена работа во вредных условиях, то продолжительность учетного периода для таких работников не может быть более 3 месяцев. Этот фактор обязательно надо учитывать. Кроме того, если определенная по итогам специальной оценки «вредность» имеет высокую степень 3 или 4 (класс 3.3 или 3.4), то нормальная продолжительность рабочего времени для таких категорий сотрудников - не более 36 часов в неделю. Продолжительность рабочего дня для этих категорий (за исключением отдельных случаев) не должна превышать 8 часов.

На практике подавляющее большинство сотрудников банка работают в допустимых условиях труда с классом 2. Поэтому для них могут быть установлены 40-часовая рабочая неделя и продолжительность рабочего дня более 8 часов.

Специфика суммированного учета рабочего времени сотрудников банка

Суммированный учет рабочего времени для работников банка осуществляется так же, как и для остальных категорий работников:

  1. Порядок установления продолжительности учетного периода определяется в правилах внутреннего трудового распорядка согласно ст. 104 ТК РФ.
  2. За учетный период работодатель должен распланировать работу так, чтобы сотрудником отрабатывалась нормальная продолжительность рабочего времени. Планировать график с переработками запрещено трудовым законодательством.
  3. Если у работников вместе с суммированным учетом рабочего времени будет установлен еще и сменный режим работы, то согласно ст. 103 ТК РФ необходимо будет разрабатывать график сменности с учетом мнения представительного органа и доводить его до сведения работников не позднее чем за месяц. Хотя сейчас обсуждаются поправки в ст. 103, ТК РФ и срок ознакомления работников, скорее всего, будет укорочен до 10 дней.

Какая специфика в этих вопросах свойственна банкам?

Во-первых, в банках редко бывают первичные профсоюзные и иные представительные органы, соответственно все документы, которые ТК РФ требует принимать по согласованию с ними или с учетом их мнения, должны содержать указание на то, что на момент утверждения данного документа таких органов в банке нет.

Во-вторых, как правило, документооборот в банках совершается в электронном виде, документы в письменной форме ведутся только при крайней необходимости и для соблюдения требований законодательства. Поэтому, то же самое ознакомление работника с графиком сменности происходит через направление электронной формы графика или на электронном ресурсе. Здесь нет нарушения, так как ст. 103 ТК РФ не устанавливает требования знакомить с графиком сменности «под роспись», поэтому такое ознакомление имеет полное право на существование. Но с учетом того, что работодатель должен иметь возможность привлечь работника к дисциплинарной ответственности, такой порядок ознакомления с графиком работы должен быть легализован во внутренних нормативных документах, с которыми работники должны быть ознакомлены уже с проставлением «живой» подписи.

В-третьих, специфика банков заключается в использовании окладной системы оплаты труда. При суммированном учете рабочего времени, если учетный период больше одного месяца, рекомендуется все-таки применять часовые тарифные ставки или сдельную систему оплаты труда, так как окладная система часто становится причиной споров между работниками и работодателем.

В-четвертых, поскольку сотрудники банков имеют, как правило, высшее финансовое или юридическое образование, конфликты, связанные с оплатой труда, здесь всегда более «тонкие» . Надо учитывать, что так как в большинстве случаев суммированный учет в банке устанавливается для сотрудников, которые работают по четкому графику: два через два, три через три и т.д., - то и продолжительность учетного периода для получения экономического эффекта рекомендуется устанавливать, исходя из парного количества месяцев. Оптимальным учетным периодом, конечно, в подавляющем большинстве случаев является год, чуть реже - полгода. Если необходимо установить учетный период меньшей продолжительности, то можно взять 4 или 2 месяца, но абсолютно невыгодным в случае, когда сотрудники работают по четкому графику, является учетный период один или три месяца.

Резервные бригады

Название «резервная бригада» не является чем-то установленным законодательно, такой термин сложился на практике. Во многих банках необходимость создания таких бригад вызвана тем, что в пределах одного населенного пункта банк открывает отделения с абсолютно типовой структурой персонала: кассир, операционист, специалист по работе с клиентами и т.д. И если в отделении неожиданно не вышел на работу сотрудник, то определенная функция в данном отделении «провисает».

Оперативно «закрыть» данный участок другим работником можно несколькими способами:

  1. Создать внутри отделения универсальных работников, которые могут «закрывать» любой участок. Но здесь возникает вопрос: что делать, если на работу вышли все работники или не вышел не один работник, а три; как организовать обучение таких универсальных сотрудников, допуск к работе с материальными ценностями и т.д.?
  2. В срочном порядке переводить (или перемещать - в зависимости от условий трудового договора) работника одного отделения в другое отделение.
  3. Оперативно привлекать сотрудника необходимой специализации из резервной бригады.

Состав резервной бригады формируется таким образом, чтобы при необходимости можно было заменить любого работника отделения. Резервные бригады создаются, как правило, в определенных локациях, курируя несколько отделений. Эти работники не только «закрывают» разовые отсутствия на работе, но и в состоянии выйти на работу на период длительного отсутствия сотрудника при его болезни или в случае его увольнения. Численность сотрудников резервной бригады определяется математически с учетом задач банка, статистики невыхода на работу и количества курируемых отделений.

Оптимальный режим работы сотрудников резервной бригады

Первое - это суммированный учет рабочего времени максимальной продолжительности. То есть, если для работников нет никаких ограничений, установленных законодательством, рекомендуется выбрать учетный период продолжительностью в один год.

Второе: так как начало и окончание рабочего дня у разных сотрудников в отделении и в разных отделениях не всегда четко определены, оптимально устанавливать таким работникам гибкий режим работы согласно ст. 102 ТК РФ.

Устанавливать таким работникам сменный режим работы бессмысленно, так как ознакомить их с графиком сменности за месяц до начала периода просто невозможно, исходя из целей и задач такой бригады.

При установлении гибкого режима работы, начало и окончание рабочего дня будут определяться работодателем, исходя из того, в какое отделение направляется работник и кого он там замещает.

Эти вопросы обязательно нужно разрешить, прописывая режим работы сотрудника резервной бригады. Режим работы закрепляется в правилах внутреннего трудового распорядка. Если такой работник в компании один или с каждым работником резервной бригады согласовывается индивидуальный режим и график, то такой режим по ст. 57 ТК РФ прописывается в трудовом договоре данного работника. Также нужно прописать, что работодатель извещает сотрудника резервной бригады о начале рабочего дня непосредственно перед тем, как сотруднику необходимо выйти на работу, и последний должен приступить к работе в кратчайший срок.

Экономический эффект от создания резервных бригад

Как правило, труд работников резервной бригады оплачивается выше, чем труд других работников. Однако с учетом того, что привлечение основного персонала к работе за пределами нормальной продолжительности рабочего времени должно оплачиваться в повышенном размере, формирование резервных бригад всегда приводит к сокращению фонда оплаты труда.

Расчет экономического эффекта может быть произведен и по отдельным должностям в отделении, если данные о работе сверх нормы для них разные и сотрудники резервной бригады будут «закрывать» только одну позицию, то есть не будут универсалами. Принцип формирования резервной бригады из универсалов, когда один такой сотрудник может «закрывать» несколько позиций отделения, экономически более выгоден. Но в любом случае все зависит от специфики конкретного банка.

На сегодняшний день обеспечением резервного копирования занимаются сервера, будь то большое или малое предприятие. Поэтому говорить о бесперебойной работе нужно непосредственно сервера. Что требуется для бесперебойной работы сервера

Чтобы сервер работал бесперебойно нужно не только иметь мощную аппаратуру, но и дополнительное оборудование, квалифицированный персонал. Они и должны обеспечивать оптимальные условия для работы сервера.

1. К дополнительному оборудованию можно отнести:

кондиционирование серверных, то есть, систему охлаждения, вентиляции и т.д., которые не допускают перегрева оборудования;

различные датчики, предназначенные для контроля температурного режима в системе;

автоматические генераторы, которые включаются при отключении электропитания;

независимые магистрали, предназначенные для обеспечения оборудования питанием;

сторожевой таймер, который предупреждает о зависании сервера.

2. Квалифицированные специалисты осуществляют резервирование, замену, подключение основных элементов без отключения оборудования. Также бесперебойную работу обеспечивает наличие объемной памяти.

Как обеспечивается кондиционирование серверов

Сервер со вспомогательным оборудованием устанавливают в отдельном помещении, где должна обеспечиваться хорошая циркуляция воздуха. В помещении должны быть установлены кондиционеры, способные поддерживать оптимальную температуру и влажность. Также отдельно устанавливают систему вентиляции и охлаждения на серверные шкафы. Желательно, чтобы они могли определять, какой участок нуждается в большем охлаждении.



Как видно, для обеспечения бесперебойной и надежной работы сервера нужно приложить немало усилий и средств

Восстановление информации

В данном разделе будут детально расписаны процедуры восстановления информации:

Восстановление структуры файловой системы

В случае форматирования логического диска или раздела, структура и атрибуты данных не нарушаются, но изменяется либо инвентаризируется (приводится в начальное состояние) информация о расположении данных на данном накопителе.

При быстром форматировании обновляется малая часть файловой таблицы, часть служебных записей остается, необходимо лишь интерпретировать ее и прочитать данные в нужном порядке.

Полное форматирование может обновить всю файловую таблицу, поэтому восстановление структуры файлов и папок не всегда возможно. Для восстановления данных без информации о структуре можно использовать восстановление файлов по сигнатурам.

Если произошло повреждение файловой системы в результате программного сбоя или неисправности носителя, программы для восстановления данных могут восстановить часть информации, зависящую от объема повреждений.

Восстановление удаленных данных файловой системы

При удалении данных, на самом деле, данные физически остаются на накопителе, однако в файловой системе более не отображаются, а место на носителе, где они располагаются, помечается как свободное и готовое к записи новой информации. В данном случае атрибуты файлов изменяются. В случае записи в данный раздел или логический диск может произойти частичное или полное замещение данных, помеченных, как удаленные.

Подобные файлы можно легко прочитать и восстановить со всеми атрибутами и информацией о расположении, прочитав служебные записи файловой системы. Существуют как программы только для восстановления удаленных данных, так и комплексные решения, где восстановление удаленных данных - лишь одна из функций.

Восстановление по сигнатурам

В случае, когда реконструкция файловой системы невозможна в силу каких-либо причин, некоторые файлы все еще можно восстановить, используя восстановление по сигнатурам. При данном типе восстановления происходит посекторное сканирование накопителя на предмет наличия известных сигнатур файлов

Основной принцип работы алгоритмов сигнатурного поиска такой же, как у самых первых антивирусов. Как антивирус сканирует файл в поисках участков данных, совпадающих с известными фрагментами кода вирусов, так и алгоритмы сигнатурного поиска, использующиеся в программах для восстановления данных, считывают информацию с поверхности диска в надежде встретить знакомые участки данных. Заголовки многих типов файлов содержат характерные последовательности символов. К примеру, файлы в формате JPEG содержат последовательность символов “JFIF”, архивы ZIP начинаются с символов “PK”, а документы PDF начинаются с символов “%PDF-“.

Некоторые файлы (к примеру, текстовые и HTML файлы) не обладают характерными сигнатурами, но могут быть определены по косвенным признакам, т.к. содержат только символы из таблицы ASCII.

По результатам сканирования выдается, чаще всего, список файлов, отсортированных по типу. Информация о расположении файлов не восстанавливается.

Данный тип восстановления хорошо применять для восстановления фотографий с карт памяти, так как данные на карте однотипные и записываются, в общем случае, строго последовательно, без фрагментации.

Смешанное восстановление

Большинство программ позволяют применить одновременно несколько способов восстановления за одно сканирование. В результате выдается максимально возможный результат при использовании данной программы.

Восстановление из резервных копий

Самый надежный, простой и дешевый способ восстановления информации - восстановление информации из ранее сделанных резервных копий. Для создания резервных копий используется специализированное ПО, которое в том числе может выполнять восстановление данных.

Рассмотрим основные типы носителей и их неисправности.

Накопитель на гибком магнитном диске (НГМД)

Основной неисправностью является так называемое «размагничивание».

Встречается чаще всего при прохождении магнитных детекторов в магазинах, метро, аэропортах. Восстановить данные удаётся только с не размагниченных областей накопителя. Так же встречаются неисправности, связанные с физическим повреждением носителя, такими как царапины, сильное загрязнение. Каждый случай необходимо рассматривать индивидуально и только после этого прогнозировать результат восстановления информации.

Программно-аппаратный способ

Как говорилось выше, в этом способе следует уделить большое внимание именно типу накопителя информации. Варианты и способы восстановления начнем с яркого примера носителя информации.

Накопители CD/DVD/BR

Оптические накопители могут иметь разные причины невозможности чтения данных:

Механические

повреждение прозрачного слоя

повреждение отражающего слоя

Химические

разложение прозрачного слоя

разложение регистрируемого слоя (у записываемых дисков)

коррозия отражающего слоя

Нарушение организации данных

вследствие аппаратно-программных ошибок при записи данных

вследствие неправильных данных

Самыми частыми причинами нечитаемости дисков являются повреждение отражающего и прозрачного слоя, а также разложение регистрируемого слоя у записываемых дисков. В случае образования царапин на поверхности диска, возможно применить полирование рабочей поверхности, что приведёт к удалению нежелательных повреждений и улучшит чтение данных, однако при образовании трещин, использовать данный метод опасно, так как при последующем чтении диск может разрушиться в дисководе под действием центробежной силы. Повреждение фольгированного покрытия диска (старение металла, царапины) больше всего осложняет восстановление данных.

К данному типу накопителей можно отнести USB Flash, SSD-диски, карты памяти SD, miniSD, microSD, xD, MS, M2, Compact Flash.

Самые распространенные технические неисправности]

Логические неисправности

Возникают данные неисправности в самых различных случаях. Одна из самых распространенных причин - неправильное извлечение устройства из компьютера.

В случае логических неисправностей восстановить данные возможно с помощью программ для восстановления данных.

Механические повреждения

Диск прекратил корректную работу в результате какого-либо физического воздействия (падения, попадания влаги, изгиба, сжатия и т. д.). Причина неисправности, чаще всего, в поломке платы или разрушении контактов и компонентов.

Восстановить данные можно, если исправить поломку: заменить неисправный компонент или восстановить нарушенный контакт. Также можно считать данные напрямую с чипа памяти, используя специальное оборудование.

Восстановление данных производится как и в предыдущем случае: заменой компонентов либо чтением с чипов памяти напрямую.

Планирование восстановление работоспособности сети при аварийной ситуации

Один из наиболее полных и логичных образцов подобного документа был разработан Национальным институтом стандартов США (NIST) в 2001 году.

План восстановления функционирования системы устанавливает перечень и последовательность процедур, необходимых для восстановления нормального функционирования системы после наступлении чрезвычайных обстоятельств, повлекших отказ в доступности ресурсов системы. В результате выхода из строя отдельных элементов системы, физического разрушения помещений, пожара, наводнения, террористических атак и др.

Основная цель реализации Плана заключается в обеспечении быстрого и полного восстановления устойчивого функционирования информационной системы.

Поставленная цель достигается решением следующих задач:

определение порядка действий, процедур и ресурсов, необходимых для восстановления функционирования системы или обеспечения ее устойчивого функционирования в резервном варианте размещения технических средств и персонала;

определение штатного состава и основных обязанностей персонала оперативного штаба и аварийных групп из числа сотрудников банка по реализации мероприятий Плана восстановления, а также порядка организации эффективного взаимодействия между аварийными группами и управления ими в течение всего времени активности Плана восстановления;

определение порядка взаимодействия и координации действий оперативного штаба по реализации Плана с другими организациями и структурами (пожарные, медперсонал, милиция, спасатели и др.), которые, возможно, будут привлекаться к ликвидации последствий чрезвычайных событий, вызвавших нарушение нормального функционирования системы.

К примеру, специалисты NIST все мероприятия по выполнению Плана распределяют по трем этапам:

этап уведомления/активации Плана. Основные задачи, решаемые на данном этапе, – своевременная идентификация наступления чрезвычайных условий, обнаружение нанесенных системе повреждений, оценка ущерба, прогноз возможности восстановления функционирования системы и принятие решения о необходимости активации Плана восстановления системы;

этап восстановления. Основные задачи – восстановление функционирования системы по временной схеме (с использованием резервных средств и помещений), проведение комплекса работ по полному восстановлению работоспособности системы в объеме обычных условий;

этап воссоздания системы/деактивации Плана. Основные задачи – полное восстановление нормальной работы системы и деактивация Плана восстановления, возврат к нормальному функционированию.

Согласно исследованию компании McKinseyQuarterly, за последний год в США значительно возросло число компьютерных атак на корпоративные IT-системы. В исследовании McKinseyQuarterly сообщается, что число компьютерных атак (действия хакеров, вирусов, червей, недобросовестных работников и др.) возросло на 150% по сравнению с 2000 годом, составив в общей сложности 53000 случаев взлома систем информационной безопасности компаний.

Такой рост произошел в первую очередь из-за отношения к IT-безопасности как к области сугубо технологической. Это означает, что многими организационными и стратегическими решениями в компаниях попросту пренебрегали.

Реализуемость Плана основана на двух предположениях:

нормальное функционирование системы нарушено в результате наступления некоторого чрезвычайного события или цепи подобных событий. В результате система не способна реализовывать свои функции в объеме, требуемом для качественного обслуживания абонентов;

существует подготовленное помещение, которое выполняет функции резервного центра размещения технических средств системы. Персонал системы формирует необходимую информационно-вычислительную среду на основе технических средств резервного центра для восстановления функционирования системы по резервному варианту размещения в период действия Плана восстановления. Кроме того, резервный вариант размещения используется в течение всего времени, необходимого для восстановления функционирования системы по прежнему (либо новому) месту размещения.

Для разработки плана существует три основных способа:

Собственными силами.

С помощью коммерческого программного обеспечения, предназначенного для составления планов обеспечения бесперебойной деятельности (демонстрационные версии таких программ можно посмотреть или скачать с веб-сайта независимого американского журнала по вопросам восстановления после бедствия Disaster Recovery Journal.

Привлечение внешнего консультанта для оказания помощи или непосредственной разработки плана.

Способы отличаются по стоимости, но во всех случаях требуется выделение персонала для проведения исследований и реализации плана.

Разработка собственными силами требует наличия квалификации в области составления плана обеспечения бесперебойной деятельности. Эту квалификацию можно приобрести только путем всестороннего обучения и накопления опыта. Большинство организаций не имеют этой возможности.

Разработку плана обеспечения бесперебойной деятельности предприятия необходимо организовать в виде проекта, чтобы управлять задачами, сроками и конечными результатами. Основными этапами типичного проекта являются:

Организация выполнения проекта;

Оценка риска, уменьшение нежелательных последствий от наступления событий, связанных с риском, анализ последствий для бизнеса;

Разработка стратегии восстановления деятельности;

Документирование плана;

Обучение;

Имитация бедствия.

Организация выполнения проекта

Организация выполнения проекта включает в себя административное управление проектом, определение допущений, проведение совещаний и разработку политики .

Оценка риска. При оценке риска выявляются типы бедствий, которые могут произойти в каждом конкретном месте. Обследуется физическая инфраструктура здания и его окружения. Для каждого типа бедствия делается оценка возможной продолжительности и присваивается относительная величина, соответствующая вероятности их появления. Используется шкала, например, от 0 до 3; где 0 означает невероятное событие, а 3 -- весьма вероятное. В результате этого выявляются области, в которых следует провести дальнейшие исследования, чтобы уменьшить последствия событий, приводящих к риску.

Анализ последствий для деятельности организации. После оценки риска проводится анализ последствий бедствия для деятельности организации, в ходе которого определяются потери из-за невозможности продолжать нормальную деятельность. Они могут быть очевидными или носить более абстрактный характер, при котором руководству придется сделать предположительную оценку потерь. В любом случае цель заключается не в том, чтобы получить точный ответ, а в том, чтобы выявить факторы, которые являются критически важными для продолжения деятельности компании. На этом этапе определяется масштаб плана обеспечения бесперебойной деятельности. Чрезмерные меры предосторожности потребуют лишних средств, а недостаточные -- не обеспечат должной безопасности.

Разработка стратегии обеспечения бесперебойной деятельности. После определения требований можно принимать решение о том, как обеспечивать восстановление деятельности. Существует множество вариантов технических решений, в том числе:

Использование "горячего" резервного помещения. Поставщик предоставляет компании подготовленное рабочее помещение с оборудованием, средствами телекоммуникации, персоналом, осуществляющим техническую поддержку, и т.д., обычно по годовому контракту. Заказчики получают доступ к оборудованию по принципу "первый пришел -- первым обслуживается".

Использование "холодного" резервного помещения. Компания организует работу в пустующем или арендуемом помещении, которое подготовлено к использованию. Сразу после бедствия в помещении развертывается оборудование (возможно, закупаемое у поставщиков), программное обеспечение и службы обеспечения.

Использование внутренних резервов. Для предоставления услуг в чрезвычайных обстоятельствах используется оборудование компании, которое расположено в ином месте.

Заключение соглашения о взаимной поддержке. Заключается соглашение с другой компанией о коллективном использовании ресурсов после бедствия. При этом предполагается, что резервное оборудование всегда имеет нужную производительность и вас устраивает степень защиты информации при коллективной работе.

В некоторых случаях можно использовать комбинацию этих вариантов. Крупные многонациональные компании чаще всего используют для локальных вычислительных сетей метод внутреннего резервирования. Поскольку количество имеющихся резервных помещений ограничено, может оказаться, что в случае чрезвычайных обстоятельств не окажется рабочего помещения, которое можно было бы использовать. Бедствие в масштабе региона может привести к тому, что все резервные помещения будут заняты и компании негде будет возобновить работу.

Хорошо подготовленный план обеспечивает компанию пошаговыми инструкциями, соответствующими типу и тяжести бедствия. В нем указываются функциональные группы специалистов компании, подготовленные для реализации плана. Наличие хорошо проработанного плана гарантирует, что в стрессовой ситуации после возникновения чрезвычайных обстоятельств, критически важные факторы не будут упущены.

Документация. План может документироваться различными способами. Большинство компаний все еще применяют традиционные текстовые редакторы, другие используют коммерческое программное обеспечение. Какой бы метод ни был использован, важно обеспечить строгое выполнение процедур управления внесением изменений, чтобы поддерживать план в состоянии, соответствующем реальной текущей ситуации.

Обучение. Обучение "Группы восстановления" направлено на то, чтобы каждый сотрудник знал свои функции и обязанности в случае возникновения нештатных ситуаций.

Имитация бедствия. Большинство компаний проводят испытания плана минимум один раз в полгода. Имитируя бедствия можно проверить план, найти его слабые места и отработать взаимодействие участников. Обнаружение недостатков обычно влечет за собой корректировку плана. План должен регулярно проходить испытания и корректироваться. Лишь немногие планы обеспечения бесперебойной деятельности выполняются так, как это предусматривалось первоначально. Поскольку внесение поправок в план необходимо делать регулярно, должна быть максимально упрощена процедура корректировки плана .

При разработке плана обеспечения бесперебойной деятельности необходимо предусмотреть следующее:

Если в настоящий момент план отсутствует, необходимо уведомить высшее руководство о потенциальных опасностях, которые связаны с отсутствием подготовленного и испытанного плана;

При наличии плана надо обеспечить его регулярное испытание -- провести циклическую замену специалистов, участвующих в испытаниях. Желательно, чтобы в этом процессе приняло участие максимальное количество сотрудников;

Надо добиться того, чтобы руководство сделало планирование обеспечения бесперебойной деятельности одной из своих целей;

При выборе альтернативных рабочих помещений необходимо позаботиться, чтобы ими можно было воспользоваться при первой необходимости;

Не принимайте существующие системы и процедуры резервирования на веру: проведите полную экспертизу резервирования и внесите необходимые изменения. Проведите испытания процедур восстановления;

При определении приоритетов приложений опросите руководителей, чтобы они изложили свою точку зрения;

Учтите в плане все мелочи, которые могли бы помешать процессу восстановления деятельности;

После составления плана разработайте механизм, обеспечивающий его регулярное обновление.

Также план должен содержать процедуры выполнения следующих функций:

Ввод в действие процедур для чрезвычайных ситуаций.

Уведомление сотрудников, поставщиков и заказчиков.

Формирование группы (групп) восстановления.

Оценка последствий бедствия.

Принятие решения о реализации плана восстановления деятельности.

Ввод в действие процедур восстановления деятельности.

Переезд в альтернативное рабочее помещение (помещения).

Восстановление функционирования критически важных приложений.

Восстановление основного рабочего помещения.

Кроме того, план должен содержать документы, которые могут быть использованы персоналом, не знакомым с конкретно восстанавливаемыми функциями. Эти документы должны включать следующие данные:

Схемы коммутации телефонов;

Процедуры для аварийного отключения питания;

Организационная структура Центра восстановления;

Требования к оборудованию и снабжению Центра восстановления;

Конфигурация Центра восстановления;

Список критически важных приложений;

Список восстанавливаемого оборудования;

Сводные данные по оценке рисков.

Проводе комплексный анализ представим описание плана по обеспечению непрерывной деятельности в организации. План включает следующие основные разделы:

а) Основные положения плана.

б) Оценка чрезвычайных ситуаций:

Выявление уязвимых мест компании;

Классификация возможных опасных событий и оценка вероятности их возникновения;

Сценарии чрезвычайных ситуаций;

Потенциальные источники отрицательных последствий каждой чрезвычайной ситуации и оценка величины ущерба;

Набор критериев, на основании которых объявляется чрезвычайная ситуация.

в) Деятельность компании в чрезвычайной ситуации:

Первоначальное реагирование на чрезвычайную ситуацию (оценка опасного события, объявление чрезвычайной ситуации, оповещение необходимого круга лиц, ввод в действие чрезвычайного плана);

Мероприятия, обеспечивающие бесперебойность деятельности компании в чрезвычайной ситуации и восстановление ее нормального функционирования.

г) Поддержание готовности к возникновению чрезвычайной ситуации:

Контроль правильности и корректировка содержания плана;

Составление списка адресов и процедуры рассылки плана;

Разработка программы повышения квалификации и ознакомления персонала с действиями, необходимыми для восстановления деятельности компании после бедствия;

Подготовка к опасным событиям, обеспечение безопасности и предотвращение бедствий;

Регулярное проведение частичных и комплексных проверок (типа пожарных учений) готовности компании к действиям в чрезвычайной ситуации и способности восстановить нормальную деятельность;

Регулярное создание резервных копий данных, документации, бланков входных и выходных документов и основного программного обеспечения, их хранение в безопасном месте.

д) Информационное обеспечение:

Приоритетные функции, выполняемые компанией;

Списки внутренних и внешних ресурсов -- технических средств, программного обеспечения, средств связи, документов, офисного оборудования и персонала;

Учетная информация о техническом, программном и другом обеспечении, необходимом для восстановления деятельности организации в случае чрезвычайной ситуации;

Список лиц, которых необходимо оповестить о чрезвычайной ситуации с указанием адресов и телефонов;

Вспомогательная информация -- планы и схемы, маршруты перевозок, адреса и т.п.;

Описание детальных пошаговых процедур, обеспечивающих четкое выполнение всех предусмотренных мер;

Функции и обязанности сотрудников в случае возникновения непредвиденных обстоятельств;

Сроки восстановления деятельности в зависимости от типа возникшей чрезвычайной ситуации;

Смета расходов, источники финансирования.

е) Техническое обеспечение:

Создание и поддержание базы технических средств, обеспечивающей бесперебойную деятельность компании в чрезвычайной ситуации;

Создание и поддержание в надлежащем состоянии резервного производственного помещения.

ж) Организационное обеспечение, состав и функции следующих групп, обеспечивающих бесперебойную деятельность в случае бедствия:

Группы оценки чрезвычайной ситуации;

Группы управления в кризисной ситуации;

Группы для работ в чрезвычайной ситуации;

Группы восстановления;

Группы обеспечения работы в резервном производственном помещении;

Группы административной поддержки.

Таким образом план обеспечения непрерывной деятельности организации представляет собой детальный перечень мероприятий, которые должны быть выполнены до, во время и после бедствия. Этот план документируется и испытывается, чтобы удостовериться в его работоспособности в изменяющихся условиях.

План служит руководством к действию во время кризиса и гарантирует, что ни один важный аспект не будет упущен. Профессионально составленный план направляет действия даже неопытных сотрудников.

Наличие детального, регулярно испытываемого плана поможет оградить любую организацию от судебных исков по поводу халатности. Само существование плана служит доказательством того, что руководство компании не пренебрегло подготовкой к возможным бедствиям.

Основные выгоды от составления детального плана обеспечения бесперебойной деятельности состоят в следующем:

Минимизация потенциальных финансовых потерь;

Уменьшение юридической ответственности;

Сокращение времени нарушения нормальной работы;

Обеспечение стабильности деятельности организации;

Организованное восстановление деятельности;

Сведение к минимуму суммы страховых взносов;

Уменьшение нагрузки на ведущих сотрудников;

Лучшая сохранность имущества;

Обеспечение безопасности персонала и заказчиков;

Соблюдение требований законов и инструкций.

2.2.1. Разрабатывать годовые и ежемесячные графики обслуживания и ремонта энергопотребляющего оборудования, утверждать их у главного инженера.

2.2.2. Разрабатывать перечень регламентных и профилактических работ на каждую единицу основного оборудования.

2.2.3. Организовывать межремонтное обслуживание, своевременный и качественный ремонт и модернизацию энергопотребляющего оборудования, работу по повышению его надежности и долговечности, обеспечивать технический надзор за состоянием и его содержанием.

2.2.4. Определять устаревшее энергетического оборудование, требующее капитального ремонта и устанавливать очередность производства ремонтных работ.

2.2.5. Организовывать работу по проведению профилактических ремонтов энергетического оборудования согласно утвержденных графиков.

2.2.6 .Принимать участие в разработке нормативной документации по ремонту энергетического оборудования, расходу материалов на ремонтно-эксплутационные нужды.

2.2.7. Оформлять заявки на приобретение материалов и запасных частей, необходимых для ремонта энергетического оборудования в соответствии с требованиями к проведению закупок

2.2.8. Ежедневно контролировать наличие необходимого количества запасных частей ремонтного фонда (в программе 1С), контролировать их расходование при проведении профилактических и других ремонтов, своевременно составлять заявку на пополнение фонда запасных частей для бюджетирования и закупки. Контролировать поступление запасных частей ремонтного фонда, принимать запчасти по качеству.

2.2.9. Контролировать соблюдение условий хранения электроремонтных материалов и запчастей.

2.2.10. Проводить мероприятия, обеспечивающие безопасные и благоприятные условия труда при эксплуатации и ремонте энергетического оборудования.

2.2.11. Организовывать консультации по решению отдельных профилактических вопросов

2.2.12. Вести анализ простоев энергетического оборудования, принимать меры по предотвращению простоев и аварий оборудования;

2.2.14. Изучать условия работы энергетического оборудования, его отдельных узлов и деталей, разрабатывать и осуществлять мероприятия по предупреждению неплановых остановок энергетического оборудования, продлению сроков службы, межремонтных периодов, улучшению эксплуатации и сохранности, повышения надежности эксплуатации энергетического оборудования;

2.3.15. Подготавливать бюджет СГЭ.

2.3.16. Составлять годовые планы работ, направленные на повышение эффективности обслуживания энергетического оборудования, на улучшение конструкций узлов оборудования, снижение времени простоев.

2.3.17. Принимать участие в разработке и осуществлении мероприятий по повышению эффективности работы СГЭ, снижению затрат на ремонт энергетического оборудования и его содержание.



2.3.18. Организовывать эффективную работу подчиненных работников, контролировать ведение учета выполняемых работ.

2.3.19. Контролировать соблюдение подчиненными работниками:

Правил внутреннего распорядка и режима работы Общества;

Требований личной гигиены в соответствии с санитарными требованиями, предъявляемыми к работе на предприятиях пищевой промышленности, проводить необходимое обучение;

Выполнение ежедневных осмотров энергетического оборудования и ведение обязательных записей;

Внутренних регламентов по энергетического обслуживанию;

Требований охраны Ежедневно контролировать правильность эксплуатации энергетического оборудования, принимать, необходимы меры по целевому и правильному его использованию;

2.2.20. Своевременно рассматривать заявки на обслуживание и ремонт энергетического оборудования, оперативно реагировать на заявки;

2.2.21. Организовывать оперативное устранение неисправностей в работе энергетического оборудования;

2.2.22. Организовывать выход на работу необходимого ремонтного электротехнического персонала, оформлять необходимые документы по приему-сдаче оборудования из ремонта в ремонт