Поведение при отказе и критерии переключения

Менеджер резервирования несет ответственность за контроль состояния резервирования (какой компьютер является активным/пассивным) на обоих компьютерах. Менеджер резервирования запускается после драйверов. Менеджер резервирования также контролирует состояние ошибки обеих систем. Ошибки конфигурируются со взвешиванием на панели обзора системы (см. Обзор системы в резервированных системах). Состояние ошибки определяется во время инициализирования и непрерывно обновляется (оптимальное состояние — это 0). Контроль может быть сконфигурирован для всех менеджеров, TCP-соединений, выбранных элементов точек данных, оперативной памяти и объема жесткого диска.

Для активного/пассивного состояния в резервированной системе (пассивный компьютер становится активным, а активный компьютер становится пассивным) применяются следующие приоритеты:

  • Приоритет 1: Отказ

    Полный отказ компьютера или отсутствие каких-либо резервированных сетевых соединений. Если происходит полный отказ резервированных сетевых соединений, больше нельзя переключать управление.
  • Приоритет 2:    Ручное принудительное управление (задать активным)
    С помощью данного приоритета можно переключиться на компьютер, выбранный пользователем, если это еще можно сделать
    через аппаратное и программное обеспечение. Этот приоритет должен рассматриваться в качестве переключения управления. Посредством переключения управления необходимая система сразу же устанавливается активной. Это не независит от состояния ошибки.
  • Приоритет 3:    Иное состояние ошибки

    Отказы связи менеджеров, частичный отказ компьютера (аппаратное или программное обеспечение). Система переключается на компьютер с более низким уровнем состояния ошибки.
  • Приоритет 4: Определение приоритета

    С помощью данного приоритета можно изменить (переключить) активный компьютер вручную. Этот переключатель применяется только в том случае, если оба компьютера работают без ошибок или имеют одинаковое состояние ошибки.

ПРИМЕЧАНИЕ

После переключения (активного/пассивного) на режим резервирования драйвер автоматически инициирует общий запрос!

Если удовлетворены один (или несколько) из приведенных выше критериев переключения, другой компьютер становится активным и принимает на себя управление.

Резервирование работает автономно и не зависит от вводов и ответов пользователя. Тем не менее, определенные вводы от пользователей принимаются (см. приоритеты 2 и 4). Ручное переключение, инициируемое пользователем, должно выполняться на панели обзора системы.  

При отказе определенных менеджеров возникают следующие ответы:

  • Выполняется полный перезапуск проекта и восстановление, когда происходит отказ менеджера событий, менеджера данных, менеджера архива и менеджера резервирования.
  • Все другие менеджеры перезапускаются или не выполняются никакие действия в зависимости от конфигурации на консоли.

ПРИМЕЧАНИЕ

Реакция отдельного менеджера зависит от настройки типа запуска на консоли (см. раздел Управление менеджерами). По умолчанию тип запуска менеджера данных, менеджера событий, менеджера архива и менеджера резервирования установлен на «always» («всегда») и не может быть изменен для обеспечения надлежащей работы в случае резервирования!

ПРИМЕЧАНИЕ

Если партнеры по резервированию резервированного проекта теряют соединение друг с другом, оба проекта «КАСКАД Цифра» становятся активными.  После повторного установления соединения друг с другом система останавливает проект с наивысшим уровнем состояния ошибки, и происходит перезапуск проекта. С помощью конфигурационного параметра useOfflineErrorstateInfo при расчете состояния ошибки также может быть учтен максимальный уровень состояния ошибки «офлайн».

В случае ошибки соединения во время запуска (из-за превышения времени ожидания) пассивный сервер будет пытаться выполнить перезапуск до тех пор, пока соединение не будет успешно установлено. Это предотвращает оба сервера от переключения на активный режим.

ВНИМАНИЕ!

В случае переключения резервирования заново перезапускаемый одноранговый узел должен быть установлен активным только по истечении наиболее важного периода (например, сначала через 1 час). Таким путем предотвращается потеря значений статистических функций.

ВНИМАНИЕ!

Локальные пользовательские интерфейсы (UI) должны запускаться с фиксированными номерами менеджеров (например, «-num 2») для предотвращения проблемы с удаленными UI в случае потери соединения резервированной системы. Если номер не задан, то UI запускается, к примеру, с номером 3. После этого происходит отказ системы, и, следовательно, номер 3 освобождается, и будет использоваться удаленным UI запускаемой в это время резервированной системы. Если остановленная система запускается вновь и повторно устанавливает соединение, UI с номером 3 не может быть запущен в виду того, что номер 3 уже используется.
Кроме того, для задания начального номера для автоматически назначаемых номеров менеджеров может использоваться конфигурационный параметр  lowestAutoManNumUI.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *