Восстановление после сбоев и как уберечь свои данные¶

Наша инфраструктура многократно резервирована, чтобы сберечь Ваши данные на случай аварии. Даже в случае стихийного бедствия, уничтожившего дата-центр мы всё равно сможем восстановить Ваш сайт. Ниже пречислено, как мы подготовились на случай самых плохих ситуаций.

Восстановление после сбоев¶

Мы используем Amazon Web Service, Google Cloud Platform, Yandex Cloud, OVH и другие.¶

Мы используем много различных платформ, которые дублируют друг-друга и все эти компании являются большими провайдерами. Их дата-центры не только являются передовыми и способны противостоять различным сбоям и бедствиям, так же на их мощностях работают такие сервисы как Amazon, Google apps, Yandex и много других известных международных компаний.

Автоматические резервные копии проектов¶

Мы делаем резервные копии проектов каждые 24 часа и храним их в течении семи дней. Поэтому, в случае инцидента не связанного с инфраструктурой, всегда можно восстановить сайт из резервной копии. Мы сделаем это в кратчайшие сроки по Вашему обращению. А если Вам нужны другие условия резервного копирования - не стесняйтесь обратиться к нам.

Снапшоты¶

В дополнение к резервным копиям мы делаем снапшоты дисков сервера каждые 12 часов и храним их сутки. В случае, если резервная копия сайта по каким-то причинам не подойдёт, можно будет восстановить весь сервер целиком.

Мы постоянно следим за состоянием серверов и сайтов¶

Мы проверяем состояние сайтов каждую минуту. Так же, мы постоянно следим примерно за 300 показателями сервисов и серверов и 50 аппаратными показателями. Это передает в наш мониторинг 1440 проверок веб-параметров и 250 000 измерений с каждого сервера в сутки. На основе этих данных наши системы делают прогнозы (а так же мы используем эти данные для обучения ИИ), которые позволяют нам реагировать на инциденты раньше, чем Ваши клиенты заметят, что что-то идёт не так. Другими словами, мы развиваем наш мониторинг, чтобы реагировать на инциденты, которые ещё не случились.

Мы информируем Вас¶

Мы информируем Вас через почту и сообщения в блоке заявок Scalesta по поводу любых проблем, касающихся Вашего проекта. Ещё мы предоставляем оповещения в Slack и Telegram на тарифах Cloud и Scalable hosting solution. Так же мы размещаем в Scalesta анонсы о предстоящих событиях нашей инфраструктуры или о глобальных проблемах, которые могут отразиться на Вашем сайте.

План восстановления¶

Шаг 0: Начало инцидента (00:00)
- Попытка исправить ситуацию с помощью автоматических методов
Шаг 1: Уведомление дежурного специалиста (01:00)
- Начало работы над инцидентом, определение причин
- Уведомление клиента о критических проблемах
Шаг 2: Определение первопричины инцидента, планирование работ и оценка времени (05:00)
- Уведомление клиента
Шаг 3: Утверждение окончательного плана восстановления (15:00)
- Рекомендации клиенту
- Получение дополнительных доступов от клиента, необходимых для работы
Шаг 4: Предфинальная оценка ситуации (30:00)
- Предварительная оценка ситуации, основанная на информации от мониторига
- Ожидание дополнительных доступов
- Восстановление после стихийных бедствий переходит в статус "в работе"
Шаг 5: Начало восстановительных работ (45:00)
- Начало восстановления проекта на новом сервере из ближайшей резервной копии
После инцидента (45:00+)
- Описание причин и проведённых работ
- Рекомендации по предотвращению подобных случаев