Операционная система — это совокупность маленьких решений, повторяющихся каждый день.

Технологическая компания держится не на героических подвигах, а на ежедневных процессах. Когда эти процессы устойчивы, инциденты становятся редкими и быстро разрешаемыми. Когда они хрупки — всё держится на личной героике, что неустойчиво.

sys · daily
S.01

Ежедневная синхронизация

Короткая планёрка дежурной смены: на текущий момент, что критично, что в очереди, кто отвечает. 12–15 минут максимум. Без презентаций, без слайдов.

sys · weekly
S.02

Еженедельный разбор

Раз в неделю — обзор метрик, инцидентов, накопленного технического долга. Час, формат — структурированный разговор.

sys · monthly
S.03

Месячный аудит

Проверка соответствия документации текущему состоянию инфраструктуры.

sys · quarterly
S.04

Квартальный пересмотр

Ревизия архитектурных решений — что устарело, что требует замены.

sys · annual
S.05

Годовая стратегия

Один документ на 6–10 страниц о направлении технологической эволюции на следующие 12 месяцев.

// чек-лист зрелости

Десять признаков зрелой операционной системы.

Команды, у которых все десять пунктов закрыты, тратят на координацию в 3–4 раза меньше времени, чем команды с пятью и менее закрытыми пунктами. Это эмпирическое наблюдение, основанное на работе с 18 командами в 2023–2026 годах.

01.
Документация в репозитории, не в Wiki-системе
Документация версионируется вместе с кодом, проходит ревью, не зависит от внешнего сервиса.
OK
02.
Каждый сервис имеет владельца
Не команду — конкретного инженера. Команды размываются, конкретные люди — нет.
OK
03.
On-call ротация задокументирована
Расписание видно за 4 недели вперёд. Никто не получает дежурство в день дежурства.
OK
04.
Runbook'и не старше 6 месяцев
Если runbook не пересматривался — он скорее всего уже не отражает реальности.
OK
05.
Канарейные релизы
Никакое значимое изменение не выкатывается на 100% трафика сразу.
OK
06.
Метрики продукта рядом с метриками платформы
Дашборды показывают и техническое, и продуктовое здоровье одновременно.
OK
07.
Postmortem без обвинений
Разбор инцидентов сосредоточен на системе, а не на людях. Это требует культурной работы.
OK