Карта инфраструктуры — самый недооценённый артефакт в типовой компании.
Без актуальной карты инфраструктуры расследование инцидентов растягивается на часы. С ней — занимает минуты. Поэтому мы держим карту в актуальном состоянии: она обновляется при каждом изменении продакшна.
матрица узлов
Матричная карта статусов компонентов.
Снимок из живого окружения. Колонки — статусы по четырём средам. Пример учебный, цифры обобщены.
КОМПОНЕНТ
DEV
STAGE
PROD
DR
api-gateway
v.4.12
v.4.12
v.4.11
v.4.11
events-broker
v.2.3
v.2.3
v.2.3
off
primary-db
15.4
15.4
15.3
15.3
cache-cluster
7.2
7.2
7.2
off
audit-log
v.1.8
v.1.8
v.1.8
v.1.8
coordination
3.9
3.9
3.8
3.8
принципы карты
Пять условий рабочей карты инфраструктуры.
01.
Карта живёт рядом с кодом
В том же репозитории, в Markdown. Pull request меняет код и карту одновременно — иначе они начинают расходиться.
02.
Версионирование инфраструктуры
Каждый узел имеет версию. Когда обновлён последний раз, кто отвечает, какие зависимости — фиксируется в YAML-файле.
03.
Граф зависимостей
Автоматически генерируется из YAML. Используется как точка опоры при планировании окон обслуживания и при разборе инцидентов.
04.
Контакты владельцев
Каждый узел имеет владельца. В случае инцидента дежурный знает, к кому обращаться без пары часов в чате.
05.
SLO в карте
Каждый узел имеет публично заявленный SLO. Это меняет дискуссии о доступности с эмоциональных на инженерные.
// infra.snapshot · 11.2026