Вы хотите стать A-player в своей компании? Тем самым сотрудником, чья ценность мгновенно возрастает в два раза? Секрет прост: научитесь решать проблемы «под ключ». Особенно те, которые другие называют нерешаемыми.
В мире бизнеса есть особая каста специалистов — траблшутеры (от англ. trouble — беда, shooter — стрелок). Это люди, которые «отстреливают» проблемы. Разберем, кто это такие, чем они отличаются от кризис-менеджеров и какими инструментами пользуются, чтобы потушить пожар за 24 часа.
Траблшутер vs Кризис-менеджер: в чем разница?
Многие путают эти понятия, но это принципиально разные роли с разным горизонтом планирования и инструментарием.
Траблшутер (пожарный)
- Метафора: специалист на случай пожара. Приезжает, локализует огонь, ставит временную заплатку и спасает узел.
- Фокус: точечный (конкретный процесс, функция, сбой на складе, падение сайта).
- Горизонт времени: часы и дни (Day 0, Day 1).
- Метрики успеха: MTTR (время до восстановления), снижение ущерба.
- Инструменты: Warroom, SAVE 24, Change Sweep.
Кризис-менеджер (капитан корабля)
- Метафора: антикризисный управляющий, который спасает весь тонущий лайнер.
- Фокус: широкий периметр (вся компания, репутация, ликвидность).
- Горизонт времени: недели и месяцы.
- Метрики успеха: жизнеспособность бизнеса, Cash Flow, репутация.
- Инструменты: антикризисная программа, реструктуризация, работа с инвесторами.
Главное правило
- Траблшутер чинит узел быстро и предметно.
- Кризис-менеджер спасает систему целиком.
- Часто они работают в связке: траблшутер гасит острые очаги, а кризис-менеджер выстраивает долгосрочную стратегию выхода из пике.
Problem или Trouble? Как понять, когда бить тревогу
Не каждая сложность — это Trouble.
- Problem (проблема): плановая задача, риск контролируем, ущерб ограничен, время терпит.
- Trouble (Беда): аварийная ситуация, ущерб растет ежечасно, срок горит, затронуты ключевые клиенты.
Инструмент SAS 3H + Trouble Gate
Чтобы за 2 минуты понять, с чем вы имеете дело, используйте скоринг SAS. Оцените ситуацию по шкале от 1 до 4 в трех направлениях:
- Severity (Тяжесть): от неудобства (1) до остановки критического процесса и юр. рисков (4).
- Urgency (Срочность): от «терпит неделю» (1) до «точка невозврата через 24 часа» (4).
- Spread (Масштаб): от одного сотрудника (1) до всей компании/ключевых клиентов (4).
Подсчёт и класс инцидента: сумма S+U+S → класс & режим
•9–12 = P1 (Trouble): красный режим: SAFE-24, частые апдейты, DO назначен
•7–8 = P2 (Trouble): оранжевый: containment сегодня, план фикса — завтра
•4–6 = P3 (Problem): стандартный трек, слот на разбор в ближайшие 3 дн
•3 = P4 (Problem): backlog/наблюдение
•9–12 = P1 (Trouble): красный режим: SAFE-24, частые апдейты, DO назначен
•7–8 = P2 (Trouble): оранжевый: containment сегодня, план фикса — завтра
•4–6 = P3 (Problem): стандартный трек, слот на разбор в ближайшие 3 дн
•3 = P4 (Problem): backlog/наблюдение
Trouble Gate: сложите баллы.
- 7+ баллов: Это Trouble (P1 или P2). Включаем режим траблшутинга.
- Меньше 7: Это Problem (P3 или P4). Решаем в плановом порядке.
4 шага работы Траблшутера
Работа траблшутера — это не хаос, а четкий алгоритм.
Шаг 1. Локализовать (стабилизировать)
Цель: Остановить «кровотечение» (ущерб).
Здесь мы применяем тактику Day 0. Не пытайтесь сразу найти причину и идеальное решение. Сначала — жгут для остановки кровопотери.
Инструмент SAVE 24 (Playbook для Day 0)
Это чек-лист действий на первые 24 часа:
- S (Stop the bleeding): изолируйте зону поражения. Отключите интеграцию, остановите отгрузки, введите троттлинг.
- A (Alert): уведомьте всех по схеме, назначьте DO (Decision Owner — владельца решения).
- F (Freeze changes): заморозьте все изменения. Никаких новых релизов, деплоев или смены процедур, пока пожар не потушен.
- E (Eye / Monitor): включите мониторинг. Выведите 3-5 индикаторов (опережающих и отстающих) на дашборд.
- Workaround: внедрите временный «костыль» (ручной процесс, альтернативный подрядчик).
- Log: ведите журнал действий. Это база для будущего разбора полетов.
Шаг 2. Найти причину (Диагноз)
Цель: Поставить быстрый диагноз, как Доктор Хаус.
Инструмент Change Sweep (6D)
Что изменилось перед тем, как всё сломалось? Проверьте 6 доменов за 15 минут:
- People: смены, новые сотрудники, увольнения?
- Process: новые инструкции, регламенты, графики?
- Platform: релизы, патчи, обновления ПО?
- Data: импорт данных, пересчет стоков, изменение мастер-данных?
- Policy: новые правила, скидки, условия возвратов?
- Environment: погода, внешние события, действия поставщиков?
Инструмент Event Timeline Builder
Постройте хронологию (как в сериале «Чернобыль»). Восстановите события поминутно от первых симптомов до пика. Наложите изменения (из Change Sweep) на график метрик. Там, где изменение совпадает со всплеском проблемы — ваша гипотеза.
Шаг 3. Предложить решение
Цель: Выбрать самое быстрое и безопасное решение.
Оцените варианты по матрице: Влияние / Риск / Трудозатраты / Обратимость. Выбирайте то, что дает максимальный эффект при минимальном риске.
Шаг 4. Внедрить под контролем
Цель: Аккуратно включить решение, избегая побочных эффектов.
Используйте пилотные группы, канареечные релизы. Не размораживайте контур (Freeze), пока не убедитесь в стабильности.
Управление хаосом: Коммуникация и Ответственность
Инструмент RACI + DO
В момент кризиса демократия не работает. Должен быть один DO (Decision Owner) — человек с мандатом на финальное решение «здесь и сейчас».
Заполните матрицу RACI для инцидента, четко определив, кто делает (R), кто отвечает (A = DO), кто помогает (S).
Инструмент STIC (Формат апдейтов)
Чтобы не создавать панику, коммуницируйте четко и регулярно (каденция апдейтов). Используйте формат STIC:
- S (Situation): Факты и метрики сейчас.
- T (Task): Что делаем прямо сейчас.
- I (Intent): Зачем делаем? Ожидаемый эффект.
- C (Concern): Риски и блокеры. Что мешает?
- C (Calibration): Чего ждем? Когда следующий апдейт?
Главная ошибка новичков: Прыгать к починке (Fix) без оценки (Triage) и стабилизации (Save). Не будьте героем, который тушит пожар бензином. Будьте системным траблшутером.
Хотите углубиться в тему?
Посмотрите сериал «Чернобыль» — это идеальное учебное пособие по тому, как (не) нужно работать с инцидентами уровня P1.
А лучше рукомендую пройти курс Траблшутер PRO
🚩 Будь тем, кто решает нерешаемое. Не упусти шанс.