Бюджет инфраструктуры после product‑market fit для основателей
Спланируйте бюджет инфраструктуры после product‑market fit, разделив расходы на хостинг, логи, CI, инструменты поддержки и безопасность.

Почему бюджет растёт после product‑market fit
Расходы на инфраструктуру обычно растут быстрее, чем основатели ожидают после product‑market fit. Внешне продукт может выглядеть так же, но объём работы за ним меняется, когда использование становится постоянным.
При небольшой нагрузке небольшие потери едва заметны. Неправильные индексы в базе, логи, которые хранятся вечно, тестовые задания, запускающиеся слишком часто, или бэкапы в неправильном классе хранения могут добавить всего пару долларов. Когда нагрузка удваивается или утраивается, эти привычки превращаются в реальный ежемесячный счёт.
Большинство команд также добавляет инструменты по одному. Сначала хостинг. Затем трекинг ошибок, хранение логов, проверки доступности, минуты CI, реестр контейнеров, доставка почты, чат поддержки, менеджер паролей и инструменты безопасности. Каждое решение кажется незначительным само по себе, поэтому никто не складывает полную картину стека.
Основатели часто закладывают бюджет только на серверы, потому что сервера легко представить. Реальный счёт шире. Растущий SaaS может работать на одной–двух машинах и при этом тратить больше, чем ожидалось, на пайплайны сборки, оповещения, бэкапы и софт для поддержки.
Время тоже должно быть в бюджете. Больше пользователей — больше тикетов, больше неудачных оплат, более странные пограничные случаи и больше напряжения вокруг релизов. Почтовый ящик поддержки, который занимал 20 минут в день, может начать отнимать два часа. Проверки безопасности, которые казались необязательными на ранних этапах, становятся регулярной работой, когда клиенты спрашивают про контроль доступа, журналы аудита и реагирование на инциденты.
Именно здесь многие команды попадаются. Они считают инфраструктуру только хостингом, тогда как это на самом деле все системы и каждый час, нужный чтобы продукт работал.
Разнесите каждую статью расходов по правильным корзинам
Одна строка «инфраструктура» годится некоторое время, а затем скрывает то, что действительно дорожает. Когда продукт растёт, разделите бюджет на корзины, чтобы видеть, что масштабируется с пользователями, что с командой, а что остаётся относительно постоянным.
Чёткое разделение обычно выглядит так:
- Хостинг: app‑серверы, воркеры, базы данных, кэши
- Хранилище и трафик: объектное хранилище, дисковое пространство баз, бэкапы, исходящий трафик
- Наблюдаемость: логи, метрики, проверки доступности, трекинг ошибок, оповещения
- Доставка: раннеры CI, минуты сборки, хранилище артефактов, реестр контейнеров
- Операции команды: инструменты поддержки, системы on‑call, статус‑страницы, управление доступом, инструменты безопасности
Это звучит просто, но меняет мышление. Рост вычислений означает одно. Рост хранилища — другое. Исходящий трафик может взлететь по причинам, не связанным с CPU. Бэкапы должны быть рядом с хранилищем, а не теряться внутри общей облачной строки.
Логи и метрики заслуживают отдельной корзины, потому что они могут расти быстро. Трекинг ошибок тоже должен стоять отдельно. Если одна шумная публикация удваивает объём событий, вы хотите увидеть это сразу, а не обнаружить в конце месяца.
Затраты на CI тоже прячутся на виду. Считайте время раннеров, минуты сборки, кеши, хранилище артефактов и инструменты релизов вместе. Команда, которая тестирует каждый pull request, может тратить деньги задолго до того, как трафик в продакшене станет большим.
То же самое относится к инструментам, которые делают бизнес работоспособным и безопасным: софт для поддержки, пейджинг, статус‑страницы, SSO, менеджеры паролей, хранилища секретов и базовый сканинг безопасности. Эти инструменты редко рушат бюджет по отдельности. Вместе — могут.
Соберите реальные числа прежде чем что‑то оценивать
Большинство основателей ошибается, делая прогнозы слишком рано. Открывают калькулятор облака, вписывают несколько размеров серверов и называют это бюджетом. Как правило, это ломается при изменении использования в первый же месяц.
Начните с спроса, а не с вендоров. Оцените, сколько людей будет пользоваться продуктом в ближайшие два квартала, а не только сегодня. Рост после product‑market fit неравномерен, поэтому сделайте два сценария: базовый месяц и загруженный месяц.
Затем выпишите операционные числа, которые действительно управляют расходами. Вам нужны ежемесячно активные пользователи на следующие шесть месяцев, ежедневный объём в единице, подходящей для вашего продукта, текущий объём данных и ежемесячный рост, частота деплоев, число тест‑прогонов на один деплой и нагрузка поддержки. Нагрузка поддержки должна включать объём тикетов, сколько сотрудников нужно допускать к инструментам и скорость обещанного ответа.
Небольшой SaaS может выглядеть дешёвым, пока вы не посчитаете сопутствующую работу. Десять деплоев в неделю с полными тестами могут стоить дороже одного app‑сервера. Ящик поддержки с двумя агентами и обещанием быстрого ответа требует инструментов, покрытия и времени. Логи часто растут быстрее, чем основатели ожидают, когда реальные клиенты пользуются продуктом каждый день.
Держите всё в одной таблице. Для каждого числа — своя строка, укажите источник и отметьте, измерено это или предположение. Если у вас есть продакшн‑данные, используйте последние 30–60 дней. Если нет — запишите реалистичное предположение вместо того, чтобы притворяться, что оценка точна.
Такая подготовка убирает много эмоций из бюджетирования. Вы перестаёте спорить о ценах вендоров в рамках абстракции и начинаете покупать под ту нагрузку, которую реально ожидаете.
Стройте бюджет шаг за шагом
Начните с двух версий месяца, а не одной. Возьмите обычный месяц из последних 60–90 дней, затем смоделируйте более загруженный месяц в 1.5x–2x трафика, объёма заданий и нагрузки поддержки. Это сразу приближает бюджет к реальности.
Далее собирайте таблицу по корзинам и назначьте владельца каждой корзине. Ваш инженерный лидер может отвечать за хостинг и CI. Лид поддержки — за инструмент помощи. Основатель или операционный сотрудник — за продления безопасности и утверждение вендоров. Когда у каждой строки есть владелец, скрытые расходы проявляются раньше.
Для каждой корзины запишите ежемесячную стоимость и фактор, который её увеличивает. Сначала установите ретеншн для логов, метрик, бэкапов и артефактов сборки. Политика хранения логов на 30 дней и артефактов на 7 дней может изменить счёт сильнее, чем смена вендора.
Не забывайте учитывать время инженеров. Если релизы занимают шесть часов в неделю, инциденты — четыре часа в месяц, а рутинное обслуживание — ещё восемь, это время должно быть в операционном бюджете как и всё остальное. Дешёвые инструменты, которые отнимают два дня работы инженера в месяц, на самом деле не дешёвые.
Добавьте небольшой запас, обычно 10–15%. Всплески трафика, упавшие задания, шумные оповещения и простые ошибки случаются. Бюджет без запаса — это просто фантазия.
Держите первую версию простой. Одна таблица, один владелец на строку, два сценария трафика и буфер — достаточно, чтобы защитать бюджет.
Оцените хостинг по нагрузке, хранилищу и бэкапам
Многие основатели кладут весь хостинг в одну строку облака. Это работает для крошечного продукта. Перестаёт работать, когда использование становится постоянным и счёт начинает меняться каждый месяц.
Начните с окружений. Продакшн несёт реальный трафик. Staging — для тестирования релизов. Внутренние инструменты поддерживают команду, но обычно не требуют той же доступности или масштаба. Если вы оцениваете их вместе, вы либо перестроите дешёвые части, либо недооцените дорогую.
Затем разделите основные сервисы. База данных растёт с записями, запросами и бэкапами. Кэш зависит от паттернов трафика и требований к времени отклика. Объектное хранилище растёт с загрузками, экспортами и ретеншном. Эти расходы растут по разным причинам, поэтому одна грубая оценка вряд ли точна.
Бэкапы требуют своей строки. Считайте место под бэкапы, ретеншн снимков и время на тестирование восстановления. Многие команды платят за бэкапы месяцами, не проверяя, работает ли восстановление. Прогон восстановления несколько раз в год занимает время, и оно должно быть в бюджете.
Сетевые расходы удивляют людей сильнее, чем вычисления. Пропускная способность, использование CDN и исходящий трафик могут резко вырасти, когда клиенты скачивают отчёты, изображения или большие файлы. SaaS с управляемым счётом за серверы всё ещё может получить удар по трансфер‑счёту.
Полезно также отметить, что действительно должно работать постоянно. В большинстве случаев это значит продакшн‑серверы, база данных, мониторинг и задания бэкапа. Staging, preview‑приложения, батч‑воркеры и некоторые внутренние инструменты часто можно запускать по расписанию или масштабировать вниз, когда ими никто не пользуется. Это снижает траты ещё до переговоров с вендорами.
Установите лимиты для логов, метрик и оповещений
Затраты на наблюдаемость растут тихо. Каждый новый пользователь, API‑вызов, фоновая задача и ошибка создают больше данных. Если хранить всё навсегда, эта часть бюджета может расти быстрее, чем хостинг.
Начните с ретеншна. Большинству команд не нужно одинаковую историю для всех сигналов. Логи приложений могут храниться 7–30 дней. Метрики обычно полезны дольше, потому что помогают в анализе трендов и планировании ёмкости. Журналы аудита и безопасности могут требовать отдельной политики в зависимости от требований клиентов или комплаенса.
Не отправляйте каждую строку лога в полном объёме. Сэмплируйте шумные события до роста трафика. Health‑checks, повторяющиеся сообщения об успехе и отладочный вывод могут наводнить счёт, не помогая никому решать реальные проблемы. Храните детальные логи для ошибок, медленных запросов и редких краёв. Для рутинных 200‑ок ответов обычно достаточно сводки.
Держите продуктовую аналитику отдельно от системных логов. «Пользователь нажал кнопку» относится к аналитике. «База данных тайм‑аутится» — к наблюдаемости. Смешивание делает дашборды грязными и ценообразование труднопредсказуемым.
Также бюджетируйте инструменты вокруг данных, а не только место хранения. Трекинг ошибок, дешборды и доставка оповещений стоят денег. Лёгкий стек может работать хорошо, если вы заранее зададите ретеншн и лимиты на ingestion. Если нет — проблема чаще в объёме данных, а не в инструменте.
Оповещайте по сигналам, на которые команда действительно отреагирует:
- рост ошибок выше нормального уровня
- длительное замедление ответов (несколько минут)
- продолжительный рост очередей
- приближение к лимитам диска, памяти или базы данных
- провал путей, приводящих к выручке (регистрация, оплата и т.п.)
Каждое оповещение должно иметь владельца и чёткое действие. Если оповещение будит человека и его игнорят три раза подряд, удалите или перепишите его.
Посчитайте реальную стоимость CI и релизов
Счета за CI кажутся маленькими сначала, но растут быстро по мере того, как команда чаще шипит. Основатели замечают платёж, но упускают стоимость ожидания сборок, повторных запусков упавших задач и поддержания инструментов релиза каждую неделю.
Делите минуты сборки на две корзины: обычная неделя и неделя релиза. В спокойную неделю команда может использовать 3 000 минут, а при горячих исправлениях, регресс‑тестах и сборке нескольких веток — 8 000. Если учитывать только среднюю неделю, сумма будет сдвигаться.
Быстрая обратная связь тоже стоит денег. Параллельные задания сокращают время ревью, но увеличивают расходы, потому что одновременно используются более дорогие раннеры. Эта компромис часто оправдан, когда несколько разработчиков ждут по 15 минут каждой проверки pull request.
Реалистичная оценка должна включать минуты сборки для обычной работы, дополнительные минут для недель релизов и хотфиксов, хранилище артефактов, превью‑среды и инструменты вокруг аппрувалов, откатов и подписи приложений.
Хранилище артефактов обычно прячется до тех пор, пока старые сборки не накопятся. Превью‑среды делают то же самое. Если каждая ветка поднимает базу, сервер и кэш на два дня, месячный итог быстро растёт.
Медленные пайплайны стоят и зарплатой. Если нестабильные тесты заставляют каждого разработчика несколько раз в день перезапускать задачи, это потеря рабочего времени, а не просто раздражение от инструмента. Десять минут в день на человека превращаются в десятки оплачиваемых часов в месяц.
Полезная проверка — сопоставить стоимость инструментов с экономией времени команды. Лучший раннер, чистое разделение тестов или self‑hosted пайплайн могут увеличить строку инструментов, но снизить общие операционные расходы.
Бюджетируйте инструменты поддержки и базовую безопасность
Поддержка и безопасность кажутся небольшими сначала. После product‑market fit они перестают быть опциональными. Если клиенты ожидают быстрых ответов и стабильного аптайма, бюджету нужно место для инструментов, которыми команда пользуется ежедневно.
Начните с поддержки. Большинству команд нужен ящик тикетов, командный чат, статус‑страница и иногда инструмент для звонков в срочных случаях. Эти продукты обычно тарифицируются по месту, по активному агенту или по использованию. Считайте реальных пользователей, а не просто общий почтовый ящик. Если нужен доступ четырём людям — это четыре места.
Базовая безопасность требует своих строк. Менеджер паролей дешевле утечки админского логина. SSO и MFA добавляют заметную единицу на пользователя, когда подрядчики, советники и часть‑временные сотрудники требуют доступа. Проверки зависимостей и сканирование уязвимостей тоже стоят денег — либо как подписки, либо как дополнительное время в CI.
Не останавливайтесь на подписках. Ревью доступа отнимает время. Кто‑то должен удалять старые аккаунты, проверять права администратора и подтверждать, кто ещё нуждается в доступе в продакшн. Репетиции инцидентов тоже требуют времени. Даже короткая тренировка раз в квартал отвлекает инженеров и менеджеров на несколько часов.
Для многих маленьких команд SaaS счёт за инструменты — только часть расходов. Другая часть — повторяющаяся работа по поддержанию чистоты настройки.
Простой пример бюджета для растущего SaaS
Возьмём B2B SaaS, который растёт с 50 до 400 платящих клиентов за год. Приложение становится активнее, но более значительная перемена — как работает команда. Основатель и два инженера раньше пушили обновления по возможности. Теперь команда шипит три раза в неделю, поддержка переходит из одного ящика в общий инструмент, и клиенты ожидают более быстрых ответов.
Когда компания достигает 400 клиентов, грубый месячный бюджет может выглядеть так:
- Хостинг, база и кэш: $1,800
- Бэкапы и файловое хранилище: $350
- Логи, метрики и оповещения: $900
- Раннеры CI, минуты сборки и хранилище артефактов: $600
- Места в инструменте поддержки: $240
- Базовое обеспечение безопасности: $300
Итого примерно $4,190 в месяц.
Удивление обычно не в сырых вычислениях. Многие основатели предполагают, что сервера будут самой большой статьёй, но логи и CI часто растут быстрее. Больше клиентов — больше событий. Больше релизов — больше сборок, прогонов тестов и сохранённых артефактов. Если каждый деплой запускает полный набор тестов и держит логи 30 или 90 дней, счёт тихо ползёт вверх.
Поддержка тоже меняется. Один общий почтовый ящик работает при 50 клиентах. При 400 он начинает ломаться, особенно когда продажи, поддержка и инженеры нуждаются в контексте. Общая система help‑desk с несколькими платными местами на этом этапе нормальна: она экономит время и уменьшает потерянные сообщения.
Первая версия бюджета обычно пропускает две вещи: ретеншн и рост числа мест. Команды оценивают инструменты на сегодняшний день и забывают, что логи хранятся дольше, бэкапы накапливаются, и больше людей требуется доступ к CI, поддержке, мониторингу и инструментам безопасности.
Ошибки, которые раздувают счёт
Самый быстрый путь потерять контроль над расходами — купить для компании, которой вы хотите стать, а не для той, что у вас есть сейчас. Основатели часто переходят на корпоративные планы, потому что это кажется безопаснее. Чаще всего они платят за места, ретеншн или условия аптайма, которые им пока не нужны.
Маленький SaaS с несколькими тысячами активных пользователей обычно не нуждается в премиальном хостинге, топ‑раннерах CI и самой дорогой системе поддержки с первого дня. Начните с плана под текущую нагрузку, а триггеры обновления установите чётко. Если CPU держится высоко неделями, бэкапы занимают слишком много времени или объём поддержки удваивается — апгрейд сделайте по причине.
Ещё одна частая утечка — хранить всё навсегда. Логи — обычная проблема. Команды включают полный debug, забывают про это и платят месяц за месяцом за шум, который никто не читает. Метрики могут повторить ту же историю, если каждый сервис эмитит слишком много деталей.
Несколько ошибок встречаются снова и снова: держать полный стек staging весь месяц, когда тестирование происходит только перед релизами; игнорировать время инженеров на починку нестабильных деплоев и пайплайнов; считать безопасность одноразовой покупкой; платить за дублирующие инструменты, потому что никто не отвечает за стек целиком.
Трудозатраты легко пропустить. Если два инженера тратят по часу дважды в неделю на борьбу с CI, это реальные расходы. Безопасность работает так же: ревью доступа, патчи, ротация секретов, проверки бэкапов и мониторинга требуют времени каждый месяц.
Здесь часто помогает внешний обзор. На oleg.is Oleg Sotnikov предлагает услуги fractional CTO для стартапов и небольших компаний, которые хотят привести в порядок архитектуру, инструменты или инфраструктуру до того, как потери превратятся в постоянную привычку.
Короткий чек‑лист перед утверждением
Бюджет может выглядеть аккуратно в таблице и развалиться в первом же загруженном месяце. Большинство перерасходов приходит от мелочей: дополнительные места, более длинный ретеншн логов, больше минут сборки или инструмент поддержки, который платит за агента.
Перед утверждением проверьте пять вещей:
- Назначьте владельца для каждой статьи расходов.
- Запишите, что делает каждую платёжку больше.
- Установите жёсткие лимиты там, где рост легко пропустить.
- Сравните средний месяц с тяжёлым.
- Просматривайте числа ежемесячно, а не раз в квартал.
Это особенно важно после product‑market fit, потому что рост редко идёт плавно. Команда может планировать $4,000 в месяц и оказаться на $5,200 после цикла релизов, очереди поддержки и шквала логов от одной ошибки. Ежемесячные проверки ловят это, пока исправление ещё маленькое.
Что делать дальше
Поместите весь бюджет в одну таблицу. Одна строка на инструмент, один владелец, одна ежемесячная стоимость и короткая заметка, зачем это нужно. Если у инструмента нет владельца или никто не может объяснить его одной фразой — вырежьте его.
Затем посмотрите на три статьи, которые растут быстрее всего. Для большинства SaaS это хостинг, логи и CI. Если одна из этих строк растёт быстрее, чем активные пользователи, начните с неё. Растущий счёт обычно указывает на шумные логи, ненужные минуты сборки, слишком большие серверы или бэкапы, которые никто не проверял.
Устраняйте перекрытия рано. Основатели часто платят за два инструмента, выполняющие почти одну и ту же работу: дублирующий мониторинг, несколько почтовых ящиков поддержки или надстройки по безопасности, которые повторяют функциональность облачного провайдера. Маленькие утечки превращаются в реальную ежемесячную нагрузку.
Лёгкий ежемесячный обзор работает хорошо: обновите таблицу, отметьте три основных драйвера затрат, удалите дубликаты, установите лимит на траты для нового вендора и пересмотрите ежегодные контракты до их продления.
Если расходы растут быстрее использования больше месяца или двух, проблема обычно не в ценах вендоров. Проблема в архитектуре, выборе инструментов или слабых лимитах. Здесь fractional CTO может сэкономить деньги, починив систему, а не ведя переговоры вокруг краёв. Oleg Sotnikov делает такие ревью через oleg.is, особенно для команд, которым нужно опытное техническое руководство без найма CTO на полную ставку.
Часто задаваемые вопросы
Когда стоит составить первый реальный бюджет инфраструктуры после product market fit?
Соберите его, как только использование начнёт ощущаться стабильным и клиенты будут ждать надёжного сервиса. Если у вас есть product-market fit, грубая оценка серверов уже недостаточна: инструменты, поддержка, бэкапы и накладные расходы на релизы начинают влиять на счёт каждый месяц.
Какие расходы основатели обычно пропускают?
Чаще всего упускают логи, трекинг ошибок, минуты CI, хранилище артефактов, бэкапы, места в системах поддержки и инструменты безопасности. Также забывают учитывать часы инженеров на релизы, инциденты, ревью доступов и проверки восстановления.
Оставлять ли одну большую строку «инфраструктура»?
Нет. Разделите бюджет на понятные блоки: хостинг, хранилище, наблюдаемость, доставка, поддержка и безопасность. Так видно, что растёт с пользователями, что — с командой, и где появляется раздутость.
На какой период прогнозировать использование?
Планируйте минимум на ближайшие два квартала. Возьмите текущие числа и постройте два сценария: обычный месяц и пиковый, чтобы не оценивать стек только на сегодняшний день.
Как учитывать в бюджете пиковые месяцы?
Смоделируйте с самого начала две версии месяца. Простой подход — обычный месяц и более тяжёлый при 1.5x–2x трафика, объёма задач и нагрузки поддержки, затем добавьте буфер 10–15%.
Почему логи и метрики так быстро дорожают?
Они растут с каждым запросом, задачей и ошибкой, а команды часто хранят слишком много данных слишком долго. Установите ретеншн заранее, уменьшайте объём шумных событий и держите продуктовую аналитику отдельно от системных логов, чтобы объём не вышел из-под контроля.
Как оценить затраты на CI и релизы?
Считайте минуты сборки отдельно для обычных недель и для недель релизов. Учтите повторные прогоняния тестов, хранилище артефактов, превью-среды и время, которое теряют разработчики из‑за медленных или ненадёжных пайплайнов.
Нужна ли отдельная статья бюджета для бэкапов?
Да. Выведите бэкапы в отдельную строку: место для хранения, ретеншн снимков и время на тестовые восстановления. Бэкап, который вы никогда не проверяете, всё равно ежемесячно стоит денег и может провалиться в момент, когда он понадобится.
Сколько инженерного времени включать в бюджет?
Включайте это каждый месяц. Если релизы, реагирование на инциденты, поддержание и проверки доступа отнимают часы, они должны быть в операционных расходах так же, как и платёжки за инструменты.
Когда стоит обратиться к fractional CTO для ревью стека?
Привлекайте эксперта, когда траты растут быстрее использования, инструменты дублируются или никто не отвечает за стек целиком. Хорошее ревью обычно находит потери в логировании, CI, подборе размеров серверов, бэкапах и рабочих процессах до того, как эти практики закрепятся.