05 мар. 2025 г.·6 мин чтения

Экономика AI-воркфлоу для стартапов под пристальным вниманием инвесторов

Экономика AI-воркфлоу даёт основателям понятный способ объяснить расходы по задаче, месячному объёму и частоте проверки перед встречами с инвесторами.

Содержание

Почему расходы на AI тревожат инвесторов

Обычно один общий счёт за AI мало что говорит инвесторам. Одна команда может тратить $3,000 в месяц на модели и получать полезные черновики поддержки, резюме продаж, тест-кейсы и внутренние документы в рабочем объёме. Другая — потратить такую же сумму и получить почти только эксперименты. Если в счёте одно число, никто не понимает, с чем имеет дело.

Суммы токенов этого не исправляют. Большинство инвесторов не мыслят в токенах — и не должны. Они думают в работе: сколько ответов клиентам, сколько предложений, сколько баг-репортов, сколько человекочасов. Когда основатель объясняет расходы именно в таких терминах, стоимость перестаёт казаться загадкой.

Есть ещё одна причина, почему расходы на AI вызывают тревогу. Низкий счёт за модели может скрывать дорогой человеческий процесс. Стартап может сказать: "Мы тратим всего $800 в месяц на AI", в то время как сотрудники читают, правят и утверждают каждый вывод построчно. В таком случае реальная стоимость намного выше. Десять минут проверки на 3 000 задач могут стоить гораздо дороже, чем сама модель.

Обратное тоже верно. Более высокий счёт за модель может быть хорошей сделкой, если он устраняет медленные ручные шаги. Платить больше за лучший вывод имеет смысл, когда время проверки падает с восьми минут до двух, или когда один лидер поддержки справляется с вдвое большим объёмом заявок без найма. Инвесторы обычно принимают более высокие программные расходы, когда математика труда прозрачна.

Простой пример показывает разницу. Если AI готовит 5 000 ответов поддержки в месяц, важен счёт модели. Но главный вопрос — тратят ли агенты большую часть дня на переписывание этих черновиков. Если они лишь проверяют крайние случаи и отправляют остальное с лёгкими правками, расходы обеспечивают реальную пропускную способность. Если каждый ответ требует серьёзной доработки, компания мало что купила.

Именно поэтому общий счёт за AI часто создаёт напряжение. Счёт виден, а работа за ним размыта. Когда компания связывает затраты с количеством задач, объёмом и временем проверки, разговор становится гораздо проще.

Сначала выберите единицу работы

Большинство команд начинают слишком широко. "Поддержка клиентов" или "follow-up продаж" звучит удобно, но такие метки скрывают разные задачи, расходы и риски.

Начните с одной повторяемой задачи, которая завершается одним понятным результатом. "Сделать черновой ответ на вопрос по биллингу" работает. "Преобразовать стенограмму звонка продаж в заметку CRM" — тоже. Оба варианта легче оценить, чем целый отдел.

Это важно, потому что экономика имеет смысл только тогда, когда единица работы остаётся стабильной. Если одна задача требует 20 секунд на проверку, а другая — восемь минут, смешивание их даёт аккуратное число, которое почти ничего не говорит.

Запишите, где задача начинается и где заканчивается. Держите всё просто: приходит вход, AI создаёт черновик, человек при необходимости проверяет, и команда отправляет или сохраняет финальную версию.

Эта граница делает две полезные вещи. Она останавливает расползание объёма и не позволяет смешивать подготовительную работу, ретраи и постороннее администрирование в одну и ту же задачу.

Считайте один готовый результат, а не один промпт. Один ответ поддержки может потребовать три промпта, потому что первый черновик был слаб, политика поменялась или клиент добавил контекст. Инвесторов не интересует, сколько раз нажали Enter. Их интересует, сколько стоит один годный результат.

Смешанную работу нужно разделять по корзинам. Ответ на сброс пароля и спор по возврату средств могут оба относиться к поддержке, но не должны иметь одну и ту же модель стоимости, если их проверяют по-разному. То же самое и с заметками по продажам. Простое резюме демо и заметка по критическому корпоративному звонку могут использовать один инструмент, но человек их проверяет по-разному.

Если хотите число, которое выдержит встречу, начинайте с меньшего, чем кажется естественным. Это также распространённый подход Олега Сотникова: оценить одну завершённую задачу, протестировать на реальном объёме, а потом расширять. Так обычно получается чище стоимость AI за задачу, чем усреднение по всей команде.

Измеряйте объём за реальный месяц

Одна спокойная неделя может сделать AI-бюджет вдвое меньше, чем он есть на самом деле. Используйте последние четыре-восемь недель реальной работы, а не аккуратную оценку по памяти.

Берите счётчики из систем, где работа уже происходит. Это могут быть тикеты поддержки, письма продаж, прогоны код-ревью, черновики документов или внутренние запросы. Начните с сырого объёма: сколько раз задача возникала, сколько раз запускалась модель и как часто человеку приходилось вмешиваться.

Месяц обычно достаточен, чтобы показать картину работы. Он отражает обычные дни и одновременно ловит грязные дни, про которые инвесторы спросят, чтобы проверить ваши допущения.

Полезно отделять обычные дни от всплесков при запуске продукта, периодов выставления счетов, сбоев инструментов и месячных пиков. Не усредняйте всё слишком рано. Если команда готовила 80 ответов в будние дни, но 220 в день во время недели запуска, это важно. Бюджету нужны оба числа, потому что в загруженные дни проявляются неожиданные расходы.

Считайте ретраи и неудачные прогоны как реальный объём. Они тоже используют токены, время и внимание персонала. Если воркфлоу требовал три вызова модели, прежде чем получился годный результат, ваша стоимость за задачу основана на трёх вызовах плюс человеческая проверка в конце.

Маленький пример делает это очевидным. Допустим, стартап обработал 1 600 чатов клиентов за шесть недель. На бумаге это кажется управляемым. Но 300 из этих чатов пришли во время двухдневного всплеска запуска, а ещё 12% прогонов провалились или потребовали ретраев. Игнорируете эти два факта — и стоимость AI за задачу кажется гораздо ниже, чем заплатил тим.

Сезонные пики тоже считаются. Запуски продуктов, продления, налоговые дедлайны, праздничные продажи и конец квартала изменяют объём. Отмечайте их в таблице. Когда инвестор спросит, почему расходы выросли в один месяц, вы сможете показать рабочую нагрузку, а не придумывать оправдания.

Честно считайте человеческую проверку

Многие AI-бюджеты выглядят дешёвыми потому, что команды учитывают только токены и пропускают человека, который смотрит результат. Это реальная статья расходов. Если кто-то тратит 40 секунд на чтение, правку и утверждение каждого черновика, это время должно входить в стоимость задачи.

Замеряйте время проверки на уровне задачи, а не по памяти. Используйте секундомер и выборку из 30–50 выводов. Некоторые пройдут за 10 секунд. Другие займут две минуты, потому что проверяющий переписывает предложение, проверяет факт или отсылает менеджеру. Берите среднее по выборке.

Проверка редко — одно действие. Ответ поддержки может пройти быструю ревизию и утверждение, лёгкую правку перед отправкой, полную переработку или эскалацию менеджеру или эксперту. У каждого пути своя стоимость. Если половина черновиков требует правок, это не то же самое, что простой поток утверждений. Если 5% черновиков эскалируются и каждая эскалация занимает шесть минут, эта маленькая доля может добавить к расходам больше, чем сама модель.

Не каждый вывод требует проверки, поэтому используйте показатель review rate. Если каждый ответ клиенту проверяют, ставка равна 1.0. Если команда отбирает одну из четырёх внутренних сводок для проверки, ставка 0.25. Держите отдельную ставку для эскалаций, потому что они медленнее и дороже.

Оценивайте время проверки по реальной «нагруженной» часовой ставке, а не по примерно наугад. Используйте loaded rate: зарплата, налоги, бенефиты и доля накладных расходов, привязанная к роли. Если проверяющий стоит $48 в час и тратит 45 секунд на проверку, то проверка стоит около $0.60 за проверяемый элемент. При ставке проверки 70% средняя стоимость проверки падает до $0.42 за вывод до учёта эскалаций.

В этот момент AI-воркфлоу перестаёт быть смутным экспериментом и становится операционным выбором. Инвесторы видят компромисс. Если стоимость проверки слишком высока, команда может ужесточить задачу, улучшить промпт или направлять на проверку только рискованные кейсы.

Постройте модель стоимости шаг за шагом

Сравнивать модели правильно

Тестируйте качество вывода относительно времени проверки, а не только цены за токен.

Сравнить варианты

Начните с одной завершённой задачи, а не с одного промпта. Инвесторов интересует, сколько стоит получить годный результат, потому что именно это покупает бизнес. Если черновик от AI стоит $0.04, но проходит проверку только половина черновиков, то стоимость готовой задачи не $0.04.

Запишите стоимость модели для одной завершённой задачи. Включите каждый вызов, нужный для завершения работы: основной промпт, ретраи, последующие вызовы и любые вызовы для retrieval или классификации, которые выполняются каждый раз.

Затем добавьте стоимость инструментов, которые появляются при каждом запуске. Это может быть распознавание речи, парсинг документов, векторный поиск или плата за очередь задач. Будьте строги: если расход появляется при каждом запуске задачи — он должен быть в единичной стоимости.

Обычно человекая проверка меняет число сильнее, чем использование модели. Честно считайте минуты проверки, умножьте на часовую ставку труда, затем умножьте на коэффициент проверки. Если лидер поддержки стоит $45 в час, тратит две минуты на проверку ответа и проверяет 60% черновиков, проверка добавляет около $0.90 к задаче.

unit cost = model cost + per-run tool cost + (review minutes x labor cost per minute x review rate)
monthly cost = unit cost x monthly volume

Теперь умножьте полную стоимость единицы на реальный месячный объём. Воркфлоу, который стоит $1.04 за завершённую задачу и запускается 8 000 раз в месяц, стоит $8,320. Это даёт гораздо яснее представление о AI-бюджете стартапа, чем общий счёт по моделям, потому что связывает расходы с результатом.

Затем сравните это с прежним ручным процессом, используя ту же единицу работы. Если раньше человек писал каждый ответ шесть минут при ставке $45 в час, ручная стоимость была $4.50 за задачу. Поставьте два числа рядом: $1.04 с AI против $4.50 вручную. Это переводит вопросы инвесторов о расходах на AI в простой операционный выбор, а не в туманную технологическую статью расходов.

Пример: подготовка ответа поддержки

Стартап обрабатывает 3 000 ответов поддержки в месяц. Вместо вопроса, стоит ли AI "играть роль", выпишите один воркфлоу и оцените его как обычный операционный выбор.

Предположим, модель пишет каждый первый черновик. Люди не проверяют все черновики. Они смотрят 40%, то есть 1 200 ответов. Ещё 10% требуют дополнительной доработки, либо второго прохода, либо эскалации к более опытному сотруднику.

Item	Volume	Unit cost or time	Monthly cost
AI first draft	3,000 replies	$0.03 each	$90
Agent review	1,200 replies	2 min each	40 hours
Second pass or escalation	300 replies	6 min each	30 hours

Если время агента стоит $30 в час, человеческая часть — $2,100 в месяц. Добавьте стоимость модели, и сводная сумма примерно $2,190.

Теперь сравните это с полной ручной подготовкой. Если агент тратит шесть минут на каждый ответ, 3 000 ответов — 300 часов. При $30 в час это $9,000 в месяц.

Суть не в том, что AI делает поддержку почти бесплатной. Обычно это не так. Суть в том, что команда может выбрать, куда направить человеческое время. В этом примере AI убирает большую часть работы по первому черновику, оставляя людям защиту качества там, где нужна оценка.

Это также даёт понятный ответ, когда инвесторы спрашивают, почему выросли расходы на модели. Привяжите это к объёму и частоте проверок. Больше тикетов, строже проверка или больше эскалаций — всё это двигает цифру. Это нормально. Это не случайный слив денег.

Та же базовая модель работает для сводок QA тикетов, заметок встреч, технических спецификаций и последующих действий по звонкам продаж. Как только вы оцениваете каждую задачу так, использование модели перестаёт выглядеть как неопределённый эксперимент и превращается в кадровый выбор с понятными рычагами.

Ошибки, которые искажают картину

Взять второе мнение

Получите внешнюю проверку перед масштабированием AI-воркфлоу по команде.

Поговорить с Олегом

История затрат быстро ломается, когда команда смешивает настройку системы с ежемесячными расходами на прогон. Дизайн промптов, тестовые наборы, изменения воркфлоу и обучение персонала обычно происходят разово или короткими всплесками. Вызовы модели, человеческие проверки, ретраи и эскалации повторяются каждый месяц. Если сложить всё в одну корзину, первый месяц выглядит пугающе, а последующие — размыто.

Цена за токен сама по себе даёт ещё одно неверное впечатление. Дешёвый вызов не дешев, если кто-то тратит три минуты на его исправление. Более дорогая модель может выиграть, если её вывод утверждают одним быстрым взглядом. В большинстве разговоров с инвесторами время проверки важнее, чем счёт за модели.

Команды также считают неправильную единицу. Они считают промпты, потому что их легко вытащить из логов. Инвесторам важна завершённая работа. Если агенту нужно четыре попытки, чтобы получить годный ответ, реальная величина — стоимость за утверждённый ответ, а не за промпт. Та же проблема появляется в код-ревью, триаже тикетов и подготовке документов.

Одна средняя успешность может скрывать реальную проблему. Пусть таблица показывает 78% успеха. Это звучит нормально, пока не разложите по видам задач. Ответы на сброс пароля могут проходить 95%, а по спорам с биллингом — 40%. Одно усреднённое число скрывает, где люди всё ещё делают большую часть работы и где модель действительно экономит время.

Сложные кейсы тоже искажают модель, если вы считаете, что одна модель обрабатывает весь трафик. На практике многие команды используют более дешёвую модель для рутинных задач и более сильную для крайних случаев. Вторая полоса может быть невелика по объёму, но всё равно занимать большую долю расходов.

Чище выглядят листы, которые разделяют четыре вещи: одноразовая настройка, ежемесячное использование модели, минуты проверки на завершённый результат и доля перехода на более сильную модель. Когда таблица показывает стоимость за завершённую задачу и разделяет простую работу от сложной, разговор становится спокойнее. Это операционный выбор, а не загадочная статья расходов.

Быстрые проверки перед встречей

Привлечь Fractional CTO

Привлеките старшего специалиста, чтобы превратить расходы на AI в простую операционную математику.

Получить CTO

Инвесторы нервничают, когда расходы на AI звучат расплывчато. Их успокаивает простая операционная математика. Если ваши числа точны, вы должны уметь объяснить их, не открывая пять вкладок.

Хорошее резюме — одна фраза: "Завершённый черновик поддержки стоит нам $0.42, включая модель, проверку и доработку." Эта строка делает много работы. Она говорит людям, что вы отслеживаете полную задачу, а не только API-платы.

Перед встречей проверьте несколько базовых вещей:

Показывайте стоимость за завершённую задачу, а не за промпт или за тысячу токенов.
Держите два вида для того же воркфлоу: обычный месяц и загруженный месяц.
Разделяйте коэффициент проверки и коэффициент доработок как отдельные числа.
Отметьте точную точку, где человек принимает окончательное решение.
Попросите кого‑то ещё воспроизвести расчёты из вашей таблицы.

Последняя проверка важнее, чем многие основатели думают. Под давлением люди пропускают мелкие допущения: ретраи, неудачные генерации или лишние две минуты, которые тратит тимлид на сложные случаи. Эти пропуски разрушают аккуратную модель в комнате.

Простая таблица часто лучше красивого слайда. Одна строка для обычного месяца, одна для загруженного, и колонки: объём задач, стоимость модели, минуты проверки, минуты доработки и итоговая стоимость за завершённую задачу. Чистые входные данные создают доверие.

Если ваш CTO, финансовый лидер или советник могут объяснить те же числа так же, вы в хорошем положении. Эти встречи обычно проходят лучше, когда математика звучит немного скучно.

Следующие шаги для более чистой истории затрат

Начните с малого. Выберите один воркфлоу, который повторяется много раз в месяц и напрямую влияет на маржу — квалификация лидов, triage поддержки или кодирование счетов. Если задача выполняется два раза в неделю, математика будет тонкой. Если 2 000 раз в месяц, инвесторы заинтересуются.

Прежде чем прогнозировать экономию, постройте одностраничную таблицу с текущим процессом и версией с AI рядом. Сделайте её достаточно простой, чтобы финансист просмотрел за минуту. Включите название задачи, месячный объём, среднее число вызовов модели на задачу, коэффициент проверки, время проверки и полную стоимость за задачу и в месяц. Добавьте строку для обработки ошибок. Воркфлоу с 8% доработок — не то же самое, что тот, что проходит с первого раза.

Затем проведите короткий тест, а не масштабный запуск. Сравните два варианта модели на той же задаче и держите политику проверки постоянной неделю. После этого измените только политику проверки. Так вы чище поймёте, где сидит стоимость: в модели, в человеческой проверке или в обоих. Многие команды винят модель, когда реальная утечка — проверяющий, который тратит четыре минуты там, где было бы достаточно 30 секунд.

Будьте честны в том, что покупаете. Иногда более дешёвая модель выигрывает, потому что требует чуть больше проверки, но всё равно дешевле в сумме. Иногда лучшая модель сокращает время проверки настолько, что оправдывает более высокий счёт за токены. Картина становится яснее, когда у каждого шага есть ответственный, счётчик и временная стоимость.

Если нужна внешняя оценка, Олег Сотников просматривает такие воркфлоу, цикл проверки и инфраструктуру в роли fractional CTO и советника стартапов. Для команд, которые решают вопросы затрат на AI, oleg.is — практичное место для второго мнения, особенно когда логирование, ретраи, очереди или облачная настройка искажают цифры.

Чистая история затрат умещается на одной странице. Если кто‑то спросит, почему расходы на AI выросли или упали, вы должны уметь указать на один воркфлоу, одну таблицу и один результат теста.

Часто задаваемые вопросы

Как быстро объяснить расходы на AI инвесторам?

Скажите, сколько стоит одна завершённая задача, а не что показывает счёт по API. Строка вроде Один утверждённый ответ поддержки стоит нам $0.42 включая модель, проверку и доработку даёт инвесторам удобную точку сравнения.

С чего начать измерения?

Выберите одну повторяемую задачу с одним готовым результатом, например первый ответ в поддержку или заметку в CRM по звонку продаж. Когда задача узкая, ваши числа остаются правдоподобными.

Отслеживать промпты или готовые задачи?

Используйте завершённые результаты. Промпты легко считать, но они не показывают, сколько стоит один годный результат с учётом ретраев и правок.

Какой период истории нужен для расчётов?

Возьмите последние четыре–восемь недель реальной работы. Это обычно показывает обычный объём, загруженные дни и уровень сбоев без превращения задачи в проект по истории данных.

Как посчитать стоимость человеческой проверки?

Замеряйте реальные проверки секундомером и берите выборку из 30–50 выводов. Умножьте среднее время проверки на «нагруженную» часовую ставку того, кто делает проверку.

Что делать, если проверяются не все выводы?

Задайте коэффициент проверки и применяйте его к задаче. Если команда проверяет 40% выводов, только эта доля получает стоимость проверки; эскалации учитывайте отдельно.

Может ли более дорогая модель быть дешевле в сумме?

Да. Дорогая модель может снизить общее время правок настолько, что итоговая стоимость за завершённую задачу окажется ниже. Сравнивайте полную стоимость за готовый результат, а не только цену за токен.

Как учитывать ретраи и неудачные запуски?

Считайте все ретраи и неудачные запуски — они тратят деньги и внимание команды. Если для одного годного результата требуется три вызова модели, включите все три вызова в стоимость единицы.

Надо ли включать настройки в ежемесячную модель?

Разделяйте одноразовые настройки и регулярные месячные расходы. Работа по промптам, тестовые наборы и обучение — это стартаповые, одноразовые затраты. Модель, проверка и доработка — повторяющиеся месячные расходы.

Какой воркфлоу моделировать в первую очередь?

Выберите задачу с высоким объёмом и влиянием на маржу — например triage поддержки, квалификация лидов или кодирование счетов. Высокий объём даёт достаточно данных, чтобы оправдать модель на встрече.