Новости

Запуск ИИ для 100 тыс. диалогов в сутки: сколько стоит и что скрывает цена

Если вдруг российские предприниматели интересовались, во сколько обойдется бизнесу запуск собственного ИИ-агента поддержки, который сможет справляться с 100 тыс. диалогов в сутки, то краткий ответ будет таким — минимум 14,3 млн руб. в первый год. И это без учета кофе для специалистов, которые за этим всем будут следить. Подробности исследования платформы Nodul, российского аналога n8n, — в распоряжении «Инка».

Freepik

Вариант с покупкой собственного «железа» и развертыванием его локально потребует вложений от 19,2 до 23,6 млн руб. в год — это с учетом покупки серверов, шести видеокарт Nvidia A100 и расходов на электричество. Облачный вариант обойдется чуть дешевле на старте, но по итогу сумма будет примерно сравнима — от 14,3 до 17,9 млн руб. в год.

Исследование рассматривает такой сценарий: 100 тыс. диалогов по три сообщения в каждом, с нагрузкой до 5,6 запросов в секунду в пиковое время. Для сравнения, использование модели GPT-4o-mini стоит около $2,5 тыс. в месяц — лишь малая часть расходов. Но тут всплывают скрытые расходы — от оркестратора, который связывает ИИ с корпоративными системами, до сотен часов работы специалистов по настройке и поддержке. Стоимость установки начинается от 700 тыс. руб. и растет с уровнем SLA и сложностью интеграций. Создание сценариев занимает около 100 часов в месяц, что с внешней командой стоит примерно 500 тыс. руб., а с внутренними специалистами — от 200 до 400 тыс. руб.

При этом локальная инфраструктура становится выгодной только при объеме более 140 тыс. диалогов в сутки или когда важна защита данных и независимость от зарубежных провайдеров — вопрос не из простых для российских компаний с требованиями по безопасности к ним и 152-ФЗ. В противном случае облако остается более удобным вариантом.

Затраты на обслуживание тоже не подарок, локально — до 20% стоимости серверов в год (в рассмотренном варианте это $10–20 тыс.), плюс круглосуточный мониторинг и быстрая реакция на сбои. В облачных решениях эту головную боль берет на себя провайдер, но цена за спокойствие в своих вырастает вместе с уровнем SLA. Простой ИИ-агента может обойтись бизнесу в миллионы — и это только начало.

Нужно отметить, что отечественный рынок облачных сервисов продолжает динамично расти: по итогам 2024 года его объем достиг почти 166 млрд руб. с ежегодным приростом свыше 35%. Особенно активно облачные решения внедряются в крупных городах — Москве и Санкт‑Петербурге, где доля компаний, использующих облака, может составлять 65–70%. Для среднего бизнеса эта цифра пока ниже — около 35%, а в регионах популярность облаков и вовсе ограничена из‑за инфраструктурных и регуляторных особенностей.

Тем не менее крупные игроки и компании с высокими требованиями к безопасности все чаще выбирают локальную или гибридную инфраструктуру. Это позволяет им соблюдать требования закона 152-ФЗ, минимизировать риски утечки данных и обеспечить стабильность работы без зависимости от сторонних поставщиков. Таким образом, выбор между облаком и собственными серверами в России становится делом баланса между затратами, скоростью внедрения и уровнем контроля над данными.