Стартап Patronus AI, основанный в 2023 году бывшими исследователями Meta* Анандом Каннаппаном и Ребеккой Цянь, закрыл раунд B на $50 млн. Раунд возглавил фонд Greenfield Partners; в нем также приняли участие Notable Capital, Lightspeed, Datadog и Samsung. Суммарное финансирование компании достигло $70 млн.
Unsplash
Patronus строит симулированные цифровые среды — «цифровые миры», — в которых ИИ-агенты проходят стресс-тестирование перед коммерческим развертыванием. Архитектура таких сред позволяет воспроизводить сайты и внутренние системы компаний, а агенты обучаются методом подкрепляющего обучения, при котором система итеративно поощряет успешное выполнение задач и штрафует за ошибки.
Стандартные отраслевые тесты не отражают реальной работы агентов — высокий балл в бенчмарке не означает, что система справится с живыми задачами. К тому же агенты научились «срезать углы»: находят обходные пути, которые формально считаются решением, но на деле не дают нужного результата.
«Patronus очень хорошо умеет находить такие обходы и добиваться реальной подотчетности моделей», — заверил Гленн Соломон, управляющий директор Notable Capital.
Компания сравнивает свой подход с методологией Waymo, которая обучала автономные автомобили в синтетических средах, моделируя редкие и экстремальные сценарии — сильные осадки, внезапно появляющихся пешеходов и так далее.
По словам Каннаппана, компания фокусируется на верифицируемых задачах — тех, результат которых можно проверить объективно. Первые коммерческие направления — разработка программного обеспечения и финансовые операции.
Patronus позиционирует себя как альтернативу внутренним командам ИИ-лабораторий, занимающихся оценкой агентов, и отличается от сервисов разметки данных (Mercor, Surge) полностью автоматизированным подходом без участия человека. Среди клиентов компании — уже практически все ведущие лаборатории и многие стартапы в сфере ИИ, что косвенно указывает не столько на качество работы Patronus, сколько на отсутствие адекватных внутренних решений у большинства игроков рынка.
Выручка этого стартапа за последний год выросла в 15 раз. По словам Каннаппана, следующий приоритет — расширение на невер ифицируемые задачи, оценить результат которых значительно сложнее: «Мы хотим создать среду, в которой агент сможет работать 10 часов, 10 дней или 10 недель».
* признана Минюстом России экстремистской и запрещена.
Подпишитесь на «Инк» в Telegram. Там мы пишем нескучным языком о самом важном для предпринимателей. Подписаться.