Компания OpenAI представила новое семейство языковых моделей. В него входят алгоритмы GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Все они доступны исключительно через API. Эти модели ориентированы на профессиональных разработчиков — они имеют более высокую производительность, способны быстро генерировать ответ и дешевле в использовании по сравнению с GPT-4o. Хотя GPT-4.1 пока недоступна в ChatGPT, многие ее улучшения уже включены в модель GPT-4o.
Фото: OpenAI
Серия GPT-4.1 была разработана в ответ на отзывы сообщества разработчиков, которые просили улучшить форматирование и структуру ответов нейросети, повысить стабильность сгенерированного кода и улучшить долговременную память, чтобы алгоритм можно было использовать в ИИ-агентах. Одна из ключевых особенностей GPT-4.1 — способность вносить точечные изменения в существующие кодовые базы вместо полного их переписывания.
Все три модели имеют огромное контекстное окно в 1 млн токенов — в восемь раз больше предыдущего лимита моделей OpenAI. Однако производительность алгоритмов на очень длинных текстах снижается с 80% примерно до 50% точности при полном использовании контекстного окна. В новом бенчмарке MRCR (Multi-Round Coreference Resolution) GPT-4.1 демонстрирует лучшие результаты, но точность резко падает при использовании полного контекстного окна.
GPT-4.1 превосходит GPT-4o по нескольким показателям. Например, она набирает 54.6% в бенчмаке SWE-Bench Verified (задачи, связанные с разработкой ПО) — на 21 п. п. выше предшественника. Однако OpenAI не приводит сравнение новой модели с нейросетью Claude 3.7 Sonnet, которая, как сообщается, показывает 70% в том же тесте. GPT-4.1 также лучше справляется с задачами на многоэтапное рассуждение.
По цене GPT-4.1 на 26% дешевле GPT-4o — новая модель обойдется в $2 за 1 млн входящих и $8 за 1 млн исходящих токенов. Младшая нейросеть семейства — GPT-4.1 nano — и вовсе стоит 10 центов за 1 млн входных токенов. Ранее выпущенная GPT-4.5 Preview будет выведена из эксплуатации 14 июля 2025 года.