Новости

Anthropic создала новый ИИ, который превосходит GPT-4 от OpenAI

Стартап в области искусственного интеллекта Anthropic, поддерживаемый Google, анонсировал последнюю версию своей технологии GenAI, Claude. Компания утверждает, что чат-бот с искусственным интеллектом превосходит GPT-4 от OpenAI по производительности.

Claude 3, как называется новый GenAI от Anthropic, представляет собой семейство моделей — Claude 3 Haiku, Claude 3 Sonnet и Claude 3 Opus, причем Opus является самой мощной. По утверждению Anthropic, все они демонстрируют расширенные возможности в анализе и прогнозировании, а также повышенную производительность в конкретных тестах по сравнению с такими моделями, как ChatGPT и GPT-4 и Google Gemini 1.0 Ultra (но не Gemini 1.5 Pro).

Примечательно, что Claude 3 — это первый мультимодальный GenAI от Anthropic, а это означает, что он может анализировать как текст, так и изображения — аналогично некоторым разновидностям GPT-4 и Gemini, Claude 3 может обрабатывать фотографии, диаграммы, графики и технические диаграммы, рисунки из PDF-файлов, слайд-шоу и другие типы документов.

Он лучше, чем некоторые конкуренты GenAI, может анализировать несколько изображений за один запрос (максимум до 20). Это позволяет ему сравнивать и противопоставлять изображения, отмечает Anthropic. Но есть ограничения Claude 3 на обработку изображений.

Anthropic лишил модели возможности идентифицировать людей, без сомнения, опасаясь этических и юридических последствий. Компания признает, что Claude 3 склонен совершать ошибки с изображениями низкого качества (менее 200 пикселей) и с трудом справляется с задачами, связанными с пространственным мышлением (например чтением аналогового циферблата) и подсчетом объектов (не может дать точных результатов по количеству объектов на изображениях).

Cloude 3 также не будет создавать иллюстрации. Модели строго анализируют изображения — по крайней мере на данный момент. Независимо от того, размещаете ли текст или изображения, Anthropic утверждает, что клиенты в целом могут ожидать, что Claude 3 будет лучше следовать многошаговым инструкциям, создавать структурированный вывод в таких форматах, как JSON, и общаться на языках, отличных от английского, по сравнению со своими предшественниками, а также должен реже отказываться отвечать на вопросы благодаря более тонкому пониманию запросов, говорят в Anthropic. Позже модели будут ссылаться на источник своих ответов на вопросы, чтобы пользователи могли их проверить.

«Cloude 3 имеет тенденцию генерировать более выразительные и увлекательные ответы, — пишет Anthropic в статье поддержки. —Ему легче подсказывать и управлять по сравнению с нашими устаревшими моделями. Пользователи должны обнаружить, что они могут достичь желаемых результатов с помощью более коротких и лаконичных подсказок. Некоторые из этих улучшений связаны с расширенным контекстом Claude 3».

Контекст модели, или контекстное окно, относится к входным данным (например тексту), которые модель рассматривает перед генерированием выходных данных. Модели с маленькими контекстными окнами склонны забывать содержание даже самых недавних разговоров, что приводит к отклонению от темы. Дополнительным преимуществом является то, что модели с большим контекстом могут лучше воспринимать повествовательный поток данных, которые они принимают, и генерировать более контекстуально богатые ответы (по крайней мере гипотетически).

Anthropic сообщает, что Claude 3 изначально будет поддерживать контекстное окно на 200 тыс. токенов, что эквивалентно примерно 150 тыс. слов, при этом отдельные клиенты получат контекстное окно на 1 млн токенов (~ 700 тыс. слов). Это соответствует новейшей модели GenAI от Google, вышеупомянутому Gemini 1.5 Pro, которая также предлагает контекстное окно размером до миллиона токенов. Но то, что Claude 3 представляет собой обновление предыдущей версии, не означает, что она идеальна.

В техническом документе Anthropic признает, что Claude 3 не застрахован от проблем, с которыми сталкиваются другие модели GenAI, а именно от предвзятости и галлюцинаций (то есть выдумывания). В отличие от некоторых моделей GenAI, Claude 3 не может осуществлять поиск в Интернете. Модели могут отвечать на вопросы, используя только данные, полученные до августа 2023 года. И хотя Клод говорит на нескольких языках, он не так свободно говорит на некоторых «малоресурсных» языках по сравнению с английским. Но Anthropic обещает частые обновления Claude 3 в ближайшие месяцы.

«Мы не считаем, что интеллект моделей где-то близок к своим пределам, и мы планируем выпустить улучшения для семейства моделей Claude 3 в течение следующих нескольких месяцев», — пишет компания в своем блоге. Opus и Sonnet теперь доступны в интернете, а также через консоль разработки и API Anthropic, платформу Amazon Bedrock и Google Vertex AI. Haiku выйдет позже в этом году:

  • $15 за 1 млн входных токенов, $75 за 1 млн выходных токенов — Opus;
  • $3 за 1 млн входных токенов, $15 за 1 млн выходных токенов — Sonnet;
  • $0,25 за 1 млн входных токенов, $1,25 за 1 млн выходных токенов — Haiku.

Цель Anthropic — создать алгоритм следующего поколения для «самообучения ИИ». Такой алгоритм можно использовать для создания виртуальных помощников, которые смогут отвечать на электронные письма, проводить исследования и создавать произведения искусства, книги и многое другое, некоторые из которых мы уже опробовали на примере GPT-4 и других крупных языковых моделей.

Anthropic заявляет, что планирует добавить в Claude 3 функции, которые улучшат его готовые возможности, позволяя Claude взаимодействовать с другими системами, писать код в интерактивном режиме и предоставлять расширенные агентные возможности. Это напоминает заявленные амбиции OpenAI по созданию программного агента для автоматизации сложных задач, таких как перенос данных из документа в электронную таблицу или автоматическое заполнение отчетов о расходах и ввод их в бухгалтерское программное обеспечение. OpenAI уже предлагает API, который позволяет разработчикам встраивать в свои приложения агентский опыт, и Anthropic, похоже, намерен предоставить сопоставимую функциональность. Согласно презентационной информации, опубликованной в мае прошлого года, компания намерена привлечь до $5 млрд в течение следующих 12 месяцев.

Ранее OpenAI представила инструмент, который может генерировать видео на основе текстовых подсказок. Новая модель, получившая название Sora в честь японского слова, означающего «небо», может создавать реалистичные видеоролики продолжительностью до минуты, которые соответствуют инструкциям пользователя как по теме, так и по стилю.