Новости

Чат-бот Grok от X получил обновление с «улучшенной логикой». Он в 2 раза лучше в математических тестах и программировании

Стартап Илона Маска xAI представил свою новейшую модель генеративного искусственного интеллекта Grok-1.5, который станет основой чат-бота Grok в социальной сети X. Grok-1.5 обладает «улучшенной логикой», особенно когда речь идет о задачах, связанных с кодированием и математикой. Модель более чем в два раза превзошла результаты Grok-1 в популярном математическом тестировании MATH и на 10 процентных пунктов превзошла результаты теста HumanEval на способность к созданию языков программирования и решению задач.

Трудно предсказать, как эти результаты отразятся на реальном использовании. Широко используемые тесты ИИ, которые измеряют такие эзотерические вещи, как успеваемость на экзаменах по химии для выпускников, плохо справляются с задачей определения, как человек сегодня взаимодействует с моделями. Одним из улучшений, которое должно привести к заметным преимуществам, является объем контекста, который Grok-1.5 может понять по сравнению с Grok-1.

Чат-бот может обрабатывать контексты до 128 тыс. токенов. Здесь «токены» относятся к фрагментам необработанного текста (например, слово «фантастический» разделено на «фан», «тас» и «тик»). Контекст или контекстное окно относится к входным данным (в данном случае к тексту), которые модель рассматривает перед созданием выходных данных (дополнительного текста).

Модели с маленькими контекстными окнами склонны забывать содержание даже самых недавних разговоров, в то время как модели с более крупными контекстами избегают этой ловушки и, как дополнительное преимущество, лучше понимают поток данных, которые они принимают.

«Grok-1.5 может использовать информацию из значительно более длинных документов, — пишет x.AI в своем блоге. — Более того, модель может обрабатывать более длинные и сложные запросы, сохраняя при этом способность следовать инструкциям по мере расширения контекстного окна».

Отличие модели Grok от x.AI от других генеративных моделей ИИ — они отвечают на вопросы по темам, которые обычно закрыты для других моделей, например заговоров и более противоречивых политических идей. Модели также отвечают на вопросы с «бунтарской жилкой», как описал это Маск, и откровенно грубо выражаются, если их об этом просят. Неясно, какие изменения чат-бот вносит в эти области. X.AI не упоминает об этом в своем блоге.

Grok-1.5 скоро будет доступен ранним тестерам X вместе с «несколькими новыми функциями». Объявление было сделано после того, как x.AI открыл исходный код Grok-1. Совсем недавно Маск заявил, что больше пользователей X — особенно тех, кто платит за премиум-план X за $8 в месяц, — получат доступ к чат-боту Grok, который ранее был доступен только клиентам X Premium+ (за $16 в месяц).

В декабре 2023 года компания Илона Маска xAI представила чат-бот Grok, который связан с соцсетью X. По словам разработчиков, новый бот имеет большое преимущество, он публикует новости в режиме реального времени, «остро» отвечает на каверзные вопросы, а также выдает лучшие результаты в сравнении со своими конкурентами.