Компания Meta Platforms* (запрещена и признана в РФ экстремистской) выпустила самую большую версию своих бесплатных моделей искусственного интеллекта Llama 3, которая может похвастаться многоязычными навыками и общими показателями производительности, конкурируя с платными моделями таких организаций, как OpenAI, сообщает Reuters.
Новая модель Llama 3 может общаться на восьми языках, писать качественный компьютерный код и решать более сложные математические задачи, чем предыдущие версии. С 405 млрд параметров, или переменных, которые алгоритм учитывает для генерации ответов на запросы пользователей, он превосходит предыдущую версию, выпущенную в прошлом году, хотя все еще уступает ведущим моделям конкурентов — модель GPT-4 от OpenAI имеет 1 трлн параметров, а Amazon готовит модель с 2 трлн параметров.
Марк Цукерберг надеется, что будущие модели Llama обгонят конкурентов уже к концу этого года. По его словам, чат-бот Meta AI*, работающий на этих моделях, должен стать самым популярным помощником AI, а сотни миллионов людей уже используют его. В компании заявили, что в дополнение к своей флагманской модели с 405 млрд параметров компания выпускает обновленные версии своих более легких моделей Llama 3 с 8 млрд и 70 млрд параметров, которые были представлены весной.
Все три новые модели многоязычные и могут обрабатывать более крупные пользовательские запросы с помощью расширенного «контекстного окна». «Это был главный отзыв, который мы получили от сообщества», — рассказал руководитель отдела генеративного ИИ компании Meta* Ахмад Аль-Дахле, отметив, что большие контекстные окна дают моделям что-то вроде более длинной памяти, которая помогает обрабатывать многоэтапные запросы.
Meta* выпускает свои модели Llama в основном бесплатно для использования разработчиками. По словам Цукерберга, эта стратегия окупится в виде инновационных продуктов, меньшей зависимости от потенциальных конкурентов и более активного участия в социальных сетях компании. Однако некоторые инвесторы удивились, увидев связанные с этим расходы.
Результаты тестов, представленные Meta*, свидетельствуют, что Llama 3 почти соответствует, а в некоторых случаях и превосходит Claude 3.5 Sonnet от Anthropic и GPT-4o от OpenAI. Например, на тесте MATH по решению математических текстовых задач соревновательного уровня модель Meta* показала результат 73,8, тогда как у GPT-4o он составил 76,6, а у Claude 3.5 Sonnet — 71,1. Модель набрала 88,6 баллов по MMLU — тесту, охватывающему десятки предметов по математике, естественным наукам и гуманитарным дисциплинам, в то время как GPT-4o набрала 88,7 балла, а Claude 3.5 Sonnet — 88,3 балла.
В Meta* также рассказали о «мультимодальных» версиях моделей, которые должны выйти в этом году и которые будут накладывать возможности обработки изображений, видео и речи на базовую текстовую модель Llama 3. Ранние эксперименты показывают, что эти модели могут конкурировать с другими мультимодальными моделями, такими как Gemini 1.5 от Google и Claude 3.5 Sonnet от Anthropic.
С мая Meta* регулярно помечает некоторые фотографии ярлыком «Сделано с помощью ИИ» в своих приложениях Facebook*, Instagram* и Threads*. Однако подход компании к маркировке фотографий вызвал недовольство пользователей и фотографов после того, как она прикрепила ярлык к реальным фотографиям.