Недавно компания Mistral выпустила новую флагманскую модель Large 2, которая, как она утверждает, не уступает последним передовым моделям OpenAI и Meta* (запрещена на территории РФ) в плане генерации кода, математики и рассуждений.
Выпуск Mistral Large 2 состоялся всего через день после того, как Meta* выпустила свою последнюю модель с открытым исходным кодом, Llama 3.1 405B. Mistral утверждает, что Large 2 поднимает планку производительности и стоимости для открытых моделей, подкрепляя это несколькими бенчмарками.
Оказалось, что Large 2 превосходит Llama 3.1 405B по генерации кода и математической производительности, причем для этого требуется меньше трети параметров: 123 млрд, если точно.
В пресс-релизе Mistral сообщает, что одним из ключевых направлений обучения было сведение к минимуму проблем с галлюцинациями в модели. Компания утверждает, что Large 2 была обучена быть более разборчивой в своих ответах и признавать, что чего-то не знает, вместо того чтобы придумывать кажущееся правдоподобным.
ИИ-стартап из Парижа недавно привлек $640 млн в раунде финансирования серии B, возглавляемом General Catalyst, при оценке в $6 млрд. Хотя Mistral — один из самых новых участников рынка искусственного интеллекта, он быстро создает модели ИИ, находящиеся на передовой или близкие к ней.
Модели Mistral, как и большинство других, не являются открытым исходным кодом в традиционном смысле — для любого коммерческого применения модели требуется платная лицензия. И хотя она более открыта, чем GPT-4o, мало у кого в мире есть опыт и инфраструктура для реализации такой большой модели.
То, чего не хватает Mistral Large 2, и чего не было в релизе Meta* Llama 3.1, — это мультимодальные возможности. OpenAI значительно опережает конкурентов в области мультимодальных систем ИИ, способных обрабатывать изображения и текст одновременно, и некоторые стартапы все больше стремятся к созданию таких систем.
Модель имеет окно в 128 тыс. жетонов, то есть Large 2 может принять большое количество данных за один запрос (128 тыс. жетонов равны примерно 300-страничной книге).
В новой модели Mistral также улучшена многоязыковая поддержка. Large 2 понимает английский, французский, немецкий, испанский, итальянский, португальский, арабский, хинди, русский, китайский, японский и корейский языки, а также 80 языков кодирования. Mistral утверждает, что Large 2 также выдает более лаконичные ответы, чем ведущие модели ИИ, которые имеют тенденцию к «болтовне».
Mistral Large 2 доступна для использования в Google Vertex AI, Amazon Bedrock, Azure AI Studio и IBM watsonx.ai. Использовать новую модель можно также на сайте Mistral’s La Plateforme под именем «mistral-large-2407» и бесплатно протестировать ее на конкуренте стартапа ChatGPT — Le Chat.
Ранее сообщалось, что Microsoft не будет подвергаться антимонопольному контролю в Великобритании в связи со своими недавними инвестициями во французский ИИ-стартап Mistral AI. Управление по конкуренции и рынкам (CMA) страны пришло к выводу, что это партнерство «не подпадает под действие положений о слиянии, предусмотренных Законом о предприятиях 2002 года».