Рубрики

О журнале

Соцсети

Напишите нам

Новости

Новая ИИ-модель Tencent догнала по показателям один из лучших алгоритмов OpenAI

Китайская компания Tencent разработала модель Hunyuan-T1, которая практически сравнялась с лучшими «рассуждающими» алгоритмами OpenAI. При создании нейросети ученые сосредоточились на улучшении «логического мышления» и адаптации к человеческим предпочтениям.

Фото: Tencent / Midjourney

В ключевых бенчмарках модель показала впечатляющие результаты. В тесте MMLU-PRO, охватывающем 14 предметных областей, Hunyuan-T1 набрала 87,2 балла, заняв второе место после модели o1. В сложнейшем бенчмарке GPQA Diamond, включающем задачи на рассуждение, нейросеть набрала 69,3 балла, а в математическом тесте MATH500 показала рекордный результат в 96,2 балла.

Для обучения использовался инновационный подход под названием curriculum learning, при котором в процессе обучения исследователи постепенно повышали сложность задач. Tencent также разработал уникальную систему самооценки, в которой более ранние версии модели оценивали ответы новых версий.

Модель использует архитектуру Transformer Mamba, которая, по заявлению разработчиков, обрабатывает длинные тексты в два раза быстрее традиционных систем.