Китайская компания DeepSeek представила новую модель для решения сложных математических задач — DeepSeekMath-V2. Об этом сообщает агентство Синьхуа. Разработчики называют ее одним из самых продвинутых инструментов для машинного рассуждения в математике.
Freepik
Новая версия умеет не просто выдавать правильные ответы, а пошагово объяснять, как она к ним пришла. В основе лежит система самопроверки: одна часть модели генерирует решение, другая — проверяет логику, будто это два независимых эксперта. Исходный код уже опубликован на GitHub и Hugging Face.
По качеству решений DeepSeekMath-V2 сравнима с результатами победителей крупнейших математических соревнований. Модель показала уровень золотых медалистов Международной математической олимпиады 2025 года и китайской олимпиады 2024 года.
Особенно впечатлил результат на престижном студенческом конкурсе Putnam — система набрала 118 из 120 возможных баллов, оставив далеко позади лучший человеческий результат (90 баллов). На тесте IMO-ProofBench модель также превзошла решение DeepThink, разработанное DeepMind.
В DeepSeek отмечают, что такой подход — когда ИИ не только ищет ответ, но и проверяет собственные доказательства — может стать основой для создания более надежных математических систем. Команда уверена, что самопроверяющиеся модели открывают новый этап развития искусственного интеллекта, особенно в задачах, где важны прозрачность и четкая логика.