Компания DeepSeek, занимающаяся исследованиями в области ИИ, выпустила предварительную версию DeepSeek-R1. По словам создателей, она способна наравне с o1 от OpenAI выполнять задачи, требующие логического мышления.
В отличие от большинства моделей, рассуждающие способны эффективно проверять факты, тратя больше времени на обработку запроса. Как и o1, DeepSeek-R1 решает задачи, планируя наперед и выполняя последовтельность действий, которые помогают модели прийти к ответу. В зависимости от сложности вопроса DeepSeek-R1 может «думать» десятки секунд, прежде чем ответить.
Компания утверждает, что DeepSeek-R1 показала сопоставимые с 1-preview от OpenAI результаты на двух популярных бенчмарках для ИИ — AIME (оценивает производительность модели с помощью других ИИ) и MATH (представляет собой сборник текстовых задач).
Однако некоторые пользователи соцсети X отметили, что DeepSeek-R1 не справляется с игрой в крестики-нолики и другими логическими задачами. Модель также можно легко взломать, то есть настроить таким образом, чтобы она игнорировала требования системы безопасности.
Это, вероятно, является результатом давления со стороны китайского правительства. Модели ИИ, разработанные в Китае, должны проходить проверку интернет-регулятора, чтобы убедиться, что их ответы «воплощают основные социалистические ценности».
Сообщается, что правительство даже предложило черный список источников, которые запрещено использовать для обучения моделей, в результате чего многие китайские ИИ отказываются отвечать на вопросы, которые могут вызвать недовольство регуляторов.
Одна из первых моделей DeepSeek для анализа текстов и изображений под названием DeepSeek-V2, заставила конкурентов, таких как ByteDance, Baidu и Alibaba, снизить цены на использование некоторых из своих моделей и сделать другие полностью бесплатными.
Ранее стало известно, что Google занимается разработкой технологии искусственного интеллекта, которая возьмет на себя управление веб-браузером для выполнения таких задач, как поиск информации и совершение покупок. Источники, знакомые с продуктом, сообщают, что компания планирует представить новый продукт уже в декабре.