Новости 10.03.2025

Manus: у DeepSeek появился конкурент, но эксперты считают его успех необоснованным

Глава отдела продуктов компании Hugging Face назвал Manus самым впечатляющим инструментом ИИ, который он когда-либо пробовал, а исследователь ИИ Дин Болл — самым сложным компьютером, использующим ИИ. Официальный сервер Discord всего за несколько дней собрал более 138 тыс. участников, а коды приглашений продаются на китайском посредническом приложении Xianyu за тысячи долларов. Однако, эксперты считают, что его Manus слава не заслужена.

Этот ИИ не был разработан полностью с нуля. Согласно сообщениям в социальных сетях, для составления исследовательских отчетов и анализа финансовых документов платформа использует комбинацию существующих и отлаженных моделей ИИ, такие, как Claude от Anthropic и Qwen от Alibaba.

На своем сайте китайская компания The Butterfly Effect, разработавшая Manus, приводит несколько примеров того, какие результаты может показывать платформа, от покупки недвижимости до программирования видеоигр.

В вирусном видео на сайте X Ичао «Пик» Цзи, руководитель исследований в Manus, заявил, что платформа превосходит такие инструменты, как OpenAI и Operator.

«Manus — это не просто очередной чатбот, — сказал Цзи в видеоролике. — Это полностью автономный агент, который преодолевает разрыв между замыслом и исполнением. Мы рассматриваем его как следующую парадигму сотрудничества между людьми и машинами».

Тем не менее, Александр Дориа, соучредитель ИИ-стартапа Pleias, в своем посте на сайте X поделился, что во время тестирования Manus он столкнулся с сообщениями об ошибках и бесконечными циклами. Другие пользователи платформы отметили, что Manus допускает ошибки в фактических вопросах и не всегда цитирует свои работы, а также часто пропускает информацию, которую легко найти в интернете.

Один из экспертов TechCrunch также провел собственное тестирование Manus. По его словам, опыт был «не слишком положительным».

Он попросил платформу заказать сэндвич с жареной курицей в одном из самых популярных фастфудов. Примерно через десять минут Manus дал сбой. Со второй попытки он нашел пункт меню, который соответствовал заданным критериям, но не смог завершить процесс заказа и даже предоставить ссылку для его оформления.

Аналогичный сбой произошел, когда эксперт попросил Manus забронировать билет на самолет из Нью-Йорка в Японию. Учитывая инструкции, которые не оставляли места для двусмысленности, лучшее, что смог сделать Manus — это предоставить ссылки на тарифы на нескольких сайтах авиакомпаний и поисковых систем, таких как Kayak, некоторые из которых были нерабочими.

Быстрому росту популярности Manus способствовало несколько факторов. Среди них — эксклюзивность. Кроме того, китайские СМИ поспешили превознести Manus как прорыв в области ИИ. Издание QQ News назвало его «гордостью отечественных продуктов».

Тем временем в социальных сетях авторитеты в области ИИ распространяли дезинформацию о возможностях Manus. В популярном видеоролике показано, как якобы Manus, выполняет действия в нескольких приложениях для смартфонов. Компания Ji подтвердила, что на самом деле видео не было демонстрацией этого сервиса.

Другие влиятельные ИИ-аккаунты на X попытались провести сравнение между Manus и китайской ИИ-компанией DeepSeek. The Butterfly Effect, в отличии от нее, не разрабатывала никаких собственных моделей. И если DeepSeek сделала многие из своих технологий открытыми, то Manus — нет.

The Butterfly Effect утверждает, что работает над масштабированием вычислительных мощностей и устраняет проблемы по мере их поступления. Но в том виде, в котором платформа существует сейчас, Manus, похоже, является примером того, как шумиха опережает технологические инновации.

Напомним, что недавно команда Qwen, входящая в состав компании Alibaba, представила новую «рассуждающую» языковую модель QwQ-32B. В тестах она достигает производительности DeepSeek-R1, которая имеет в 20 раз больше параметров.

Темы

2025 IT IT-бизнес бизнес ИИ