Разобраться • 16 марта 2023
«Один — за троих»: что умеет GPT-4 и как он изменит работу людей
Текст: Татьяна Макарова
Иллюстрация: OpenAI
Американский разработчик OpenAI представил новое поколение алгоритма по обработке естественного языка — GPT-4. В отличие от своих предшественников, нейросеть научилась анализировать изображения. Inc. узнал у экспертов, что конкретно умеет новая модель, как она изменит рынок труда и можно ли ее использовать в России.
Представленный OpenAI в 2020 году генератор текста GPT-3 стал одной из самых обсуждаемых технологий в сфере искусственного интеллекта (ИИ). Система основана на принципе языковой модели: алгоритм, обученный на огромном массиве текстов (от литературной классики до постов в соцсетях), определяет, какие слова в какой последовательности располагаются в предложении, и создает оригинальный текст.
В 2022 года OpenAI запустила чат-бот ChatGPT на основе GPT-3.5. Его назвали «убийцей Google», при этом на него обрушилось много критики за то, что алгоритм генерирует хорошо звучащий текст, но не способен его качественно анализировать.
Наконец 15 марта вышло новое поколение алгоритма — GPT-4. По данным OpenAI, нейросеть превосходит предыдущую свою версию на 40% по достоверности информации, а ее склонность к запрещенному контенту снижена на 82%: шесть месяцев модель учили этике и ценностным ориентирам.
Microsoft заявила, что их браузер Bing уже работает на GPT-4. В OpenAI указывают, что технология также используется в приложениях Duolingo, Be My Eyes, Stripe, Morgan Stanley, Khan Academy, а также в правительстве Исландии.
Главное отличие GPT-4 от GPT-3.5 — в мультимодальности, то есть возможности обрабатывать одной моделью тексты и изображения. Прошлая версия работала только с текстом. К тому же в новой модели объем текстов для обработки увеличен более чем в восемь раз.
«Теперь вместо описания процесса или запроса в GPT-4 можно загрузить картинку и получить быстрый результат», — говорит преподаватель «Нетологии» Артем Чистяков.
Представленные авторами GPT-4 примеры показывают «впечатляющее качество понимания изображений и ответов на вопросы», считает директор по науке Лаборатории искусственного интеллекта «Сбера» Андрей Савченко. Запросы включают в себя текст и поясняющую картинку — графики, блок-схемы алгоритмов (в том числе нарисованных от руки). Кроме того, GPT-4 лучше решает стандартные задачи, среди которых — поиск ответа на вопросы, ведение диалога, в том числе чтобы уточнить контекст предыдущих вопросов и ответов, суммаризация текста, создание художественных текстов, генерация программного кода по текстовому описанию, включая создание сайтов и мобильных приложений.
Читать также
GPT-4 способна описать, что изображено на иллюстрации и даже объяснить смысл «увиденного», в том числе символизм и юмор в мемах. «Например, в презентации GPT-4 ИИ объяснял смысл визуальных шуток (например iPhone с подключенным к нему древним VGA-кабелем). Более того, проанализировав фото содержимого открытого холодильника, он рассказывал, какие блюда можно из этого приготовить», — говорит управляющий партнер аналитического агентства Spektr Николай Седашов. По его словам, в ближайшее время ИИ можно будет «скармливать» большие презентации с инфографикой и иллюстрациями, а на выходе получать обобщенный пересказ с основными цифрами и данными. «У этой функции есть еще как минимум одна важная область применения — помощь людям с нарушениями зрения», — добавляет эксперт.
Модель может написать HTML-код, при исполнении которого получается разметка веб-сайта с тем же контентом, что и на сфотографированном листе бумаги. «Это определенно изменит будущее программирования, но как и в какой степени — сейчас сложно предположить», — говорит руководитель Softline Venture Partners Елена Волотовская.
Помимо этого, GPT-4 более креативна, надежна для решения трудных и специфических заданий, способна обрабатывать более сложные инструкции, чем предыдущие версии, говорит Андрей Кузнецов, исполнительный директор по исследованию данных Sber AI. Так, модель умеет решать задачи, в которых нужно работать с текстом на уровне символов, что считается трудным для языковых моделей. Она может составить краткое содержание длинного текста, все слова в котором будут начинаться на одну и ту же букву. GPT-4 также успешно справляется с обработкой структурированных данных, умеет выделять важную информацию и отбрасывать лишний текст, добавляет Кузнецов.
СЕО ИИ-платформы подбора витаминов Vitobox Александр Вученович указывает, что GPT-4 уже сдала ряд экзаменов: Uniform Bar, LSAT, GRE. По его мнению, «результаты впечатляющие»: модель попала в 10% лучших среди конкурсантов, тогда как GPT-3.5 оказывалась в 10% худших. «Как заявляют разработчики, в обычном разговоре разница между моделями будет мало уловима, но станет заметна, когда появится объемная задача, требующая подробных инструкций», — добавляет эксперт.
«Модель по-прежнему „галлюцинирует“ — может генерировать несуществующую информацию, средне ориентируется в математике. Не улучшилось и качество генерации текста на русском языке», — замечает руководитель группы NLP Института AIRI Татьяна Шаврина.
По ее словам, говорить о степени новизны GPT-4 и качественной оценке результатов ее работы сейчас сложно, потому что OpenAl ограничивает доступ к архитектуре, интерфейсам, коду и другим техническим деталям.
GPT-3.5 уже активно используется в IТ-индустрии. «Самый яркий пример — копирайтинг. Сервисы типа Jasper.ai пишут рекламные объявления, карточки товаров и подобное как минимум не хуже средних профессионалов, и это уже не теория, а коммерческие продукты с тысячами клиентов и миллионами написанных текстов», — приводит в пример сооснователь United Investors Александр Горный.
Бизнес использует ChatGPT для сокращения рутинных задач, утверждает Николай Седашов. Среди них — подбор ключевых слов оптимизации поисковой выдачи сайта, копирайтинг, редактура, составление однотипных отчетов и других документов, онбординг новых сотрудников.
Например, разработчик Dbrain применяет ChatGPT для составления индивидуальных писем в рассылках для B2B-заказчиков, медиахолдинг «Цифровое телевидение» пытается встроить ИИ в процесс написания новостей и заметок, а веб-студия Pyrobyte пишет с его помощью коммерческие предложения и использует для генерирования новых идей для проектов.
О применении ChatGPT заявляла и медиакомпания BuzzFeed. Она делает ставку на ИИ: с этого года продукты OpenAI, в том числе ChatGPT, собираются привлечь к редакционной и бизнес-деятельности.
Команда разработки школы программирования Elbrus Bootcamp обращается к ChatGPT для генерации кода, так как это экономит время. «Около 25% наших выпускников используют ChatGPT в разработке, и около 10% студентов используют нейросеть во время обучения, например для поиска развернутых ответов на вопросы по разработке», — говорит основатель Elbrus Bootcamp Георгий Бабаян.
Уже есть и книги, написанные с помощью GPT, говорит операционный директор онлайн-школы дизайна BBE Владимир Синицын.
Человек генерирует запросы, задает направление, а чат создает текст, который потом редактируется. Но, что важно, без человека это не работает.
«GPT выступает в роли сборщика, который потом уже специалистом причесывается, и получается продукт», — объясняет он.
Модель все еще требует «присмотра». «Пользоваться ее результатами без проверки выданной информации не стоит, разработчики тоже это всячески подчеркивают», — соглашается вице-президент по технологиям ИИ в VK Андрей Калинин.
Партнер фонда the Untitled Ventures Антон Антич считает, что GPT-4 спровоцирует оптимизацию рабочих мест. «В некоторых компаниях уже пошли сокращения людей. Если продуктивность моих лучших людей я могу вырастить в 10 раз, зачем мне „отстающие“?» — считает Антич.
«Я предвижу эру компаний из одного человека, в которых фаундер занимается стратегией и постановкой задач, а нечто подобное GPT-4 исполняет их, причем эффективно. Это могут быть задачи в области программирования, продаж и маркетинга», — полагает Антич.
Общее развитие генеративных нейросетей и сервисов, базирующихся на них, сильно поменяет рынок труда, присоединяется Александр Горный. Многие рабочие места могут оказаться ненужными: «Один человек, использующий ИИ, сможет делать работу троих», — утверждает Горный. При этом сам релиз GPT-4, по его мнению, на рынке труда никак не отразится: «Не будет такого человека, которому скажут: „Всё, появился GPT-4, ты теперь никому не нужен“. Наоборот, конкурирующие проекты, возможно, наймут сотни инженеров, чтобы побыстрее догнать OpenAI», — говорит Горный.
«Будет ли волна сокращений, никто не может знать наверняка. В первом приближении кажется, что да. С другой стороны, генеративный ИИ может повлиять на создание новых продуктов и сервисов, ранее не доступных человеку и, следовательно, обеспечить новые рабочие места под их развитие», — говорит руководитель группы «Дизайн новых материалов» Института AIRI Семен Буденный. По его словам, дальновидный подход в условиях меняющегося мира предполагает не тотальную «сушку» штата за счет автоматизации, а культивацию подхода lifelong learning.
Больше всего изменится сфера образования, считает Андрей Савченко. Авторы GPT-4 сделали особый акцент на прохождение моделью сертификационных тестов и экзаменов для большого числа областей знаний — химии, биологии, математики, истории, медицины, и так далее. «Уже появляются онлайн-сервисы на основе ChatGPT, которые позволяют подсмотреть ответ на тестовый вопрос», — говорит Савченко. Здесь возникает серьезный вызов, который заставит пересмотреть систему образования и контроля знаний, как это произошло, когда появился интернет: образовательные учреждения частично отказались от зубрежки в пользу обучения навыкам и компетенциям.
В программировании модель действительно способна показывать качественные результаты, но чтобы полностью заменить программиста, необходима автоматизация процессов разработки, работы с заказчиком и приемкой. «На данный момент это утопия», — считает Татьяна Шаврина.
По ее словам, остается открытым и вопрос безопасности: «Будет ли крупная компания загружать код основы внутренних продуктов своей системы в модель? Формально правила сервиса разрешают использовать для обучения все передаваемые данные — насколько это соотносится с понятием коммерческой тайны?»
Юристов нейросеть тоже пока не в состоянии заменить, говорит преподаватель Moscow Digital School Роман Янковский. «Например, нейросеть не понимает юрисдикцию и может дать нерелевантный ответ, относящийся не к той стране. К тому же доступ ко многим документам ограничен, что усложняет как тренировку, так и использование нейросети», — поясняет он.
В целом, для многих задач экономически все еще будет выгоднее использовать труд людей.
«Это похоже на роботизацию производств. Уже сейчас существуют в продаже роботы, которые эффективнее людей справляются с какими-то задачами, но на большинстве предприятий эти задачи все еще делают люди просто потому, что их труд стоит дешевле, чем покупка и обслуживание робота», — объясняет преподаватель Moscow Digital School Ефим Казанцев.
GPT-модели Open AI официально не работают в России. «В том числе поэтому мы не можем запускать нейросеть в промышленных процессах. Тем не менее в РФ уже существуют отечественные модели похожей архитектуры, которые уже используются и будут использоваться в будущем», — говорит директор по Adtech Big Data МТС Михаил Степнов.
На законодательном уровне в России нет ограничений на использование ИИ, напоминает Роман Янковский, преподаватель Moscow Digital School. «Формально ИИ вообще не является субъектом права — не имеет авторских прав, не может нести ответственность, не считается работником компании», — объясняет он.
В российском законодательстве дано определение ИИ, но пока нет никаких ограничений на его использование, подтверждает Николай Седашов.
«В теории, ничто не может запретить компании использовать ИИ по своему усмотрению — например для генерации иллюстраций — и в связи с этим уволить иллюстратора», — предупреждает он.
Заметных ограничений пока нет, присоединяется Андрей Савченко. Например, нашумевший случай, когда студент написал диплом с помощью ChatGPT за сутки, закончился тем, что он все же получил степень бакалавра. Нет каких-то ограничений и на создание программных продуктов или генерацию текстов, не нарушающих требований к плагиату. «У нас и так давно используются разнообразные чат-боты, а применение современных языковых моделей просто приведет к значимому повышению качества клиентского опыта», — заключает эксперт.
Кабель для связи монитора и компьютера.
Квалификационный адвокатский экзамен в США.
Law School Admission Test — вступительный тест для юридических вузов.
Graduate Record Examinations — тест для поступления в магистратуру и аспирантуру в США.