Разобраться • 28 апреля 2024

За кадром: почему эффективность ИИ зависит от людей

За кадром: почему эффективность ИИ зависит от людей

Текст: Руслан Алигаджиев

Фото: picture alliance/Getty Images


В мире искусственного интеллекта очень много ручного труда. Люди разрабатывают алгоритмы машинного обучения, вручную размечают данные, обучают нейросети, контролируют результаты обучения и вносят в них корректировки. Для подобных задач часто применяют краудсорсинговые ресурсы, где работают десятки тысяч человек. К сожалению, отдельные компании пользуются этой практикой и выдают труд краудсорсеров за работу уникальной технологии. В том, почему такие компания добиваются успеха и почему в сфере ИИ на самом деле нельзя обойтись без людей, разобрался специально для Inc. генеральный директор компании «Биорг» Руслан Алигаджиев.

Люди обучают и контролируют результаты работы ИИ, чтобы получить уверенность в качестве автоматизации даже типовых процессов, таких как распознавание паспорта. Верификация и обучение особо важны для непрерывных улучшений в ИИ-моделях на производстве, транспорте, в сфере безопасности, медицины, в сфере обработки данных и распознавания документов в широком смысле. Однако есть компании, которые злоуптребляют человеческим трудом.

Слишком человеческое

Стартапы периодически уличают в обмане. В основе их бизнес-модели оказывается вовсе не уникальная технология или работа ИИ, а ручной труд или работа подрядчиков. Показательный пример — медицинский стартап Theranos, который представил прибор Edison — революционную технологию для дешевых и быстрых анализов всего по одной капле крови. Основательница компании Элизабет Холмс привлекла около $900 млн инвестиций. Стартап оценивали в $9 млрд. Однако оказалось, что работу выполняли сторонние лаборатории, прототип Edison не работал. В 2018 году компания прекратила деятельность, а Холмс сейчас отбывает тюремный срок.

Компанию Spinvox, которая переводила голосовые сообщения в текстовые, в 2008 году обвинили в том, что текст транскрибирует не искусственный интеллект, а операторы в зарубежных кол-центров. Похожая ситуация произошла с Amy Ingram — ИИ-помощником от стартапа X.ai, который выполнял рутинные задачи по планированию встреч и отправке имейл-уведомлений. На деле почти каждое сообщение вместо ИИ писали люди.

В 2019 году узнали, что индийский стартап Engineer.ai, разрабатывавший ИИ-платформу для генерации приложений, привлекал для написания кода настоящих людей. В этом же году британская венчурная компания MMC выяснила, что около 40% европейских ИИ-стартапов не используют ИИ.

В 2020 году «посыпался» финтех-стартап Курта Ратманна ScaleFactor, который привлек более $100 млн инвестиций. Компания автоматизировала бухгалтерию для малого и среднего бизнеса. Вместо ИИ работу выполняла «армия» наемных бухгалтеров в Техасе и на Филиппинах. Они завалили большое количество проектов из-за высокой нагрузки, что привело к убыткам клиентов. А в 2023 году разоблачили компанию Presto Automation Inc. Вместо ИИ заказы в ресторанах преимущественно обрабатывали удаленные сотрудники.

Люди для ИИ

Люди часто воспринимают ИИ как «волшебную палочку», не зная реальных возможностей и ограничений технологии. ИИ хорош для типовых алгоритмизированных задач. Так, в области распознавания документов (OCR) нейросети хорошо справляются со стандартными формами. Проблемы начинаются, когда форма нестандартная, текст рукописный, изображение документа не идеальное, и т. д.

Другой факт — заказчикам решений не всегда на самом деле нужен ИИ. Иногда они могут искать более дешевый персонал. Согласно исследованию Массачусетского технологического университета, для большинства задач, связанных с компьютерным зрением, труд людей выгоднее, чем автоматизация.

На фоне мифов о всемогуществе ИИ, а также страшилок о том, что машины отнимут работу у 40–60% специалистов, мы часто забываем, в какой степени разработанные ИИ-продукты все еще тесно связаны с людьми. В течение многих лет компании пытались сократить расходы, автоматизировать кол-центры, предлагая клиентам общаться с ботами. Однако мы по-прежнему видим (или слышим) фразу «перевожу на оператора», когда общение даже слегка выходит за рамки сценария бота.

Несмотря на бум ИИ, до сих пор не существует совершенных алгоритмов машинного обучения. Чтобы решать прикладные задачи и компенсировать недостатки нейросетей технологические компании нанимают людей. Их называют ИИ-тренерами, операторами, разметчиками или верификаторами данных. В зависимости от задач, работа на такой позиции требует разного рода квалификации.

Верификатор вручную исправляет данные, которые нейросеть распознала плохо. Так он обучает ее работать лучше. Методику называют human-in-the-loop (HITL) — «человек в цикле машинного обучение». Уважающая себя компания-разработчик никогда не скрывает от общества и инвесторов, что использует в своей работе ручной труд. Это абсолютно нормальный вариант, если речь идет о качественной разметке и проверке данных.

Tesla держит открытыми вакансии для модераторов данных. Беспилотный транспорт до сих пор не получил распространения на дорогах общего пользования из-за несовершенства алгоритмов, которые регулярно требуется улучшать. А Amazon тренирует нейросети на базе крауд-платформы Amazon Mechanical Turk.

Google разрабатывает решения для оцифровки документов (Documents AI) и применяет в процессе распознавания верификацию силами людей. Компания открыто рассказывает об этом процессе. Сервис Grammarly, помогающий писать по-английски стильно и без ошибок, работает с профессиональными лингвистами, которые обучают ИИ грамматике языка. А Rutube использует похожую методику проверки контента: ИИ присылает модератору на утверждение сомнительные моменты, которые находит в видео.

Бизнес в стиле HITL

HITL — это процесс последовательной (итеративной) обратной связи, которую человек или команда людей дают обученной модели искусственного интеллекта. Непрерывная обратная связь улучшает способность модели распознавать данные. По аналогии с тем, как родители направляют развитие ребенка, объясняя, что кошки говорят «мяу», а собаки — «гав». Этот термин также применяют для процесса разметки данных для обучения ИИ. HITL-разметка стала очень востребованной с ростом популярности машинного обучения, где основная проблема до сих пор — отсутствие качественных данных.

Для обучения ИИ часто нужно разметить очень много данных. Эту нагрузку перекладывают на краудсорсинговые платформы, где одновременно работают десятки тысяч человек.

В 2016 году Александр Ван основал компанию Scale AI. Стартап занялся разметкой данных в интересах разработчиков ИИ-решений. За услугами Scale AI в очередь выстроились производители беспилотных автомобилей, систем распознавания изображений и текста, сервисы видеоанализа и даже госструктуры. В числе заказчиков — Tesla, Open AI и его канадский конкурент Cohere — компания на пороге миллиардных инвестиций. В 2021 году инвесторы оценивали бизнес Scale AI в $7,3 млрд. В Remotasks (дочерняя компания Scale AI), которая занимается разметкой данных, работают около 240 тыс. человек.

В России есть «Яндекс.Толока», публичный краудсорсинговый проект для разметки данных. За небольшое вознаграждение пользователи выполняют разнообразные задания, в том числе по маркировке картинок (где светофор, где автобус), распознаванию цифр, текста, звуков. Люди дают массу определений различным объектам и помогают обучить ИИ. «Яндекс» также нанимает AI-тренеров для обучения собственной модели генеративного ИИ.

Однако процессы HITL могут быть не очень быстрыми и ресурсоемкими. Люди могут ошибаться. Если человеческая ошибка останется незамеченной, это может отрицательно повлиять на производительность и результаты модели. В 2020 году издание The Intercept рассказало, как сотрудники из исследовательского подразделения Amazon получили неограниченный доступ к видеоконтенту с устройств для умного дома компании Ring, подконтрольной Amazon. Инженеры должны были контролировать недочеты ПО для умного дома. В теории они могли наблюдать за частной жизнью пользователей. Проблема оказалась в том, что в цифровом хранилище Amazon отсутствовало шифрование данных. Информацию можно было соотнести с конкретными людьми.

Вопросы этики

Безопасность — аргумент, который любят применять разработчики on-premise решений (on-premise — модель доступа к вычислительным ресурсам, подразумевающая, что серверы с корпоративным ПО находятся непосредственно в собственности организации. — Прим. ред.) в споре с поставщиками облачных сервисов (SaaS). В действительности данные чаще крадут уже в готовом виде из базы данных на стороне клиента по вине сотрудников.

Когда компании используют краудсорсинговые системы для обучения ИИ, может возникнуть соблазн и вовсе перепоручить людям большую часть работы. Пример с Presto Automation показателен. Зачем вкладываться в разработку дорогих технологий, если можно быстро и дешево решить вопрос «силой толпы»? Конечно, конкурентный рынок быстро съест «предприимчивого» игрока.

Рынок компьютерного зрения развивается высокими темпами. Со временем количество HITL-задач будет уменьшаться, а автономность ИИ будет расти. До какой степени расти — открытый вопрос.

Преимущества и недостатки крауд-платформ, применяемых в том числе для HITL, активно обсуждают. Например, идут споры о защите персональных данных крауд-работников. Для допуска к работе людей просят предоставить документы и селфи. Утечка подобных данных может иметь неприятные последствия, несет финансовые риски для сотрудников.

С другой стороны, если человека допускают к работе с данными, компания должна убедиться в его благонадежности. Никто же не отказывается предоставить паспорт и другие документы, когда устраивается на офисную позицию. Тем не менее данные сотрудников должны быть надежно защищены.

Специфика краудсорсинга

Другая проблема — очень маленькая оплата за большое количество однотипного труда. Справиться с разметкой большого количества данных Scale AI помогают удаленные сотрудники из стран Африки или Малайзии. Людям могут платить центы в час. Тем не менее, когда данные размечают в интересах госведомств, компания нанимает операторов на территории США, где минимальная оплата за такую работу — от $25 в час.

«Биорг», например, использует в проектах по оцифровке и разметке данных собственный краудсорсинговый ресурс, который работает на российских серверах. Если речь идет о стандартных документах — паспортах, водительских удостоверениях, СНИЛС, — за верификацию их фрагментов действительно не платят столько же, сколько за документы на редких языках.

Такая занятость — способ заработать дополнительные деньги для удаленных сотрудников из регионов. Работой могут заниматься студенты, мамы в декрете, активные люди на пенсии. С другой стороны, если нужны лингвисты для верификации данных, например, на старотатарском языке, такие специалисты могут заработать на проекте больше, чем на основном месте работы.

Есть проекты, где применять ИИ трудно или нецелесообразно в связи с очень сложными для распознавания видами данных. Это могут быть ведомственные географические планшетные карты. Пример задачи — разметить сельхозугодья в регионах РФ. Сотрудники, подключаемые к оцифровке, — это опытные картографы с соответствующим заработком. Преимущество краудсорсинга в данном случае — возможность подключать специалистов из разных регионов и часовых поясов. За счет этого скорость работы возрастает в два раза.

Люди обучают и контролируют результаты работы ИИ, чтобы получить уверенность в качестве автоматизации даже типовых процессов, таких как распознавание паспорта. Верификация и обучение особо важны для непрерывных улучшений в ИИ-моделях на производстве, транспорте, в сфере безопасности, медицины, в сфере обработки данных и распознавания документов в широком смысле.