Исследователи из Массачусетского технологического института и Университета Вашингтона разработали новый метод моделирования поведения с учетом вычислительных ограничений. Модель может предсказывать будущие действия на основе прошлого поведения. Она направлена на улучшение сотрудничества систем ИИ с людьми путем понимания и адаптации к человеческим иррациональностям и процессам принятия решений.
Исследователи Массачусетского технологического института и других университетов разработали схему, которая моделирует иррациональное или субоптимальное поведение человека или агента ИИ, основываясь на их вычислительных ограничениях. Их методика может помочь предсказать будущие действия агента, например, в шахматных матчах.
Для создания систем ИИ, способных эффективно сотрудничать с людьми, необходимо иметь хорошую модель человеческого поведения. Но люди склонны вести себя неоптимально при принятии решений. Эта иррациональность, которую особенно трудно смоделировать, часто сводится к вычислительным ограничениям. Человек не может тратить десятилетия на обдумывание идеального решения одной задачи.
Исследователи разработали способ моделирования поведения агента, будь то человек или машина, с учетом неизвестных вычислительных ограничений, которые могут препятствовать способности агента решать проблемы. Их модель позволяет автоматически определить вычислительные ограничения агента, видя лишь несколько следов его предыдущих действий. Результат, так называемый «бюджет вычислений» агента, может быть использован для предсказания его будущего поведения.
В своей работе они демонстрируют, как их метод может быть использован для определения целей по предыдущим опыту для предсказания последующих ходов игроков в шахматных матчах. Их методика соответствует или превосходит другой популярный метод моделирования такого типа принятия решений. Эта работа может помочь научить системы ИИ поведению людей, что позволит им лучше реагировать на действия своих собеседников.
«Если мы знаем, что человек собирается совершить ошибку, основываясь на том, как он вел себя раньше, агент ИИ может вмешаться и предложить лучший способ решения. Или агент может приспособиться к тем слабостям, которые есть у его собеседников. Возможность моделировать человеческое поведение — важный шаг на пути к созданию ИИ-агента, который сможет помогать человеку», — говорит Атул Пол Джейкоб, аспирант электротехники и информатики (EECS).
Исследователи уже несколько десятилетий строят вычислительные модели человеческого поведения. Многие предыдущие подходы пытаются учесть неоптимальное принятие решений, добавляя помехи в модель. Вместо того чтобы агент всегда выбирал правильный вариант, в модели может быть заложено, что агент делает правильный выбор в 95% процентах случаев. Однако эти методы не могут учесть тот факт, что люди не всегда ведут себя неоптимально одинаково. Другие специалисты Массачусетского технологического института также изучали более эффективные способы планирования и выведения целей в условиях неоптимального принятия решений.
При построении своей модели Джейкоб и его соавторы черпали вдохновение в предыдущих исследованиях шахматистов. Они заметили, что при совершении простых ходов игрокам требуется меньше времени на обдумывание, а в сложных матчах более сильные игроки тратят больше времени на планирование, чем более слабые.
«В конце концов, мы увидели, что глубина планирования, или то, как долго человек думает над проблемой, является очень хорошим косвенным показателем поведения человека», — говорит Джейкоб. Они создали систему, которая позволяет определить глубину планирования агента на основе его предыдущих действий и использовать эту информацию для моделирования процесса принятия решений.
Первый шаг в их методе включает в себя запуск алгоритма на определенное время для решения изучаемой проблемы. Например, если они изучают шахматный матч, они могут запустить алгоритм игры в шахматы на определенное количество шагов. В конце исследователи могут увидеть, какие решения принимал алгоритм на каждом шаге.
Их модель сравнивает эти решения с поведением агента, решающего ту же задачу. Она согласует решения агента с решениями алгоритма и определяет шаг, на котором агент прекратил планирование.
Ранее исследователи представили инновационную технологию распознавания эмоций в реальном времени, использующую персонализированный интерфейс с автономным питанием для всестороннего эмоционального анализа. Эта технология, перспективная для портативных устройств, знаменует собой скачок к персонализированным услугам на основе эмоций и улучшенному взаимодействию человека и машины.