Новости 10.02.2017

В Deep Mind узнали о стремлении ИИ к конкуренции ради выгоды

Вопрос сотрудничества, а также условий, при которых оно возможно между действующими исключительно в своих интересах агентами является фундаментальным вопросом социальных наук, рассуждают ученые. «Дилемма заключенного» из теории игр — одна из моделей, описывающих этот феномен.

Исследователи проверили способность к сотрудничеству двух ИИ-алгоритмов на примере простых видеоигр.

В первой игре два игрока собирают яблоки из центральной кучи. Они имеют возможность поразить конкурента лазерным лучом, лишающим его сил. Это дает первому игроку собрать больше яблок. Согласно результатам первого эксперимента, ИИ могут корректировать стратегию в зависимости от условий среды. Если яблок становится много, то они редко пользуются лазерным лучом. Если же яблок мало, то алгоритмы конкурируют за каждое яблоко и при любом удобном случае выводят конкурента из строя.

Когда в игру ввели искусственный интеллект с большей вычислительной мощностью, то выяснилось, что алгоритм выбирает конкурентную модель поведения независимо от условий.

Ученые также проверили взаимодействие алгоритмов в условиях «социальной дилеммы». В такой игре проигрывают все участники, ведущие себя эгоистично. Согласно условиям игры, два игрока должны ловить одну и ту же мишень. При поимке очки получают оба игрока. В таких случаях два ИИ выбирают стратегию сотрудничества.

«Вследствие этого мы сможем лучше понимать и контролировать сложные системы с множеством агентов, такие как экономика, транспортная система или экологическое состояние нашей планеты — все это зависит от нашего продолжающегося сотрудничества», — считают ученые.

Дилемма заключенного — классическая задача из теории игр. Условия задачи таковы: двое подозреваемых помещаются в две одиночные камеры. Без признаний подозреваемых у полиции нет достаточных доказательств для предъявления серьезных обвинений, и максимальный срок, который грозит каждому подозреваемому — год. Чтобы выманить признания у арестованных, полицейские предлагают каждому из них сделку. Если подозреваемый даст показания на другого подозреваемого, то первый будет отпущен, но его коллега получит три года заключения. Если оба сознаются, то каждый получит по два года заключения. Согласно теории игр, агенты, действующие рационально, при таком выборе должны всегда свидетельствовать против другого арестованного.

Темы

2017