Идеальная ставка - Адам Кучарски
Шрифт:
Интервал:
Но DeepFace не намного отстала от человека. После долгой отладки и многочисленных замен искусственных нейронов программа распознала 97 % лиц. Даже когда ей предложили распознать лица с роликов на YouTube (с менее четкими и более мелкими изображениями), DeepFace справилась в 90 % случаев.
У покерной программы Даля на приобретение опыта тоже ушло немало времени. Чтобы натренировать ее, ученый заставил множество ботов непрерывно играть друг с другом – компьютерные программы сделали миллионы ставок и миллионы раз блефовали, совершенствуя свой искусственный интеллект. Когда боты поднаторели в покере, Даль заметил, что они способны на удивительные вещи.
В своем фундаментальном труде «Вычислительные машины и разум», написанном в 1952 году, Тьюринг отмечает, что многие люди скептически относятся к возможности создания искусственного интеллекта. Один из аргументов – его еще в XIX веке выдвинула математик Ада Лавлейс – заключается в том, что машины не способны ничего создавать сами, они делают лишь то, что им предписано. Значит, удивить нас машина не может.
Тьюринг не соглашался с Адой Лавлейс, утверждая, что машинам часто удавалось его удивлять. Обычно он списывал подобные «сюрпризы» на собственный недосмотр – ошибки в вычислениях, небрежность, допущенную при написании программы. От подобных грехов не застрахованы ни примитивные вычислительные машины, ни высокоскоростные финансовые алгоритмы. Как мы уже видели, такие ошибки часто приводят к неприятным неожиданностям.
Однако иногда ошибка может сыграть на пользу компьютеру. В самом начале поединка с Каспаровым DeepBlue сделал неожиданный, тонкий и – по-другому не скажешь – умный ход, чем привел противника в полное замешательство. Вместо того чтобы взять уязвимую пешку, DeepBlue передвинул ладью в позицию обороны. Каспаров не понимал, какую цель преследовал компьютер. По общему мнению, этот маневр повлиял на дальнейший ход матча, убедив российского гроссмейстера, что DeepBlue значительно превосходит всех его предыдущих оппонентов.
На самом деле, совершая этот ход, DeepBlue не руководствовался ничем. Попав в ситуацию, для которой у него не было инструкций, – что, согласно теореме Гёделя, рано или поздно должно было случиться, – компьютер начал действовать хаотично. Переломный момент в стратегии DeepBlue не был свидетельством его изобретательности; машине просто-напросто… повезло.
Тьюринг признавал: причиной подобных сюрпризов становятся действия человека и правила, которые он устанавливает – или не устанавливает. Но покерные боты Даля совершали неожиданные поступки не из-за человеческой оплошности. Сюрпризы возникали скорее как следствие процесса обучения. Во время тренировочных игр Даль заметил, что один из ботов использует тактику «флоатинг». После открытия трех общих карт игрок коллирует – принимает ставку соперника без повышения. Как только открывается четвертая карта – терн, игрок резко поднимает ставку в надежде напугать противника и заставить его сбросить карты. Сам Даль с подобной техникой ранее не встречался, но опытным покеристам она хорошо известна. Кроме того, флоатинг требует большого мастерства. Чтобы удачно его выполнить, игрок должен уметь не только оценивать имеющиеся у него на руках карты, но и «считывать» соперника. Кого-то взять на испуг легче, кого-то – труднее, а покеристу, выполняющему флоатинг, меньше всего на свете нужно агрессивно поднять ставку и вместо того, чтобы забрать банк, быть вынужденным раскрыть карты.
На первый взгляд, это чисто человеческая стратегия. Как может бот самостоятельно ей научиться? Ответ: это неизбежно. Иногда игра зависит от холодного расчета гораздо больше, чем мы думаем. Такую же закономерность фон Нейман обнаружил в отношении блефа. Это не каприз людской натуры, а тактика, необходимая при оптимальной стратегии.
В своей статье в New York Times Каплан пишет, что игроки часто общаются с компьютером Даля как с человеком. Они придумывают ему прозвища и даже обращаются к нему так, будто за стеклом перед ними находится не металлическая коробка, а живой соперник. Похоже, компьютерному картежнику удается заставить своих партнеров забыть о том, что они играют с программой. Если бы тест Тьюринга представлял собой не интервью, а партию в техасский холдем, бот Даля его несомненно прошел бы.
В том, что люди воспринимают покерных ботов как самостоятельных личностей, а не продукт деятельности программиста, возможно, нет ничего странного. В конце концов, самые лучшие компьютерные игроки превосходят в мастерстве своих создателей. В бота не нужно загружать большой объем информации – он научится всему сам. Таким образом, даже мало что понимающий в игровых стратегиях разработчик способен создать сильного виртуального покериста. «Можно делать удивительные вещи, зная при этом совсем мало», – отмечал Джонатан Шеффер. По правде говоря, ученые из Университета Альберты, хоть и создали одного из лучших покерных ботов в мире, сами были далеко не блестящими игроками. «Большинство из нас вообще не разбираются в покере», – признавался один из разработчиков, Майкл Джонсон.
В игре с лимитированными ставками созданный Далем бот мог научиться побеждать почти любого, однако умную машину поджидала ловушка. Согласно принятым в Лас-Вегасе правилам, игроки-компьютеры должны вести себя одинаково по отношению ко всем соперникам и не подстраиваться под опытных игроков или новичков. Это означало, что ради допуска в казино бот Даля должен был пожертвовать определенной долей своего мастерства. С точки зрения программы, необходимость следовать фиксированной стратегии существенно осложняет задачу. Дав машине консервативный взрослый мозг вместо восприимчивого детского, вы лишаете ее возможности научиться извлекать выгоду из человеческих слабостей и таким образом отбираете у нее огромное преимущество, потому что слабостей у людей предостаточно.
В 2010 году на сайте New York Times появилась онлайн-версия игры «камень-ножницы-бумага». Она и ныне там – можете поиграть, если хотите. Вашим противником будет очень сильная программа. Всего нескольких раундов достаточно, чтобы понять: победить компьютер трудно; сколько бы попыток вы ни предприняли, в большинстве случаев он будет выигрывать.
Согласно теории игр, оптимальной стратегией для «камень-ножницы-бумага» является выбор наугад. Но практика показывает, что у любителей «камень-ножницы-бумага» с оптимальностью дела обстоят неважно. В 2014 году Чжицзянь Ван и группа исследователей из Чжэцзянского университета установили, что участники этой игры стремятся следовать определенному поведенческому сценарию. Ученые задействовали для эксперимента 360 студентов, которых разделили на группы, и каждой группе предложили сыграть по 300 раундов. Выяснилось, что многие участники придерживались стратегии «победил – закрепил, проиграл – поменял». Выиграв раунд, они повторяли свои действия в следующей игре, а проиграв – выбрасывали в следующем раунде фигуру, которая их только что побила. На протяжении эксперимента участники в среднем выбрасывали каждую фигуру одинаковое число раз, но их выбор, очевидно, не был хаотичным.
Ирония состоит в том, что даже случайные последовательности содержат в себе неслучайные закономерности. Помните нерадивых журналистов из Монте-Карло, которые наобум писали выпавшие числа рулетки? Создать последовательность, которая сошла бы за хаотичную, не так-то легко. Во-первых, для этого необходимо, чтобы красное и черное выпадали приблизительно одинаковое число раз. С этой задачей журналисты худо-бедно справились, и первый этап проверки их данные у Карла Пирсона прошли. Однако журналисты оплошали с чередованием цветов, которое было более частым, чем в настоящих произвольных последовательностях.
Поделиться книгой в соц сетях:
Обратите внимание, что комментарий должен быть не короче 20 символов. Покажите уважение к себе и другим пользователям!