Алгоритм искусственного интеллекта Google DeepMind научился проходить трехмерные лабиринты в стиле Doom

Главная › Наука › Алгоритм искусственного интеллекта Google DeepMind научился проходить трехмерные лабиринты в стиле Doom

14 Дек, 2016

Специалисты компании Google, занимающиеся разработкой и совершенствованием системы искусственного интеллекта DeepMind, построенной на базе нейронной сети, которая недавно победила человека в игре Го, постоянно ищут новые пути обучения своей системы тонкостям восприятия окружающего мира. И одним из таких путей является погружение искусственного интеллекта в среду виртуальной реальности, где достаточно просто воспроизводятся даже самые сложные ситуации, предоставляя искусственному интеллекту практически неограниченный объем исходных данных.

В недалеком прошлом система DeepMind уже была обучена действиям в простейшем двухмерном пространстве на примере старых игр Breakout и Pac-Man, а недавно разработчики системы ввели ее в третье измерение, дав ей возможность взаимодействовать с программой, генерирующей трехмерные лабиринты, хорошо известные всем нам по культовой игре Doom.

В отличие от традиционных компьютерных игр, алгоритм искусственного интеллекта DeepMind не встроен в код программы и не получает от нее напрямую никаких данных. Он в буквальном смысле смотрит на экран так, как это делает человек, и принимает решения о выборе направления дальнейших перемещений. Суть игры проста, программа Labyrinth генерирует лабиринт совершенно случайным образом, а система DeepMind, перемещаясь по этому лабиринту, занимается поисками призов и дверей, ведущих в другие участки лабиринта. И в отличие от Doom-а, в этой игре нет никаких толп монстров и не утихающей ни на минуты стрельбы.

Когда программа DeepMind находит приз, она зарабатывает одно очко, а когда она находит дверь и проходит в нее, ей насчитывается 10 очков. Один «забег» в виртуальный лабиринт длится 60 секунд и целью игры является получение наибольшего количества очков.

Первоначально, необученная система DeepMind смогла зарабатывать по два очка за тур игры, но после того, как она сделала более 200 миллионов «шагов» по виртуальному лабиринту в течение трех дней, она получала в среднем по 50 очков за игру. Такой прогресс демонстрирует то, что система искусственного интеллекта самостоятельно нашла самую «разумную» стратегию исследования лабиринта с целью поиска призов и дверей.

Полученные исследователями компании Google результаты могут оказать существенное влияние на дальнейшее развитие систем искусственного интеллекта и на развитие области компьютерных игр. Лучшие алгоритмы распознавания изображений могут сделать роботов и автомобили более интеллектуальными, более функциональными и более безопасными для окружающих. При этом, системам управления этими роботами и автомобилями будет не обязательно учиться на собственных ошибках в реальности, они, не причиняя ущерба ничему материальному, смогут пройти процесс самообучения с специально предназначенной для этого виртуальной среде.

В компьютерных играх будущего игроки-люди смогут сражаться против искусственного интеллекта, который обладает способностью самообучения и выработки новых стратегий, а не против жестко запрограммированных ботов, которые имеют некоторые регулируемые параметры уровня их игры. Игровые противники с искусственным интеллектом будут обретать свою собственную индивидуальность и одинаковые игры, установленные на компьютерах различных людей, будут реагировать по-разному на одни и те же события, что внесет в эти игры достаточно существенное разнообразие.