uaplace

25 Июнь, Понедельник 2018

Google обучила искусственный интеллект играть в шахматы

Чтобы достичь уровня гроссмейстера, интеллекту понадобилось 4 часа.

В статье, опубликованной в онлайн-библиотеке Arxiv.org, инженеры из Google в деталях рассказывают о том, как их новейшая ИИ-конфигурация AlphaZero смогла развить "сверхчеловеческие возможности" в шахматах всего за несколько часов.

После того, как в систему внесли лишь базовый набор правил (без стратегий), AlphaZero потребовалось всего четыре часа на то, чтобы освоить игру настолько хорошо, что перед ним пал даже самый сильный в мире шахматный движок Stockfish.

После серии из 100 игр против Stockfish ИИ-алгоритм AlphaZero одержал победу 25 раз за игру белыми фигурами и три раза за игру черными. Все остальные партии обе системы сыграли вничью. В итоге Stockfish не смогла победить ни одного раза, а AlphaZero, в свою очередь, ни одного раза не проиграла.

"У нас появился новый повелитель шахмат. Это без сомнений революционизирует игру, но было бы неплохо подумать и о том, как это может быть применено вне шахмат", — прокомментировал результаты Дэвид Крамалей, исследователь шахматной игры и главный редактор сайта Chessable.

Система AlphaZero основывается на наработках ИИ-алгоритмов AlphaGo и AlphaGo Zero, создателями которых являются инженеры лаборатории искусственного интеллекта DeepMind, принадлежащей Google. DeepMind занимается совершенствованием этих ИИ-алгоритмов уже в течение нескольких лет, попутно побеждая с помощью них лучших в мире игроков в древнюю логическую игру го. Кульминация победной серии состоялась в октябре этого года, когда новая и полностью автономная версия ИИ-алгоритма AlphaGo, обучавшаяся исключительно на игре с самой собой, а не против человеческих оппонентов, победила все свои предыдущие версии.

В то же время предыдущие версии алгоритма AlphaGo Zero частично обучались игре с помощью наблюдения за тем, как играют люди. Таким образом разработчики хотели помочь ей в изучении стратегий игры, но, как оказалось, на самом деле это ее лишь замедлило в развитии. Полное предоставление самой себе при обучении сказалось на существенно более эффективных результатах AlphaGo Zero в соревнованиях один на один.

Однако развитие сферы ИИ происходит настолько быстро, что то, что было достигнуто к октябрю этого года, могло уже устареть. В опубликованной статье инженеры DeepMind отмечают, как самая последняя версия AlphaZero перешла на новый уровень и способна заниматься решением более широкого круга задач. Это означает, что теперь AlphaZero способна не только великолепно играть в шахматы. Она также отлично справляется с сёги (японской настольной игрой) и го, в которых достигнуть совершенства ей удалось всего за 2 и 8 часов соответственно.

Пока ни инженеры Google, ни инженеры DeepMind открыто не выступали с комментариями по поводу новых результатов своей работы, они ожидают стороннего и независимого экспертного анализа статьи в Arxiv.org. Правда, уже понятно, что восхождение данного алгоритма к вершинам искусственного интеллекта еще далеко до своего завершения, но уже сейчас он настолько крут, что его признают даже гроссмейстеры.

"Всегда хотел узнать, как бы выглядела игра в шахматы между более развитыми видами, высадившимися на Земле. Теперь знаю", - прокомментировал результаты AlphaZero гроссмейстер Петер Хейне Нильсен.

Добавить комментарий