Искусственный интеллект AlphaGo от DeepMind, принадлежащей Alphabet, без проблем одолел лучших игроков мира в настольную игру го. Теперь же компания представила ещё более продвинутый ИИ под названием MuZero. В отличие от своих предшественников, он способен
вырабатывать эффективную стратегию, не зная правил игры, и демонстрировать при этом лучшие результаты за всю историю.
[embedded content]
Сообщается, что новый ИИ умеет эффективно выстраивать стратегию поведения в
крайне вариативных ситуациях без предварительной подготовки и изучения правил игры. MuZero не только лучше справляется с го и шахматами,
но и освоил набор классических игр Atari.
Суть нового алгоритма в адаптивной
стратегии, позволяющей найти эффективные решения для победы. По словам
исследователей, в чём-то программа похожа на человека: она принимает решения на основе
трёх состояний — прошлого опыта, текущей диспозиции и приоритета, который позволит с наибольшей вероятностью выиграть матч.
Чем больше времени MuZero получает
на выбор действия, тем лучше результат. Между тем даже после ввода
ограничения на количество симуляций в игре Pac-Man ИИ смог добиться
хороших показателей. Представители Alphabet заявляют, что возможности MuZero
однажды могут помочь в решении сложных проблем в таких областях, как
робототехника, где нет простых правил.
Источник: engadget.com