Нейросеть Google под названием AlphaStar обыграла двух профессиональных игроков в StarCraft II с общим счетом 10-1. И это новость совсем не про видеоигры.
Как известно, после того, как AlphaGo обыграла Ли Седоля в 2016 году в го, люди больше не могут конкурировать с машинами в играх с полной информацией, где все участники игры знают все, что происходит в матче. Эпоха была открыта в 1998 году Каспаровым и DeepBlue и вот сейчас подошла к концу.
Следущая проблема для машины — игры с неполной информацией, которых гораздо больше, и которые сильно приближены к реальной жизни. В реальной жизни мы практически ничем больше не занимаемся, только принимаем решения в условиях дефицита информации.
Так что как только игры машин выйдут за пределы полной информации, тут и начнется самое интересное. Утверждалось, что следующий фронтир для нейросетей покер, но некоторые видеоигры, похоже, даже более интересны.
StarCraft в частности давно стала киберспортивной дисциплиной, поскольку в ней нет очевидной выигрышной стратегией, ценится умение быстро принимать тактические решения и адаптироваться к действиям противника. И вот все это теперь умеет Google.
Плюс видеоигр для машинного обучения в том, что ИИ может учится очень быстро, разыгрывая и анализируя очень много партий, не завися от медленного аналогового мира и человеческих решений. Примерно по той же логике беспилотные автомобили могут тренировать навыки дорожного движения внутри видеоигры GTA — не очень точно, но очень быстро.
Машина должна в сжатые сроки научиться тому, чему мы научились в результате миллионов лет эволюции: адаптироваться к принятию решений в условиях неполноты информации и меняющейся ситуации.
Из истории про AlphaStar не очень понятно, насколько ограничено было поле зрение программы во время игры — человеку, играющему в StarCraft нужно управлять камерой, чтобы видеть разные части игрового поля, машина может обойтись без этого. В любом случае, программа совершала меньше действий в минуту, чем оба профессиональных игрока-человека. Интересен кейс о том, как одному из игроков удалось выиграть одну партию.
Но самое важное в этой истории в том, что игроки описывают стратегию AlphaStar в качестве «инопланетной»: программа играет не так, как играют люди, и не так, как они ожидали от алгоритмов.
Это означает, что нейросети, шагнувшие в мир с неполнотой информации, дадут нам совершенно иные способы решения проблем, не похожие на те, которые предопределены эволюцией наших когнитивных систем.
Вот к чему нужно готовиться. Aliens-studies только начинаются, причем чужих воспитаем мы сами.