|
Новая версия программы игры в го на базе искусственного интеллекта AlphaGo Zero полностью отказалась от анализа сыгранных людьми партий в пользу самообучения. Спустя 3 дня AlphaGo Zero победил своего предшественника AlphaGo, который в свою очередь сумел обыграть лучшего в мире живого мастера игры. А спустя 40 дней новая версия в 90% случаев побеждала усовершенствованного AlphaGo, который обучался на анализе человеческих партий.
В свежую версию программы от подразделения Гугла DeepMind разработчики загрузили только базовые правила игры и предоставили ей полную свободу самообучения. Программа играла сама с собой и оставляла в памяти только успешные стратегии.
По мнению специалистов, эта разработка избавила ИИ от человеческих ограничений. Ведущий программист проекта Дэвид Сильвер рассказал, что AlphaGo Zero проходила все модели поведения – от начинающего до опытного игрока, а затем перешла к совершенно непредсказуемым ходам.
По оценке DeepMind, AlphaGo Zero – самый совершенный на сегодня игрок в эту древнюю игру, который может послужить для обучения как начинающих, так и опытных игроков. |
|