MUZERO
MuZero: modelo de inteligencia artificial desarrollado por DeepMind que puede aprender a jugar juegos de mesa, como el ajedrez y el Go, sin conocer las reglas del juego. Se utiliza en aplicaciones de juegos y simulaciones. El algoritmo utiliza un enfoque similar a AlphaZero . Coincidió con el rendimiento de AlphaZero en ajedrez y shogi, mejoró su rendimiento en Go (estableciendo un nuevo récord mundial), y mejoró el estado del arte en el dominio de un conjunto de 57 juegos de Atari (el Entorno de aprendizaje de Arcade), un dominio visualmente complejo.
MuZero fue entrenado a través del juego automático, sin acceso a reglas, libros de apertura o bases de tablas de finales. El algoritmo entrenado utilizó los mismos algoritmos convolucionales y residuales que AlphaZero, pero con un 20% menos de pasos de cálculo por nodo en el árbol de búsqueda.

Comentarios
Publicar un comentario