MUZERO

abril 11, 2023

MUZERO

MuZero: modelo de inteligencia artificial desarrollado por DeepMind que puede aprender a jugar juegos de mesa, como el ajedrez y el Go, sin conocer las reglas del juego. Se utiliza en aplicaciones de juegos y simulaciones. El algoritmo utiliza un enfoque similar a AlphaZero . Coincidió con el rendimiento de AlphaZero en ajedrez y shogi, mejoró su rendimiento en Go (estableciendo un nuevo récord mundial), y mejoró el estado del arte en el dominio de un conjunto de 57 juegos de Atari (el Entorno de aprendizaje de Arcade), un dominio visualmente complejo.

MuZero fue entrenado a través del juego automático, sin acceso a reglas, libros de apertura o bases de tablas de finales. El algoritmo entrenado utilizó los mismos algoritmos convolucionales y residuales que AlphaZero, pero con un 20% menos de pasos de cálculo por nodo en el árbol de búsqueda.

Buscar este blog

Análisis y Diseño de Sistemas Informáticos

MUZERO

Comentarios

Publicar un comentario

Entradas populares

Arreglos, características, vectores y clases en un sistema informático

ALPHAFOLD