Inicio Aprender ajedrez Aperturas Las aperturas favoritas de Alphazero

Las aperturas favoritas de Alphazero

En este blog, hemos hablado muchísimo sobre Alphazero y sobre sus creadores Deepmind, y también sobre el famoso duelo contra Stockfish. Sin embargo, en este artículo, me he propuesto dar un paso adicional, tratando de desentrañar algunos de los secretos de sus aperturas y contrastar si, de algún modo, un aficionado medio podría utilizar parte del “conocimiento” de esta magnífica bestia en sus partidas.

Garry Kasparov, escribió el prólogo del mejor libro que se ha escrito hasta la fecha sobre Alphazero, el libro es Game Changer de Matthew Sadler y Natasha Regan (New in Chess, no está traducido al español) que presenta un análisis en profundidad de Sadler, un gran maestro y ex campeón británico, de motivos recurrentes en el estilo de AlphaZero que pueden ser adaptados por jugadores humanos.

Kasparov, con su habitual humildad, explicaba en dicho prólogo que: “el estilo dinámico y tendente a los sacrificios de AlphaZero es reflejo del mío. AlphaZero prefiere la actividad de las piezas y las oportunidades de ataque“. También lo compara con “Alexander Alekhine, con sacrificios deslumbrantes y afición por posiciones desequilibradas”.

El estilo de juego de Alphazero y su relación con las aperturas.

Entre los muchos temas que Sadler identifica, hay varios que son materia recurrente y que podrían afectar a cómo Alphazero elige y valora sus aperturas. Veamos estos conceptos:

¿Qué temas estratégicos valora especialmente Alphazero?

A Alphazero le encanta avanzar su peón h, y que encabece sus ataques a largo plazo con un avance a h6 para condenar a una torre o alfil en h8.
En el gambito de dama variante del cambio, evita el clásico ataque de minorías y permite el cambio que “estropea” la estructura de peones Ag4xf3 duplicando los peones f de las blancas para crear oportunidades de ataque.
Valora mucho la movilidad de las piezas y está dispuesto a sacrificar material por una iniciativa compleja.
Énfasis en puestos avanzados: Alphazero utiliza una gran variedad de formas de asegurar valiosos puestos para sus piezas, desde el caballo y el alfil hasta el propio rey.
AlphaZero tiene la habilidad de maximizar la movilidad de sus propias piezas y restringir las piezas de su oponente. Es especialmente llamativo cómo se las ingenia para restringir el rey contrario.
Posiciones de alfiles de distinto color. Al contrario de lo que podría pensarse, Alphazero tiene una predilección por este tipo de posiciones. Seguramente amparado en lo que dicen los conceptos del ajedrez: en posiciones de alfiles de distinto color el que ataque tiene las de ganar.
Sacrificios a cambio de tiempo y espacio, ¡como si fuera Einstein! AlphaZero hace muchos sacrificios brillantes para conseguir ventaja posicional a largo plazo.
Enroques opuestos: esta es otra de las preferencias de la máquina, Alphazero ha desarrollado algunos de sus ataques más asombrosos en partidas con enroques opuesos.

¿Cómo eligió sus aperturas Alphazero?

En su proceso de aprender ajedrez y hacerse más y más fuerte a cada segundo, AlphaZero aprendió aperturas. Por si no lo sabes a estas alturas, Alphazero aprendió a jugar de cero (como no podía ser de otro modo con ese nombre 🙂 ), por lo que en su proceso de invención “personal” no participó ninguna base de datos ni mano humana. El proceso se produjo a través de ensayo y error en una poderosa red neuronal artificial.

Como puedes ver en el gráfico posterior, Alphazero empezó ensayando distintas aperturas, concretamente doce. En el gráfico verás una línea que oscila sobre dos ejes: el horizontal es el número de horas que estuvo dedicando a dicha apertura, y en vertical el grado de interés o de adherencia a dicha apertura.

Las gráficas muestran muy bien la proporción de veces que Alphazero jugó una apertura determinada durante sus partidas de autoentrenamiento en función del tiempo de entrenamiento.

Por ejemplo, puede verse que su interés en emplear la defensa francesa alcanzó su punto máximo después de 2 horas, pero tras ese proceso de investigación inicial, su grado de interés cae abruptamente a cerca de 0, lo que indica que después de 2 horas + entrenamiento se dio cuenta de que las líneas emergentes de esa apertura no son óptimas en comparación con otras opciones, como la defensa Caro-Kann (que tuvo una meseta prometedora después de 2 horas, pero que finalmente también cayó).

En general, destaca la apertura inglesa y el gambito de dama: siguió empleando ambas de forma constante durante toda su formación. En última instancia, el patrón sugiere una tendencia hacia aperturas más versátiles.

¿Dónde está el secreto de su increíble fuerza?

El rendimiento relativo de la búsqueda MCTS (Montecarlo) de AlphaZero en comparación con motores de búsqueda alfa-beta de última generación utilizados por Stockfish es superior.

AlphaZero busca “solo” 80 mil posiciones por segundo en ajedrez (¡quién pudiera!) frente a 70 millones para Stockfish. Lo que sucede es que AlphaZero compensa el menor número de evaluaciones utilizando su red neuronal profunda para enfocarse mucho más selectivamente en las variantes más prometedoras – posiblemente un enfoque de búsqueda más “humano”.

¿Qué fue de su repertorio de aperturas después de las sesiones de entrenamiento?

He analizado una base de datos de 210 partidas de Alphazero para tratar de encontrar algún patrón a la hora de seleccionar las aperturas que utilizó después de sus sesiones de autoentrenamiento.

Aperturas con blancas de Alphazero

Alphazero elige con blancas la jugada d4 en más de un 60% de las ocasiones. El resto lo distribuye en porcentajes iguales entre e4 y Cf3, la apertura inglesa solo se plantea en 2 ocasiones.

Recomendación de curso: ¿Quieres empezar a jugar d4 y vienes de jugar e4? Tenemos un curso para ti en nuestra academia por el GM Herminio Herraiz.

Y a partir de aquí, tras la jugada Cf6 (que es la que utiliza Stockfish), plantea indistintamente las jugadas c4 o Cf3 (algo más flexible), como se puede ver en el gráfico inferior generado con Chessbase.

aperturas de alphazero, análisis con blancas — Imagen generada con Chessbase a partir de una base de datos de 210 partidas.

Prácticamente todas las partidas que empezaron así acabaron derivando hacia la apertura catalana, la que probablemente sea la mejor apertura para las blancas según el estudio que ya publiqué en el enlace anterior.

Aperturas de Alphazero con negras.

En nuestra base de datos partimos del sesgo de que Stockfish siente una predilección por las partidas que empiezan con e4, y que representan aproximadamente en 70% de las partidas jugadas entre las máquinas.

¿Cómo juega Alphazero contra e4?

Pues está claro que la mejor respuesta según la máquina es la clásica e5. Como ya viste en los estudios preliminares, Alphazero no valora igual la Defensa Siciliana que las derivaciones de e5 (apertura española o italiana). Por lo que la Defensa Siciliana es elegida solo en 7 ocasiones de las 50 posibles.

Mucho menos frecuente es la respuesta con e6 o con c6, que se utilizan un 50% que la Defensa Siciliana.

Y a partir de aquí, el negro tiene dos opciones: enfrentarse a la Apertura Española, o bien a la Apertura italiana y sus derivaciones. En el primer caso, Alphazero tiene claro que la mejor alternativa es la Variante Berlinesa. Y contra la Apertura Italiana utiliza una serie de herramientas heterogéneas que no nos permite llegar a ninguna conclusión debido a la poca representatividad de las partidas.

¿Cómo juega Alphazero contra d4?

No es fácil encontrar un patrón, ya que la máquina se decanta por distintas defensas indistintamente. Aunque parece que “siente” una cierta predilección por las líneas que empiezan por Cf6 (representan un 70% aproximadamente de sus elecciones).

Tras c4 de las blancas, Alphazero prefiere g6 (¡al contrario de Magnus Carlsen que fue dejando de lado la Defensa India de Rey), es la opción elegida en el 50% de las ocasiones. El otro 50% se divide por igual entre e6 (posible Defensa Nimzoindia) y c5.

Material suplementario y cursos

Estudio completo sobre Alphazero publicado en sciencemag (en inglés).
Informe sobre Alphazero por el GM Miguel Illescas. Incluye algunos análisis.

Programa de radio

Cursos

Alphazero: evolución, algoritmo… por el experto en Inteligencia Artificial Alexander Narvaez.
Stockfish: cómo sacarle el máximo partido. En nuestra Escuela de Ajedrez Online.

Libros recomendados

El mito del algoritmo.

Grandes personalidades, como Elon Musk o Stephen Hawking, han alertado sobre los peligros y graves riesgos de la IA, alimentando la visión apocalíptica de un mundo futuro dominado por las máquinas. ¿Cuánto hay de verdad en esto? ¿Llegarán las máquinas a acabar con la humanidad, tal y como la conocemos? ¿Es posible que tengan sentimientos? ¿Nos quitarán puestos de trabajo? ¿Pueden ayudarnos a combatir y predecir pandemias o desastres naturales? Estas son algunas de las preguntas que Richard Benjamins e Idoia Salazar abordan en esta obra. Usando un lenguaje sencillo y esclarecedor, exponen algunos de los principales cuentos, y los aclaran –cuentas– aportando, además, de primera mano, opiniones de algunos de los expertos más relevantes a nivel internacional.

NOTA: Las bases de datos utilizadas en este estudio están disponibles en nuestra academia de ajedrez www.thezugzwangmembers.com.

2 COMENTARIOS

AntonioMontero 01/10/2020 En 15:20

Estaba esperando un artículo como este; saber como se decanta Alphazero por una u otra alternativa… es como conocer su paladar!!! Gracias y felicitaciones

Iniciar sesión para dejar un comentario
- Daniel Muñoz 02/10/2020 En 8:53
  
  Muchas gracias Antonio!
  
  Iniciar sesión para dejar un comentario