
- Une simple partie de pêche à la ligne du dimanche pour AlphaZero
Il y a un peu plus d’un an, AlphaGo créait la sensation en battant le numéro un mondial du jeu de Go. Cette fois, le programme d’intelligence artificielle AlphaZero qui réalise l’exploit de vaincre du premier coup mon pote Stockfish, le moteur d’échecs le mieux classé, récent vainqueur du TCEC Championship 2016. AlphaZero ne lui a laissé aucune chance, remportant 28 victoires, annulant 72 fois, et ne perdant aucune partie sur 100 ! Petite précision : il n’a fallu que quatre heures à AlphaZero pour « apprendre » les échecs.
Selon DeepMind, il a fallu 9 heures d’entraînement et 44 millions de parties pour maîtriser les échecs avec un algorithme d’apprentissage de renforcement général, avec à chaque fois un temps de réflexion très court : 40 millisecondes. Ensuite, il n’a fallu que 4 heures au système d’IA pour surclasser Stockfish. L’équipe précise qu’une minute de calculs par mouvement était accordée à chaque programme.
« AlphaZero recherche seulement 80 000 positions par seconde aux échecs contre 70 millions pour Stockfish. AlphaZero compense ce faible nombre en utilisant son réseau de neurones profonds pour se concentrer beaucoup plus sélectivement sur les variations les plus prometteuses – sans doute une approche de recherche plus humaine ».
Les développeurs d’AlphaZero, membres de DeepMind, racheté par Google en 2014, ont créé une procédure d’apprentissage automatique. Ils ne lui ont appris que les règles de bases, il ne possède ni répertoire d’ouverture, ni tableaux de finales. Le programme s’est donc contenté de jouer contre lui-même pendant quatre heures, devenant par conséquent son propre professeur. « Pour comparer, peut-on lire sur Chess.com, imaginez un robot auquel on fournirait des milliers de pièces en métal, sans lui donner aucune connaissance sur le moteur à explosion. Celui-ci, après avoir essayé toutes les combinaisons possibles, finirait par construire une Ferrari… » La machine se met à fonctionner comme un humain, et ne s’appuie plus seulement sur la force brute.
« Nous avions toujours considéré que les échecs réclamaient trop de connaissances empiriques pour qu’une machine les apprenne par elle-même, sans apport humain, a commenté Kasparov. Bien sûr, je suis impatient de savoir ce qu’AlphaZero peut nous apprendre sur le jeu d’échecs. C’est la grande promesse de l’ère des machines : elles parviennent à identifier des règles que les humains ne peuvent détecter. Mais évidemment, c’est au-delà des échecs et des jeux en général que les applications semblent les plus intéressantes. Une machine qui parvient à copier et à surpasser des siècles de connaissances humaines dans des systèmes fermés et complexes, c’est un outil qui pourrait changer le monde. »
Dix parties du match disputé le lundi 4 décembre à Londres :
« Il s’agit d’une véritable intelligence artificielle, affirme le GMI Peter Heine Nielsen. Pour l’instant, elle gagne aux échecs, mais demain, elle pourrait gagner des prix Nobel, ou bien plus encore… En fait, on ne peut que leur être reconnaissant d’avoir bien voulu la faire jouer quatre heures aux échecs, car cela va nous permettre d’en apprendre beaucoup. Pour nous autres joueurs d’échecs, c’est un grand jour, mais pour le reste du monde, cette avancée va bien plus loin. »
Bravo pour cette superbe manifestation. Anna et Rémi étaient ravis. Un grand merci à Nino Maisuradze et à Christine Frédéric, ainsi qu’à tous ceux qui ont rendu possible cette simultanée.