AlphaZero bat Stockfish

Une simple partie de pêche à la ligne du dimanche pour AlphaZero

Il y a un peu plus d’un an, AlphaGo créait la sensation en battant le numéro un mondial du jeu de Go. Cette fois, le programme d’intelligence artificielle AlphaZero qui réalise l’exploit de vaincre du premier coup mon pote Stockfish, le moteur d’échecs le mieux classé, récent vainqueur du TCEC Championship 2016. AlphaZero ne lui a laissé aucune chance, remportant 28 victoires, annulant 72 fois, et ne perdant aucune partie sur 100 ! Petite précision : il n’a fallu que quatre heures à AlphaZero pour « apprendre » les échecs.

Selon DeepMind, il a fallu 9 heures d’entraînement et 44 millions de parties pour maîtriser les échecs avec un algorithme d’apprentissage de renforcement général, avec à chaque fois un temps de réflexion très court : 40 millisecondes. Ensuite, il n’a fallu que 4 heures au système d’IA pour surclasser Stockfish. L’équipe précise qu’une minute de calculs par mouvement était accordée à chaque programme.

« AlphaZero recherche seulement 80 000 positions par seconde aux échecs contre 70 millions pour Stockfish. AlphaZero compense ce faible nombre en utilisant son réseau de neurones profonds pour se concentrer beaucoup plus sélectivement sur les variations les plus prometteuses – sans doute une approche de recherche plus humaine ».

Les développeurs d’AlphaZero, membres de DeepMind, racheté par Google en 2014, ont créé une procédure d’apprentissage automatique. Ils ne lui ont appris que les règles de bases, il ne possède ni répertoire d’ouverture, ni tableaux de finales. Le programme s’est donc contenté de jouer contre lui-même pendant quatre heures, devenant par conséquent son propre professeur. « Pour comparer, peut-on lire sur Chess.com, imaginez un robot auquel on fournirait des milliers de pièces en métal, sans lui donner aucune connaissance sur le moteur à explosion. Celui-ci, après avoir essayé toutes les combinaisons possibles, finirait par construire une Ferrari… » La machine se met à fonctionner comme un humain, et ne s’appuie plus seulement sur la force brute.

« Nous avions toujours considéré que les échecs réclamaient trop de connaissances empiriques pour qu’une machine les apprenne par elle-même, sans apport humain, a commenté Kasparov. Bien sûr, je suis impatient de savoir ce qu’AlphaZero peut nous apprendre sur le jeu d’échecs. C’est la grande promesse de l’ère des machines : elles parviennent à identifier des règles que les humains ne peuvent détecter. Mais évidemment, c’est au-delà des échecs et des jeux en général que les applications semblent les plus intéressantes. Une machine qui parvient à copier et à surpasser des siècles de connaissances humaines dans des systèmes fermés et complexes, c’est un outil qui pourrait changer le monde. »

Dix parties du match disputé le lundi 4 décembre à  Londres :

« Il s’agit d’une véritable intelligence artificielle, affirme le GMI Peter Heine Nielsen. Pour l’instant, elle gagne aux échecs, mais demain, elle pourrait gagner des prix Nobel, ou bien plus encore… En fait, on ne peut que leur être reconnaissant d’avoir bien voulu la faire jouer quatre heures aux échecs, car cela va nous permettre d’en apprendre beaucoup. Pour nous autres joueurs d’échecs, c’est un grand jour, mais pour le reste du monde, cette avancée va bien plus loin. »

6 réflexions sur « AlphaZero bat Stockfish »

  1. J’en ai rêvé il y a quelques temps (sur le forum), ils ont fini par le faire, c’est super ! Pourvu que ce programme soit disponible plus tard pour tous les joueurs d’échecs.
    Il faut noter qu’AlphaZero analysait 1000 fois moins de positions / seconde que Stockfish ! On pourrait dire qu’il a acquis une meilleure « compréhension » du jeu que les programmes actuels. Ce sera une grande avancée pour la compréhension du jeu. Je rêve qu’un jour, un programme d’échecs nous donne un plan global à partir d’une position, comme un vrai GM qui nous explique les échecs.

    jb

    Je suis beaucoup moins enthousiaste :
    si une base de données (Google ou autre…) atteint de tels résultats, nos conceptions de la créativité et du raisonnement en prennent un sacré coup ;
    quelques expérimentations sur les grands primates montreraient notre supériorité évolutive grâce à une meilleure discipline dans l’apprentissage au détriment du raisonnement ;
    vivent les singes, ils sont l’avenir de l’homme !
    En attendant Matrix…
    jb

    bernard courtot

    Je ne vois vraiment pas l’intérêt de l’intelligence artificielle pour le jeux d’échecs, qui est l’ affrontement de deux intelligences humaines, avec tout ce que celà comporte d’émotivité.
    Les ordinateurs ne ressentent RIEN, et puisqu’ils sont capables de battre les meilleurs Homo sapiens, laissons les jouer ensemble.
    Bernard C.

    Vernier Gilles

    1984 Big Brother
    Formé à l’Ecole Anormale en saignant, je préférerai toujours voir mes pièces sacrifiées au bord de l’Echiquier. A l’image de Max Coulon qui m’a donné « l’envie d’avoir envie » de jouer le Gambit du Roi.
    Bienvenue chez les Machins et les Machines.
    Amicalement (Humain)

    Tran Tuan Anh

    Quoi qu’on dise, tout le monde utilise des programmes d’ordinateur pour analyser ses parties d’échecs, pour apprendre et progresser. C’est un professeur / super GM disponible 24h/24, aux tarifs modestes voire gratuits, donc à la portée de monsieur tout-le-monde. Et cela n’enlève en rien à notre créativité sur l’échiquier, comme en témoignaient les parties récentes entre super GMI.
    Carlsen a dit un jour que les programmes d’échecs actuels sont stupides et c’est rageant de perdre contre quelque chose de stupide. Alors, pourquoi serait-on contre un professeur plus intelligent, qui comprendrait parfaitement les échecs, pour nous l’enseigner ?
    Concernant nos peurs des ordinateurs, le Pr Stephen Hawkins disait très justement : « Ne programmez pas une machine de manière à ce qu’elle puisse nous détruire. C’est aussi simple que cela ! ». En effet, la machine ne peut, de par elle-même, faire des choses dont elle n’a pas été programmée pour. Si un jour, la machine détruit l’homme, ce sera bien de notre faute.

    bernard courtot

    Cher confrère,
    Je te conseille de lire  « Homo Deus » de Harari, où tu verras (pas moi!), que le temps n’est pas très lointain pour les ordinateurs de se programmer eux-même et tu n’auras plus de soucis à te faire à ce sujet. Bien amicalement.
    Bernard.

    Jean Marie

    Un article sur ChessBase assez critique sur la rencontre.