PublicitéQJ juin 2022
alphago intelligence artificielle
Article suivant »

AlphaGo Zero, le robot joueur de go « autodidacte »

facebooktwittergoogle_plusmail

AlphaGo, le super-ordinateur qui avait fait sensation l’an dernier en battant le champion du monde de go, un jeu hyper complexe, est tombé sur plus fort que lui. Il vient d’être écrasé par une nouvelle version de ce programme, capable d’apprendre par lui-même, sans intervention de l’homme.

AlphaGo Zero « est sans doute le plus fort joueur de go de l’histoire », estiment Demis Hassabis et David Silver, deux de ses concepteurs, selon une étude publiée mercredi dans la revue Nature.

Plus de combinaisons que d’atomes dans l’univers

Au jeu de go, le nombre de combinaisons possibles est astronomique, plus grand que le nombre d’atomes dans l’univers. Les programmes informatiques, bien que très forts en calcul, ne peuvent donc pas passer en revue toutes les possibilités pour choisir la bonne mais doivent imiter les concepts stratégiques de l’homme.

Pour battre en 2016 Lee Se-Dol, grand maître sud-coréen du jeu de go (par quatre parties à une), AlphaGo avait été nourri des milliers de parties jouées par des professionnels et des amateurs, lui permettant ainsi « d’apprendre », pendant plusieurs mois, à copier le raisonnement humain par l’apprentissage profond (« deep learning » en anglais).

3 jours d’entraînement

AlphaGo Zero est pour sa part capable « d’apprendre tout seul à jouer au go », précise l’étude.
Pour s’entraîner, AlphaGo Zero joue contre lui-même, « en partant de 0″ sans autre connaissance sur le go que les règles du jeu. Contrairement à AlphaGo, il n’a donc pas eu besoin de se confronter à des humains pour devenir imbattable.

« Après trois jours d’entraînement (presque 5 millions de parties) en autodidacte, il a battu la version de 2016 d’AlphaGo », expliquent Demis Hassabis et David Silver sur un blog. Le score est sans appel: 100 à 0.

Mais si elle peut se passer avec succès de l’expérience humaine pour se perfectionner, la machine dépend néanmoins toujours de l’intelligence des hommes: « Les brillantes idées qui ont permis d’améliorer le programme ont été générées par l’homme », précise Anders Sandberg. « AlphaGo ne se programme pas tout seul ! ».


PublicitéQJ juin 2022

x