La machine bat l’homme… Et tue le poker ?

La machine bat l’homme… Et tue le poker ?

On savait la victoire de l’intelligence artificielle inéluctable. Elle vient d’arriver, plus tôt que certains l’espéraient. La défaite de l’humanité annonce-t-elle la fin du poker ?

Une victoire sans appel

Après Deep Blue battant Kasparov aux échecs en 1997, après AlphaGo écrasant Lee Sedol au go en 2015, voici que Libratus ajoute son nom à la prestigieuse liste des programmes joueurs ayant détrôné les humains, après avoir humilié quatre des meilleurs joueurs HU de la planète.

WaitWaitW nous l’a contée dans son article Joueurs vs BOT : les humains au tapis ! : la victoire de l’Intelligence Artificielle a été totale.

Les humains ne peuvent même se réfugier dans l’excuse de la malchance car tout a été fait pour limiter la variance :
Un grand nombre de mains : 30 000 chacun et donc 120 000 au total
Des mains en miroir : si Libratus a AA vs 32 contre un joueur A, au même moment un joueur B a AA vs 32
Un fair split après un all-in avant la river : en cas de tapis, le pot est réparti selon l’équité de chaque joueur.

Dans ces conditions de low-variance, seul le niveau fait la différence est le résultat parle de lui même :

 

Joueur

Gains (enfin pertes)

/ main

Dong Kim

-$85,649

-$2.85

Jimmy Chou

-$522,857

-$17.43

Jason Les

-$880,087

-$29.34

Daniel McAuley

-$277,657

-$9.26

Total

-$1,766,250

-$14.72

 

Comme c’était du NL 50/100, la machine a performé à un incroyable +14.72bb/100 !

Certains avocats de l’humanité objecteront que si les joueurs étaient bons, ce n’était ni Luneau ni Cates, ou encore que les conditions étaient éprouvantes : 10h de jeu tous les jours pendant 15 jours. Mais au delà de cette mauvaise foi, on ne peut que reconnaître que désormais, la machine est plus forte que les meilleurs humains NL HU.

Comment fonctionne Libratus ?

Libratus est le mot latin pour équilibré, “balanced”. Son nom affiche donc fièrement son ambition : jouer GTO avec des ranges parfaitement équilibrés.
Pour construire ces ranges, Libratus n’a eu besoin que d’apprendre les règles du holdem. C’est tout.
Enfin ça, et jouer des milliers de milliards de mains contre lui même, en tournant h24 sur un super-ordinateur coûtant 10 millions de $ et disposant de quelque 275 000 giga de RAM.
Au début, il jouait de manière totalement aléatoire. Plus une stratégie offrait de réussite, plus la probabilité de choisir cette stratégie augmentait.

Cepheus, l’oncle de Libratus qu’on avait annoncé avoir résolu le Limit HU, ne joue en fait pas totalement GTO car il procède à quelques minimes approximations. Ses concepteurs ont calculé qu’un joueur GTO parfait pourrait espérer gagner maximum 0.05bb/100 contre Cepheus.
On a donc la certitude que Libratus non plus ne joue pas entièrement GTO, mais qu’il s’en rapproche plus que n’importe quel humain… et il s’améliore à chaque instant.

Pour l'instant il ne s'agit que de HU, mais la puissance des ordinateurs croissant de manière exponentielle, on ne devrait pas avoir à attendre trop longtemps avant qu'un programme crush les meilleurs humain en full ring, même s'il ne sera jamais parfaitement GTO.

 

Quel impact pour les joueurs de poker ?

La triche

Pour l’instant cette défaite des Hommes ne va rien changer pour les joueurs de poker que nous sommes. La triche avec des bots existait avant Libratus et on imagine mal des universitaires louer un ordi à 10 millions pour venir nous raser à nos modestes limites.
Mais d’ici quelques années au plus tard, tout le monde aura accès à un programme meilleur que n’importe quel humain. Il sera alors quasiment impossible de jouer online pour de l’argent. Les rooms auront beau inventer des nouveaux systèmes de protection anti triche, ils seront inévitablement faillibles surtout si un bon joueur utilise l’ordi que dans certains spots.
Le poker online de demain sera comme les échecs online d’aujourd’hui : pour le fun, en free money. Aucun grand maître d’échecs n’accepte aujourd’hui de jouer online pour de l’argent, demain il en sera de même pour le poker.

Oui, le poker online va mourir, tué par l’intelligence artificielle.

Il restera le live, mais là aussi des mesures devront être prises. On peut les imaginer similaires à celles qui existent déjà dans les tournois d’échecs, notamment l’interdiction de tout appareil électronique ! Adieu écouteurs et live tweet, je vous annonce dès à présent que les smartphones et autres montres connectées seront bientôt bannis des tournois.

L’augmentation du niveau

Sur le site de Cepheus on peut étudier ses ranges préflop, jouer contre lui et analyser des mains. Bon, comme c’est du Limit, on s’en fiche. Maintenant imaginez qu’un joueur puisse s’entraîner avec Libratus... Hop, des ranges parfaits de 3, 4 et 5-bet préflop. Une main le perturbe, Libratus lui donne tout son range et le play associé. Clairement un tel joueur pourrait progresser énormément et bien plus rapidement qu’avec nos moyens actuels. Et bien dans quelques années, ce joueur pourrait être n’importe qui, car tout le monde y aura accès.

En attendant, il est possible que plusieurs nosebleeds aient déjà envoyé quelques questions accompagnées de gros billets aux programmeurs de Libratus…

Libratus remporte aussi le side event humour...

Tout au long du match, Libratus tweetait, non sans humour. Voici un petit florilège :

 PA  0 8210   36 Commentaires