Analyse du jeu de Pluribus, l'IA "invincible" de Facebook

yvan161 · Août 14, 2019, 10:31

Voici les liens issus des échanges précédents sur le sujet

L’article initial des auteurs n’est plus accessible publiquement

https://science.sciencemag.org/content/early/2019/07/10/science.aay2400

La communication FB si

https://ai.facebook.com/blog/pluribus-first-ai-to-beat-pros-in-6-player-poker/

Pas du tout : au contraire Pluribus ne s’adapte pas aux humains.

Ni avant le match ni pendant.

Il a ‹ juste › joué contre lui de très nombreuses fois pour trouver les lignes les plus rentables qui peuvent battre les meilleurs joueurs d’après eux (en moins de vingt heures de calcul et en moins de 7 heures pour le commun des joueurs de poker).

A noter qu’il pourrait même les battre en limpant apparemment d’après le graphe et qu’il ne peut quasiment plus progresser.

A noter aussi qu’il n’implémente pas la recherche d’un équilibre de Nash (impossible à plus de deux) et donc il est abusif de parler de GTO et ça ne sert à rien de comparer ses résultats à des solvers à mon avis.

Il est même peut-être abusif de parler d’IA puisque la machine n’apprend pas en jouant contre les humains et donc ne s’adaptera pas contre différents profils pour optimiser ses gains par exemple (ce qu’n reg de micro sait faire au passage).

Peut-être que la force brute de jouer contre lui-même est suffisante pour surclasser les humains (mais ça ne nous apprend pas grand-chose pour progresser si on ne comprend pas le pourquoi des lignes).

En tout cas comme tu l’as dit, la bataille de la communication est gagnée (par FB) au vu de tous les articles que l’on trouve désormais même s’ils utilisent quelques raccourcis

Je n’ai pas l’information sur la taille des participants

Y’a qu’à mettre des degen un peu plus bluffeurs ou des CS pour voir

Ah ben non, pas de code source, pas de possibilité de jouer contre Pluribus, … fermer le ban.