Les maths au poker : La GTO à la river (Partie mathématique)

yvan161 · Septembre 6, 2022, 11:04

Oui faut s’accrocher.

J’ai aussi noté qu’il y a avait pas mal d’erreurs malgré tout et parfois on doute de notre bonne compréhension quand il y a des erreurs sur un ouvrage très matheux.

Mais le principal obstacle est effectivement qu’on décroche parfois d’une ligne à l’autre parce que l’on ne comprends pas une notion implicite et évidente pour les auteurs.

Tu as essayé de simuler leur toy games avec un solver ?

Ça aide pas mal à comprendre, je trouve.

Même si là je suis bloqué sur les lock nodes, au moins ça m’a permis de matérialiser le contenu du chapitre de façon plus concrète.

Pour les seuils et groupes de mains, j’ai un peu de mal à passer des valeurs [0,1] aux mains de poker

Mais sinon pour celui qui étudie sérieusement la théorie et les solvers, le livre est une mine d’or … qui prend du temps à être miner pour moi.

En fait j’en suis au chapitre 13 P138 ) et j’ai passé énormément de temps sur le game#10 dont on parle ici (et j’ai pas encore tout compris !).

florian99p99 · Septembre 7, 2022, 7:38

J’ai choisi des combos spécifique pour supprimer tout effet des blocker

La stratégie Y-B va bluff des mains plus forte et check back avec des mains plus faible, c’est une stratégie dominé.

Donc ce n’est pas la stratégie Y-B, car quand OOP check, IP va bluff 55 en priorité.

C’est donc la stratégie B dans la branche ou OOP bet, mais pas dans celle où il check.

Sinn pour la simulation, j’ai nood lock tout l’arbre, de IP, donc le check aussi, et l’EV reste bien la même.

Oui mois aussi c’est la simulation A qui ressort, mais quand je force IP à jouer la strat C, alors le solver ne trouve pas d’exploit.

Pour nood lock les bonne fréquence compte le nombre de combo bluff, ensuite merge les en fold, et tu les transmets à 55, tu auras la bonne fréquence au dixième près.

Sinn tu peut node lock en copie colle le petit carrer en bas dans Excel, ou un autre logiciel, pour le modifier, et tu peux le coller à nouveau dans le petit carrer.

cedar0000 · Septembre 7, 2022, 10:04

et du coup (dans la même logique que pour IP ou c’est optimal de prendre n’importe quel main en raise bluff dans son segment de fold tant qu’il a la bonne frequence) OOP ira prendre n’importe quel main en check/raise bluff dans son segment de check/fold nan ? (si oui du coup on peut noter la symétrie )

cedar0000 · Septembre 7, 2022, 10:05

pour les toy game AKQ ouai

florian99p99 · Septembre 7, 2022, 11:11

C’est pas vraiment transposable pour oop car quand il part pour un xr il a des chance d’aller au showdown alors que ip non

C’est transposable une fois que l’on a x les bonne mains et que ip bet.

yvan161 · Septembre 7, 2022, 11:24

Oui je vois mais mon problème est le suivant.

Donc c’est pas évident de savoir comment « transférer » des combos / actions d’un groupe de mains à l’autre pour simuler la stratégie B puis la stratégie C.

Pour chaque main, tu gardes les checks tels quels ?

Par exemple, pour 99, tu met le raise à 0, augmente le fold de 0,003 combo et transfère 0,003 combos en raise pour 55 ?

Si tu transfères les raise-bluff/check vers les fold/bluff (donc 55 qui est la pire main) et inversement, c’est bien la stratégie B non ?

La stratégie C serait de transférer les raise-bluff/check vers fold/check et inversement.
Par exemple mettre 0 raise-bluff pour JJ-99 et transférer ces raises vers 88-66 ?

Pas sûr de comprendre le raisonnement. Des blockers ? Tu veux dire pour les flushs par exemple ?

Sur le board, il y a 2 carreaux et 2 piques pour 1 trèfle, ce qui pourrait même favoriser IP sur certaines ranges construites ainsi, mais il n’y a pas de couleur possible ici et il n’y a pas de 3x ou 2x dans les ranges donc je ne comprends pas.

Simplement

OOP : AA-55
IP : AA-55

F 2s2d2c
T 3s
R 3d

Il n’y a aucun effet blocker non ?

cedar0000 · Septembre 8, 2022, 3:23

du coup moi aussi j’ai run la sim avec les mêmes input que vous mais j’y reviendrai plus tard, j’vais retourner sur le AKQ
en tout cas on s’amuse bien (ou pas ça dépend), l’impression d’être un développeur python qui découvre l’assembleur xD

yvan161 · Septembre 8, 2022, 10:58

Bien j’ai procédé comme indiqué (et je maintiens que la manip que tu indiques est pour la stratégie B)

Y-A > Y-B

Y-A >= Y-C

Un peu fastidieux pour les nodes locks mais ça marche et le résultat correspond à ce que nous indiquions : Y-A >= Y-C > Y-B

Maintenant que nous sommes au clair, j’aimerais revenir sur cette affirmation

La stratégie Y-B est bien une stratégie où l’on raise un groupe de main pire que y1* et pourtant elle n’est pas co-optimal.

OK on peut probablement raise-bluff/check n’importe quel groupe de mains entre y1* et y0 (stratégie Y-C) en étant co-optimal mais pas n’importe quel groupe de mains entre y1* et 1, c’est à dire les mains entre y0 et 1 (stratégie B) car ça rend la stratégie sous-optimale.

Est-tu d’accord ?

yvan161 · Septembre 8, 2022, 11:02

Ça m’intéresse pour voir si nous arrivons au même résultat.

Oui c’est amusant ou disons instructif. Il faut être rigoureux dans la manipulation du solver mais avec GTO+ pour implémenter les toy games du livre, c’est quand même plus digeste.

Et ça m’a permis aussi de progresser dans l’utilisation du solver notamment pour les node locks.

Par contre effectivement au total, ça fait beaucoup de temps passé sur un seul game du livre mais disons que c’est un investissement pour le reste de la lecture.

florian99p99 · Mars 5, 2023, 7:46

Non, tu te trompes les stratégies sont égaux, je t’ai fait un exemple sur solver, et si tu veux, tu peux aussi calculer les EV du jeux avec des équations, mais l’exemple avec solver et plus rapide à faire.

Stratégie de OOP dans la simulation ou IP est nood lock

Stratégie de IP node lock vs bet

(On voit bien que j’ai fait fold des main meilleur que les combo de raise pourtant cela n’aura aucune incidence sur l’EV comme l’a dit @WaitWaitW tu ne peut pas exploiter cela)

EV GTO OOP

On peut voir que l’EV des deux stratégies et la même.

Tu as peut-être oublié de prendre en compte les blockers dans ta simulation.

yvan161 · Mars 5, 2023, 10:20

Salut,

je ne sais pas si je me suis trompé mais c’est toujours aussi dur de suivre ton schéma de pensée car tu ne précise pas de quoi tu parles et le débat date d’il y a 6 mois : dur de s’y replonger.

Est-ce que tu dis que …

… est faux ?

Il faudrait que l’on utilise le même paramétrage sinon on va jamais se comprendre

J’ai pas mis 44 dans les ranges : je pense que ça ne change rien mais fait la simulation avec les mêmes ranges stp.

Tu as un raise 24 donc ce n’est pas exactement le toy game et du coup, on a pas les mêmes EVs.

Voici mon paramétrage :

On a pas non plus le même flop : ça ne devrait rien changer non plus mais évitons tout écart de configuration pour comprendre pourquoi on arrive pas au même résultats et conclusions.

Voici l’arbre pour Y-A

Voici l’arbre pour Y-B (avec lock node)

On devrait avoir les mêmes fréquences (avec les mêmes ranges et le même paramétrage).

Indique bien explicitement de quelle stratégie il s’agit pour tes captures d’écran.

Pas compris puisque c’est GTO+ qui fait la simulation !

Pour l’instant, la différence que je vois entre nos deux simulations est sur le bas de range.

Quand OOP a la stratégie Y-B alors IP ne raise pas 55 …

… et OOP non plus

florian99p99 · Mars 5, 2023, 10:41

Dans le jeux 0,1 les blocker sont inexistant, ce qui n’est pas le cas dans ton jeu, il faut que tu mette des suite différents au 2 range comme je l’ai fait, sinn je peut refaire la sim avec le meme arbre que toi mais le resultat sera le meme c est juste les fréquences qui vont changer

yvan161 · Mars 5, 2023, 11:00

Ok je vois, tu veux dire de mettre des cartes assorties différentes dans les ranges IP et OOP pour éviter les effets des blockers.

Parfois je dépense plus d’énergie intellectuelle à décrypter ta prose que sur le concept mathématique lui-même

Donc la différence de nos simulations / conclusions vient de là.

Je n’ai pas lu entièrement « Mathematic of poker » et notamment les chapitres précédents du toy game #10 mais une recherche sur « blocker » ne donne qu’un unique résultat à la toute fin du livre et qui n’indique pas ce point.

C’est quelque part dans l’ouvrage ou tu le sais par ailleurs ?

florian99p99 · Mars 5, 2023, 11:53

Non, le jeu n’a pas de toys games sur les blocker, du moins pas dans mes souvenirs.

Je donne la définition du jeu 0.1 dans le 1 er article.

Les maths au poker : initiation à la théorie des jeux appliqués au poker (poker-academie.com)

yvan161 · Mars 5, 2023, 12:26

ok je vais refaire mes simulations avec des ranges « symétriques » pour éviter la question des blockers (vis à vis du board si j’ai bien compris).

Quelle doit être la conclusion ?

Y-A >= Y-C et Y-A>= Y-B et Y-C = Y-B ? Signifiant que les 3 stratégies sont co-optimales.

Parce que tu m’as répondu oui à

Ce qui signifie que Y-B n’est pas co-optimale non ?

florian99p99 · Mars 5, 2023, 12:58

oui Y-B ne va pas dans la line check, mais ici ce qui nous intéresse c’est la line raise, notamment les bluffs, et comme tu peut le voire dans la simulation c’est co-optimal de fold des mains meilleurs pour raise des mains moins bonne.

yvan161 · Mars 5, 2023, 3:37

Désolé, je ne comprends pas ta réponse.

Est-ce que le résultat de ma nouvelle simulation sans phénomène de bloqueurs doit arriver au résultat :

ou au résultat :

?

Lesquelles ? Y-A et Y-B ?

florian99p99 · Mars 5, 2023, 3:55

Ce que je veut te dire c’est que l’on peut raise en bluff des mains moins bonne que ce que l’on fold sans que vilain ne puisse nous exploiter, cela veut donc dire que la solution du solveur n’est pas la seul solution GTO, et qu’il existe de multitude équilibre GTO, j’arrive a donner des solutions node lock au solver sans qu’il ne puisse m’exploiter, car la solution que je lui ai donné est juste un autre équilibre.

Et tu d’accord avec ce que je viens de dire ?

sinon pour YB comme je te l’ai dit la stratégie n’est pas bonne car quand OOP check tu a fait bluff IP avec des mains qui on de la showdown value, sinon pour la line ou OOP bet oui c’est co-optimal car sa rejoint se que je viens de dire si dessus.

le fait qu’avec ce toys game on constate qu’il existe plusieurs équilibre et plutôt intéressant car dans le vrais jeu cela est aussi vrais.

yvan161 · Mars 5, 2023, 5:11

Oui bien sûr je suis d’accord, c’est l’exemple avec la stratégie X-C par exemple

Oui je suis d’accord Y-A et Y-C sont co-optimales et le solver restitue Y-A car elle domine Y-C.

Oui puisque c’est ce qu’il faut faire avec le seuil [y1*;y2*] et on doit arriver à un résultat sous-optimal pour montrer que Y-A >= Y-C > Y-B

Je veux bien refaire la simulation avec des ranges symétriques mais j’ai l’impression qu’on dit la même chose en fait.

Pour les ranges symétriques est-ce que l’on peut simplement prendre que exactement les mêmes combos pour les deux joueurs ?

Ceci dit, je ne vois toujours pas l’effet bloqueur qu’il pourrait y avoir.

florian99p99 · Mars 5, 2023, 5:31

si il y’a des blocker, quand tu va prendre le bas de range pour raise en bluff OOP va plus bet sont bas de range aussi car il va bloquer des bluffs qui lui aurai fait fold, ducoup sa augmente sa FE