La théorie des jeux appliquée au poker (initiation)

Alex_PA · Janvier 13, 2022, 3:24

Barth_Gury · Janvier 13, 2022, 4:08

Merci à @florian99p99 pour ce super article !

florian99p99 · Janvier 13, 2022, 4:20

Merci à toi pour la publication, j’espère que ça pourra aider certaines personnes qui débutent dans l’étude de la théorie.

cedar0000 · Janvier 15, 2022, 6:26

par contre il y a un truc que je comprend pas au tout début pour l’EVcall du joueur A, je comprend pas le x0 dans "- B y1 + (B + P) x0 "
moi j’ai -By1+(B+P)(1-y0) c’est pas ça ?

blagops · Janvier 16, 2022, 10:59

Je pense que c’est même carrément plus que pour ceux qui débutent (par rapport aux joueurs de poker), enfin c’est une façon + généralisée mais moins facile à appliquer de des paterns de solver
Dans la limite de la discrétion, n’hésite pas à nous en dire un peu + sur toi et ce qui t’a amené à travailler le sujet
Merci beaucoup pour ton article

Balla · Janvier 17, 2022, 7:08

Merci pour l’article

Pour ceux qui veulent compléter leurs connaissances sur le sujet :
TheoriedesJeux.pdf (1,2 Mo)

Ce PDF traite de la théorie des jeux en général.

florian99p99 · Janvier 17, 2022, 9:26

Oui, tu as raison, le domaine de bluff du joueur B est bien sûr (1 - y0). J’aurai du mieux me relire.

florian99p99 · Janvier 17, 2022, 9:41

Merci pour ta lecture.
Ce qui m’a amené à écrire cet article, c’est que je vois beaucoup de personne mal interprété les résultats du solver, j’espère que cet article pourra les aider pour débuter.
Si je devais en dire un peu plus sur moi, je dirais que mon objectif premier, c’est de vivre du poker, toute cette année sera 100 % réservé au poker pour ma part

florian99p99 · Janvier 17, 2022, 9:43

Merci à toi pour ta lecture.

yvan161 · Janvier 17, 2022, 6:25

Merci @floprian99p99 pour cet article très intéressant : je ne suis pas sûr qu’il s’adresse à des débutants

Je souhaiterais avoir quelques réponses avant de plus le décortiquer.

Remarque : les fautes d’orthographe et de grammaire nuisent un peu à la lecture.

Exemple :

Partie 1

Arbre du jeu : les feuilles de l’arbre ne devraient contenir ni IP ni OOP non ?

Dans le jeu, le bet sizing n’est pas très clair : il n’y a pas le choix et c’est toujours le même ?

x1* (pourquoi une étoile ?), y0 et y1 ne sont pas clairement définis : il s’agit de la valeur de la main ? Autrement dit des ranges correspondant à l’action ([0,x1*], ]x1*,1]) ?

Un peu compliqué à comprendre : un value bet avec des mains toujours battues ? C’est le contraire de la définition d’un value bet !

y1>y0 est évident mais la démonstration comme quoi x1* est entre les deux n’est pas claire.

Pas évident de démontrer l’indifférence (de l’EV) sans la réponse à la question du choix bet sizings.

Equations d’indifférence

Le x0 non introduit dans les équations du joueur A, rend difficile la lecture initiale.

x0 = (1 - y0) donc mais il faudrait corriger l’article sur ce point pour une bonne compréhension.

Je suppose P le montant initial du pot et B le montant du bet (donc le sizing).
Mais dans le toy game, il n’y a pas de pot initial.

Joueur B

Ev check bluff ? Je suppose que tu veux dire EV(check air)

EV bet value thin ? Je suppose que tu veux dire bet en value (tout court).

Je ne comprends pas pourquoi EV check strong = EV bet value thing (sic!) et EV bet bluff = EV check bluff.

OK on veut maximiser l’EV entre bet et check mais pourquoi deux à deux dans les sous-catégories ?

Connecter les équations

Comprendre joueur B va bet en bluff « alpha fois » sa range de bet en value ?

Exemple : si le Pot vaut 1€ alors si joueur B mise 1€, il doit bet la moitié de combos en bluff par rapport aux combos de value, autrement dit 1 combo de bluff pour 2 combos de value ?

« alpha » c’est le risk/reward, c’est ça ?

C’est un peu difficile à comprendre puisque le MDF est déjà le pourcentage minimum à défendre pour ne pas être exploitable aux bluffs.

[quote]
Minimum defense frequency (MDF) describes the portion of your range that you must continue with when facing a bet in order to remain unexploitable by bluffs.

In other words, MDF is the minimum percentage of time you must call (or raise) to prevent your opponent from profiting by always bluffing you. If you fold more often than the MDF indicates, your opponent can exploit you by over-bluffing when they bet.

[quote]

Je crois comprendre que tu parles du pourcentage (de call) par rapport à y0 et non 1 (où le MDF serait 50%) et donc effectivement dans ce cas, il est forcément inférieur au MDF mais c’est pas très clair.

Pourquoi ?

La notation est ambigüe notamment pour les divisions.

Les sizings GTO

J’ai pas compris : joueur B size différemment suivant la force de sa main ?

Ça ne serait pas plutôt : "plus joueur B décide de size fort (quelque soit sa main), plus y1 est petit et (y0 grandit proportionnellement) ?

le jeu exploitant

Si IP bluff trop, ça parait bizarre que OOP call tous ses bluff catchers avec x1 = y0 et ce quelque soit l’amplitude du ‹ trop ›.

Certes mais c’est vrai aussi si IP bluff trop non ?
Ça serait plus intéressant de voir comment se comporte x1* comme pour le cas de bluff heavy.

C’est pas plutôt sa range de check qui va augmenter ?

Plus globalement, on peut se demander pourquoi IP introduit les checks dans sa stratégie.
Equilibrer les bets en value et les bets en bluff ne serait pas suffisant pour être inexploitable ?

Désolé pour toutes ces questions mais je voudrais que les choses soient claires dans mon esprit avant d’attaquer les parties suivantes de l’article.

cedar0000 · Janvier 17, 2022, 7:14

ça dépend, débutant dans quoi ? un débutant au poker mais calé en mathematique va capter
par contre un mec calé en poker mais débutant en maths va rien piger j’pense

bon évidemment le best ça reste d’être calé dans les deux xD

yvan161 · Janvier 17, 2022, 8:06

Débutants dans l’étude de la théorie comme indiqué par l’auteur, que ça soit celle des jeux en général ou au poker en particulier.

En général, l’initiation commence par chifoumi comme game boy

florian99p99 · Janvier 17, 2022, 10:13

Merci à toi pour ta lecture
Désoler pour les fautes d’orthographe.

Il s’adresse à ce qu’il veule débuté l’étude du jeu GTO

Le joueur A est OOP et le joueur B est IP, le joueur IP peut miser n’importe quelle sizing. Je n’ai pas développé plus sujet des sizing, car je ne voulais pas compliquer les choses.
Pour x1* j’ai mis une étoile, car x1* c’est le seuil de call or fold de OOP et x1 est le seuil de bet or check. J’ai exprès exclu x1 de l’arbre du jeu pour simplifier la compréhension du jeu.

C’est pour ça que le paramétrage du jeu est : y1 > x1* > y0, cela veut dire que la main y1 est plus fortes que la main

x1*, qui est plus forte que y0 qui est plus fort que 1.

Y0 correspond à la main seuil de bluff de OOP et y1 correspond à la mains seuil de value bet.

y1 est forcément plus fort que x1* si non cela voudrait dire que IP value bet avec des mains qui sont toujours battu. En théorie des jeux c’est ce que l’on appelle une stratégie dominée, ce qui veut dire que on peut exclure cette stratégie du jeu, d’où y1 > x1*.

L’indifférence est démontrée par les équations, on n’a pas besoin de définir un bet size pour le démontrer. Par exemple pour un bet pot on aura :

x1* = 4/9

y1 = 2/9

y0 = 8/9

Quelle que soit la stratégie de OOP si IP joue sa stratégie optimale alors OOP ne pourra pas augmenter son EV, et inversement. Je t’invite à tester.

X0 est une erreur de ma part, x0 n’existe pas, c’est (1 – y0)

Comment fait-on pour modifier l’article ?

Oui P = le montant du pot au début du jeu. Il aurait été possible de mettre P = 1 est d’exprimé B en % du pot, cela revient au même résultat. Si on met P = 0 alors le jeu n’aurai plus de sens.

Oui effectivement maintenant que tu me le fais remarquer c’est assez bizarre de dire EV check bluff

Oui, je voulais surtout faire comprendre que y1 étais notre bottom value bet

Cela veut dire que y1 est la mains seuil entre notre bottom value bet, et notre plus forte main que l’on check. Y1 est indifférent entre check et bet. l’EV des deux actions est la meme.

Oui c’est ça

[quote=« yvan161, post:10, topic:107211 »]

Non tu confond la cote du pot avec alpha, le risk/ reward = risk / (risk + reward)
Exemple si P = B = 1 alors risk/ reward = 1 / (1 + 2) = 1 / 3 et alpha = 1 / (1 + 1) = 1 / 2

J’ai exprès utilisé le therme MDF car il n’y a beaucoup de personne qui ne comprenne pas pourquoi le jeu optimal ne défend pas P / (P + B)

Oui c’est ça

Si on remplit la matrice de gain pour l’indifférence en y1, alors on obtient :
x1* - 2y1 = 0
y1 = x1* / 2

Oui c’est ça, je ne l’ai pas prouvé mathématiquement pour pas compliquer les choses.

Non c’est bien ça, par exemple pour P = B, et que y0 = 7/9 alors x1* = 7/9

Cela dépend, à quelle fréquence il call trop.
Exemple pour P = 1 = B dans le jeu optimal IP à une fréquence de check 6/9
Si OOP call 4.1 / 9 on va avoir une fréquence de check de 6.95 / 9 soit 139 / 180. Notre fréquence de check à donc augmenté, mais s’il call 100 % alors notre fréquence de check sera de 4.5 / 9 soit ½. Elle a donc diminué.

Ce que l’on cherche à faire ce n’est pas de joué de façon inexploitable, mais de joué la stratégie qui augmente le plus notre EV.

yvan161 · Janvier 17, 2022, 11:42

Merci pour tes réponses.

Faut demander à ton contact PA, probablement @Alex_PA ou @Barth_Gury

Je ne pense pas confondre.

Cote de pot = Taille de mise en call / (Taille du pot + Taille de mise)
Risk/Reward = FE min. nécessaire (pour profit immédiat) = Taille de mise / (Taille du pot + Taille de mise)
MDF = Taille du pot / (Taille du pot + Taille de mise) = 1 – (Risk/Reward)

D’ailleurs après vérification, ça a bien l’air d’être la même chose.

Si joueur B mise pot, alpha vaut 50% et la cote de pot (pour call pour joueur A) est 33%, autrement dit l’équité pour call.

OK je crois comprendre et je reformule : « sinon cela voudrait dire que IP bet avec certaines mains dominées par la range de call OOP et dans ce cas, le bet n’est plus en value »

Là tu m’as perdu

Ce n’est pas d’optimiser notre EV tout en restant inexploitable ?

C’est surtout la grammaire qui a piqué mes yeux

Je vais laisser passer la nuit avant d’attaquer la suite de l’article

cedar0000 · Janvier 18, 2022, 12:00

@florian99p99
t’aurais des ouvrages à conseiller (à part mathematic of poker de bill chen que tu cite dans ton article d’ailleurs) pour approfondir le sujet de la theorie des jeux appliqué au poker ?

florian99p99 · Janvier 18, 2022, 12:05

Oui il y’a aussi les deux livres de will Tipton.

florian99p99 · Janvier 18, 2022, 12:18

Oui si tu parle du point de vue du joueur offensive alors le risk / (risk + reward) est bien = à alpha. Pour le joueur défensif le risk reward c’est B / (2 B + P)

Non ce n’est pas ça c’est plutôt « sinon cela voudrait dire que IP bet avec certaines mains dominées par la range de bottom call OOP et dans ce cas, notre bet n’est plus en value car il est call 100 % par mieux. »

par exemple dans la solution GTO pour P = 1 = B IP value bet 2/9, il bluff 1/9 il check donc 6/9

On ne peut pas exploiter, et en même temps être inexploitable.

Si tu veut approfondir tes connaissance sur le jeu (0.1) mono street statique, alors je te conseille de lire ce PDF pm0.dvi (tomsferguson.com)

cedar0000 · Janvier 18, 2022, 3:12

Le dilemme du prisonnier | Voyages au pays des maths | ARTE - YouTube

cedar0000 · Janvier 19, 2022, 3:28

j’ai pas compris comment tu trouves ça

X1* = 2 P / (B + P) / (((2 – B / (P + B)) ((B / (B + P) + 1))

yvan161 · Janvier 19, 2022, 3:31

Et il faudrait aussi lever l’ambiguïté de notation avec des parenthèses (même s’il y en a déjà beaucoup ) et l’opérateur de multiplication.