AKQ toy game

slt
j’suis tilté, j’arrive pas à démo que joueur X perd une moyenne de 2/3 d’unité à chaque fois qu’il a un king

(pot de 4 unité, mise de 1 ou 2 unités, X = oop Y= IP)

" Currently, X loses 2/3 of a unit each time he has a king. Half the time, his opponent has a queen and bluffs 1/3 of the time. X calls 1/3 of the time, so 1/3 of the time he gains two units. The other 2/3 of the time, he loses the entire pot of four units, for a total loss when the opponent has a queen of 2/3 of a unit "

dans la branche ou Y à un ACE ok X perd -2/3 d’unité (-2 multiplié par 1/3)
par contre dans la branche ou Y a une QUEEN je trouve pas -2/3 (2 multiplié par 1/3 - 4 multiplié par 2/3 ça fait pas -2/3 ça)

le K perd 1/3 en moyenne s’il à déposé 1 ante

tu peut essayer de regarder le thread que j’ai fait sur le solver et jeu (0.1) on en avais discuté avec @Xenoeus

Jeu (0.1) Solveur? - Logiciel de Poker - Forum Poker Académie (poker-academie.com)

en fait j’ai trouvé
2(1/3)(1/3)-4(2/3)(1/3) = -2/3
j’avais oublié de multiplié par 1/3

du coup ça fait bien une perte moyenne de 2/3 d’unité avec les rois comme indiqué dans le livre

moi j’ai ca

– 2 + [2/3 * 4 + 1/3 * 2/3 * 6] / 2 - [2/3 * 2] / 2 = - 0.67

ouai c’est -2/3 du coup, on a le même résultat

et l’EV de bet 1/4 pot c’est -1/2 du coup la strat est pas optimal, l’autre doit raise bluff pour égaliser les EV entre check et lead les roi

le lead avec roi c’est vraiment incompréhensible mais c’est optimal, l’auteur parle de mise préventive et ça doit expliquer pleins de bet bizarre du solver qui accomplissent ni value ni bluff mais qui sont pourtant bet

c’est assez contre intuitif, c’est vrai.
je présente l’équilibre de ce jeu à la toute fin de l’article ici
Les maths au poker : La GTO à la river (Partie mathématique) (poker-academie.com)

1 « J'aime »

je me disais un truc, est-ce que c’est faisable de faire un toy game AKQ pour du multistreet ? les seuls toy multistreet c’est du jeu [0,1] en plus il y aurait l’effet bloqueur à prendre en compte la ou dans le [0,1] c’est impossible vu que chaque joueur a une infinité de mains :frowning:

Oui @Xenoeus la résolut sur deux street

Ce toy game est basé sur le Kuhn poker ( GTORangeBuilder Blog: GTO Brainteaser #3 -- Blind Man's Bluff Solution) avec AKQ au lieu de KQJ.

C’est ce qui est décrit dans « The Mathematic of poker ».

Le Kuhn poker est une bonne introduction pour comprendre la GTO et travailler sur l’implémentation informatique de la chose :

Mais le Kuhn poker est mono-street.

Pour le multistreet, il faut passer à Leduc poker : Building a Poker AI Part 8: Leduc Hold’em and a more generic CFR algorithm in Python | by Thomas Trenner | Artificial Intelligence in Plain English

La série « Make your own poker AI » est très intéressante pour vous deux, je pense et présente ce point sur le dernier épisode :

1 « J'aime »

il y a beaucoup d’informatique et de lignes de code
pas moyen d’avoir un truc sur leduc poker avec juste les maths mais sans le coté informatique ? :confused:

en tapant leduc poker sur google j’trouve vraiment pas grand chose voir quasi rien en fait (à part des scriptes informatique…)

il y’a trop de point de décision à calculer (288 de mémoire) c’est pour ca qu’il est résolut informatiquement

1 « J'aime »

Dans l’article sur Leduc Hold’em, il y a un lien vers « Bayes’ Bluff: Opponent Modelling in Poker » avec de jolies formules pour faire kiffer les mathématiciens.

Après effectivement, l’intérêt de ces pokers fictifs est de pouvoir transformer tout ça en algorithmes qui font kiffer les informaticiens et implémenter des logiciels pour trouver la stratégie à l’équilibre (voire les stratégies si plusieurs joueurs).

Les toys games sont une introduction parce que attaquer directement la théorie en multistreets à plusieurs joueurs est trop compliquer et arrivé à ce type de résolution demande probablement un très bon niveau à la fois en mathématique et en informatique, du temps et des moyens :slight_smile:

Pour moi c’est juste de la curiosité intellectuelle pour comprendre comment marche un solver ou une IA qui joue contre elle-même.

3 « J'aime »

Essaye plutôt « Leduc Hold’em ».

https://www.researchgate.net/publication/322017017_Neural_network_optimtzation_of_algorithm_DeepStack_for_playing_in_Leduc_Hold’em

Il y a de la littérature mais à mon avis tu vas vite retomber sur des approches informatiques pour implémenter les alogrithmes.

1 « J'aime »

ok si c’est obligatoire de passer par de la programmation alors je give up tant pis :confused:

ou alors faudrait que je trouve un scripte codé en python vu qu’il est facile à comprendre pour un débutant

Yep, toutes les sources référencent uniquement « Bayes’ Bluff: Opponent Modelling in Poker » pour l’aspect théorique après c’est de la programmation

Tu peux essayer de te rabattre sur le UNO … ah ben non en fait :wink:

J’ai devancé ton edit :slight_smile:

Il y a tout ce qu’il te faut dans le Github de ce projet open-source

1 « J'aime »

Ces sources et cette discussion peuvent aussi intéresser notre ami @Xenoeus

… puisqu’il code les équilibres de Nash en JAVA les doigts dans le nez :wink:

1 « J'aime »

Intéressant , en relisant le thread il avait trouvé les fréquences proches de celles du solver si j’ai bien lu

dans play optimal poker 2 d’andrew brokos il y a un exo sur un toy game AKQ en deux streets avec des équity statiques (nuts reste nuts , bluff reste bluff, et bluffcatcher reste bluffcatcher)

présentation de l’exo :

Crafting exploitative strategies is a great way to test your
understanding of the equilibrium. If you understand why
the equilibrium strategies look the way they do, then you
are equipped to think about how to exploit various
deviations from the equilibrium. If you find yourself
struggling to get started on any of these questions, you
may benefit from reviewing the explanation of the
equilibrium strategies for the Two-Street Clairvoyance
Game.
Each player antes $1 and has $3 remaining in his or
her stack. Opal is always dealt a K, while Ivan is
randomly dealt either an A or a Q. Each knows the other’s
range.
There are two betting streets, but hands never change
value. Opal always checks. Ivan may check or bet any
amount between $1 to $3.

questions :

  1. Suppose Ivan bets $2 on the turn, which he would
    never do at equilibrium. How often should Opal call?

She should call 1/2 the time. Even in a multi-street game,
the player with the condensed range treats each decision
independently and finds a calling frequency that makes
her opponent indifferent to bluffing at that point. That
calling frequency is 1-alpha

  1. Suppose Ivan bets $1 on the turn, and Opal knows his
    range consists of all his As and 1/3 of his Qs. How often
    should she call?

Opal should fold 100% on the turn!

  1. Suppose Opal will always fold to a river bet of $2 or
    more, but we have no insight into her turn calling
    strategy. What will Ivan’s maximally exploitative
    strategy look like?

Ivan should bet $1 on the turn with his full range and
shove the river if called.

  1. Suppose Opal will always call the river if she calls the
    turn, but Ivan has no insight into her turn calling
    strategy. What will his maximally exploitative strategy
    look like?

Ivan should bet $1 with his full range on the turn, then
shove the river with his As and give up with his Qs

  1. Suppose after betting $1 on the turn, Ivan always bets
    $1 on the river with his As and $2 with his Qs. What is
    Opal’s maximally exploitative strategy?

Opal should always call the turn, then fold to $1 river
bets and call $2 river bets

1 « J'aime »