Il y a-t-il un ou plusieurs équilibres de Nash pour un 'jeu' de poker (tel que paramétré dans un solver)

Salut @florian99p99 (et les experts en GTO),

suite à notre long échange sur un chapitre de « The Mathematique of Poker », ma conclusion était :

Et pour être plus précis : « le solver propose comme solution un profil de stratégies dominantes. »
Ce profil de stratégies ne contient pas de stratégies faiblement dominées même si elles sont co-optimales.

Je pense avoir bien compris les stratégies dominantes / dominées et la faible / stricte domination, néanmoins j’ai un doute sur les liens entre équilibre de Nash et stratégies optimales.

Questions (pour une résolution NLHE HU avec OOP et IP) :

  1. est-ce que l’utilité de l’équilibre est bien la paire d’EV (qui seront optimales) pour les deux joueurs ?

  2. est-ce que chaque paire possible de stratégie co-optimales correspond à un équilibre de Nash ?

  1. comprendre que n’importe quelle paire de stratégies co-optimales donnera les mêmes EV pour les deux joueurs ?

  2. du coup, est-ce qu’il existe plusieurs équilibres de Nash pour un jeu donné (= paramètres saisis dans le solver) mais que le solver ne restitue que le profil de stratégies dominantes non faiblement dominées (pour les deux joueurs) ?

  3. Autrement dit dans le cas du NLHE HU (sans rake), qu’est-ce qui est unique ? L’unicité du résultat (les EVs) ou le fait qu’il n’y a qu’un équilibre de Nash (comme semble l’indique l’article de Wikipédia en précisant que c’est la rencontre des deux stratégies dominantes) ?

oui

c’est pas vraiment des paires. une strat est optimale contre n’importe quelle autre strat. Dans l’exemple qu’il y avait, changer ses bluffs ne changeait rien de la strat adverse.

n’importe quelle stratégie du coup, quelle que soit la strat en face

le solveur donne une strat. Laquelle dépendra de la manière dont il a été codé, et laquelle il trouve en premier du coup

euh, parfois il y a des trucs uniques, parfois non.

OK peut-être que je m’embrouille avec la définition de stratégie et profil de stratégie alors.

Est-ce que la réponse du solver pour OOP et IP est une seule stratégie ou bien une paire de stratégies (la stratégie de OOP et la stratégie de IP) ?

La réponse de IP à OOP peut être une ou plusieurs stratégies qui auront la même EV. Si OOP peut avoir plusieurs stratégies, IP aura une ou plusieurs stratégies qui auront la même EV face à chacune. Tu peux intervertir les termes OOP et IP.

Ok donc supposons pour simplifier que OOP a une seule stratégie notée OOP_A et IP plusieurs stratégies notées IP_A, IP_B et IP_C, un peu comme dans le toy game étudié ensemble.

Et disons que IP_A >= IP_B > IP_C.

IP_C est strictement dominée et donc ne peut pas faire partie d’un équilibre de Nash.

IP_B est co-optimal mais faiblement dominée par IP_A.

Le solver va donner comme solution (OOP_A ; IP_A).

Est-ce que (OOP_A ; IP_B), ayant la même utilité que (OOP_A ; IP_A), est un autre équilibre de Nash ?

Si IP a plusieurs stratégies, IP_A = IP_B = IP_C. Sinon ça part juste à la poubelle.

Quand tu dis « part à la poubelle », tu veux dire que (OOP_A ; IP_B), dans mon exemple, n’est pas un équilibre de Nash car IP_B n’est pas la meilleure réponse possible à toutes les stratégies d’OOP (et pas seulement à OOP_A) ?

https://fr.pokerstrategy.com/strategy/bss/equilibre-nash-frequence-bluff-call/

Dans un équilibre de nash, une stratégie exploitable n’existe pas.

Nous sommes d’accord qu’une stratégie strictement dominée (donc exploitable), comme IP_C, ne peut pas faire partie d’un équilibre de Nash mais ce n’est pas la question.

Si IP_B est co-optimale, elle n’est pas exploitable (IP ne peut pas trouver une stratégie où OOP ne maximise pas son EV).

La question est : « est-ce que (OOP_A ; IP_B) est un équilibre de Nash ? » et si non pourquoi ?

Si IP_A = IP_B, alors on a bien 2 équilibres (OOP_A ; IP_A) et (OOP_A ; IP_B) qui sont équivalents.

Ok donc la réponse à la question …

est : « oui il existe plusieurs équilibres de Nash dans le jeu résolu par un solver car ils y a plusieurs stratégies dominantes équivalentes (= avec la même utilité) », correct ?

Et en bonus, « s’il y a plusieurs stratégies faiblement dominantes, la solution restituée (la paire de stratégie OOP + IP) peut varier d’un solver à l’autre en fonction de l’algorithme qu’il utilise », correct ?

il peut y en avoir un, ou plusieurs. Le solver en trouve un et ne cherche pas plus loin.

oui

1 « J'aime »

Ok merci