Petit casse-tête pour le week-end : Poker a 3 cart

Vous jouez au jeu de poker suivant. Il y a 3 cartes dans le paquet, un As, un Roi et une Dame. Comme d?habitude, l?As bat les deux autres cartes, et le Roi bat la Dame.
C’est un jeu a deux joueurs, chacun postant un ante de 1$ avant la distribution des cartes.

On donne une carte ? chaque joueur, et il y a un seul tout d?ench?re, avec un nombre de relances illimit?, format limite, 1$ la mise.

Vous ?tes premier de parole, et vous avez la Q. Quelle est la strat?gie optimale, en supposant que vous jouez contre un adversaire qui applique une strat?gie optimale ?

PS : je n?ai pas encore r?fl?chis a cette question, que j?avais trouv? je ne sais plus ou sur internet. Donc pas la peine de me demander une r?ponse pour le moment !

Juste pour bien comprendre la question.
C’est bien un head up ?

Dans cette hypoth?se, on est donc ? 2 joueurs, on a la plus faible carte et on ne sait pas si notre adversaire ? l’as ou le roi.

Ta question est donc, doit on checker, relancer, sachant que la mise de d?part pour chacun des joueurs est de 1$ pour jouer.

En suivant ces hypoth?ses, on a donc 2$ dans le pot et une chance sur 2 que notre adversaire ait le jeu max.

Si c’est bien ??, je commence ? r?fl?chir :wink:

Bonjour,

Moi je l’avais vu plutot comme du pseudo-poker ou plutot un jeu de paris entre ami comme le pile ou face.

En head up (2 joueurs moi inclu)

Je ne mettait donc pas de blind (pot=0$).

Et j’?tait le 1er ? parler.
Je pensais que c’?tait soit on relance, soit on abandonne.

A priori Nico reste plus dans les mises du poker.

Alors j?rome, il nous faudrais quelques pr?cisions…

  • Est ce bien un head up ?
  • Y a t il ou pas des blinds ? si oui de combien et qui mise quoi ?
  • je suis bien le 1er ? parler ou pas ?
  • On ? quel choix de jeu ? Fold, Check, bet, call, raise…
  • y a t il un abattage final de toute fa?on ou pas ?
  • On gagne sous quel condition ?
  • Et tu prends combien en frais de la maison sur les mises :wink:

Merci pour ces pr?cisions, A+

Bonne remarque Nico, j’ai oublie de parler des antes.
J’ai corrige le message original!
Pour le reste c’est du poker standard, tu es hors de position, tu peux miser ou checker, c’est du limite standard, et l’abattage se passe comme decrit ds le post original: A>K>Q.

Bon voici ma premi?re analyse.
On est d’accord que l’argent constitu? par les ante forme la cible de ce qui est gagner. Si jamais on est call? ou relanc?, cela signifie qu’on a perdu le coup.

Notre imp?ratif, si on veut gagner le coup: faire coucher notre adversaire.

Veut on gagner le coup ?
Oui, je ne pense pas que faire check, soit la strat?gie optimale - puisqu’elle signifie la perte de notre ant? original (notre adversaire a mieux que nous ? l’abattage).

La strat?gie optimale consiste donc ? jouer sur le fait que si notre adversaire ? un roi, il peut croire qu’on a un as et coucher sa main.
Il faut donc calculer le rapport entre ce qu’il y a ? gagner et le risque que l’on prend sur ce coup ? better. En No limit, j’aurai presque ?t? tent? de dire qu’il faut faire pot (mettre 2$ en partant du principe qu’on a une chance sur 2 de gagner le coup en bluff, comme on a 2 ? gagner ca donne un EV ? Z?ro. Un EV ? z?ro c’est mieux qu’un EV n?gatif qui serait le cas si on checkait - car on perdrait le coup dans 100% des cas).

Mais bon on est en limite ici et on peut better que de 1 - on sera donc call? plus souvent. Et du coup la r?ponse devient moins triviale.
Elle doit ?tre du genre better avec QQ une fois sur trois ou quelle que chose comme ??. Ce n’est que du feeling pour l’instant.

J’essaye de ne pas d?penser inutilement mes 1$ et j’?conomise pour m’acheter un jeu complet. :unsure:

Bonjour ? tous,

J’ai regard? ce petit probl?me ce week end.

Comment trouver la strat?gie optimale ?

  • On peut proc?d? par des essais successifs et d?s que l’on trouve une strat?gie meilleur qu’une autre cel? discalifie la strat?gie pr?c?dente.

  • Simple et efficace ce tatonnement bien que ne permettant pas d’?tre vraiment sur que l’on tient la strat?gie optimale au final.

Comment comparer 2 strat?gies :

  • Facile, c’est celle qui donne les gains maxi.
  • Bref, on essais la strat?gie et on regarde les r?sultats qu’elle donne.

Mais voil? il y a un gros probl?me…

  • Je veux tester la strat?gie suivante : chacun des joueurs relance toujours l’autre.
  • Cel? implique que chacun des joueurs relancera l’autre ? l’infini !
  • Pour cel? il faut que l’on puisse miser ? l’infini (ok d’apr?s l’?nonc?)
  • Et que les 2 joueurs ont un tapis infini (Ok math?matiquement, l’?nonc? ne donne aucune limite aux tapis. Mais en pratique c’est bien sur impossible)
  • N’ayant aucune information dans l’?nonc? sur le tapis des joueurs, je le suppose infini pour chacun. (Si je le d?signe comme fini, il me faut le montant exacte de chacun car cel? changerais le r?sultat obtenu pour une strat?gie donn?e. Mais l’?nonc? est ainsi, je ne vais pas le modifier.)

Qui gagne la partie dans ce cas ?

  • En moyenne, chacun des 2 joueurs ? la m?me proba et gagne donc 1 fois sur 2.

  • Mais pour cette partie donn?e, il y a impossibilit? math?matique ? d?cider qui gagne ces pertie donn?e !
    (Ind?cidabilit? au sens de Godel pour les connaisseurs)

  • Ne pouvant d?cider qui gagnera et qui perdra cette partie, je ne peux pas comparer cette strat?gie aux autres. Le r?sultat de cette comparaison est en effet lui aussi ind?cidable.

Bref, je ne pourrais JAMAIS d?montrer que cette strat?gie et ou non la strat?gie optimale !
Ce probl?me est math?matiquement ind?cidable !

Autre approche :

Par contre, si l’on d?cide (Rien ne nous l’emp?che, mais ce n’?tait pas dans l’?nonc?) que cette strat?gie de relance infinie par les 2 joueurs n’est pas la strat?gie optimale, alors l? il y a sans doute une autre solution plus classique…

Dans ce dernier cas, cel? simplifit le probl?me puisque l’on sait alors que la stat?gie optimale ne peut pas ?tre que les 2 relancent infiniement.
Du coup, dans la strat?gie optimale il ne peut donc pas y avoir de relance des 2 joueurs (Car si pourquoi arreterait t on au 100?me coup ou au 2?me coup ? y a pas de diff?rence dans l’esp?rance math?matique et rien ne pourra nous dire d’arreter ces relance jusqu’? l’infini. Mais cas exclus)
Et cel? simplifit enorm?ment…

Moins de math
Bon je crois que l’argumentation que j’ai donn?e ci-dessus ne devait pas ?tre attendue, c’est donc que l’on pouvait s’en passer pour r?soudre le petit casse-t?te.

Donc soit :

  • l’?nonc? est incomplet,
  • soit un suppose la r?solution avec certain pr?jug? ?cartant certaines solutions d’office (Difficile de trouver si on n’as pas les m?me pr?jug? !)
  • Soit mon raisonnement sur l’ind?cidabilit? est faux !

Bref pas ?vidente ? trouver…

Je cherche encore…

Donn?e: nous avons le plus faible jeu, l’adversaire ayant lui une chance sur deux d’avoir KK (vs AA).
Une fois sur deux, notre adversaire n’aura donc pas la main maximale (AA), et dans cette configuration - il ne saura ?videmment pas si nous avons QQ ou AA.

Raisonnement par l’absurde
Hypoth?se : si notre adversaire n’a pas jeu max, prenons comme hypoth?se qu’il foldera sa main face ? un bet adverse (cas non fid?le ? la r?alit?)
Si nous optons pour une strat?gie fixe: bet ? 100%
Nous jouons 1 pour gagner 3 - avec en face un adversaire qui a une chance sur deux d’avoir jeu max.
Nous perdrons assur?ment donc 1$ une fois sur deux, quand l’adversaire aura sa paire d’as.
Nous gagnerons 2 dollars quand l’adversaire aura sa paire de roi (au regard de l’hypoth?se)

Dans cette hypoth?se (non exacte ?videmment), un bet ? 100% fera perdre 1$ une fois sur deux et en ferait gagner 2$ une fois sur deux donc une esp?rance financi?re positive. Tout le probl?me est dans l’hypoth?se, notre adversaire va certainement payer de temps en temps pour v?rifier qu’on ne le trompe pas faisant baisser drastiquement notre c?te financi?re.

=> Il ne faudra donc pas pour cette raison better ? 100% mais ? un seuil « cr?dible », c’est ce seuil qu’il nous faut calculer

PS: Je pars du principe que nous sommes dans un cas r?el: avec un tapis fini de part et d’autres (pour bigbig ;o)

Bonjour ? tous,

Nico, j’arrive ? une esp?rance n?gative avec ton raisonnement…

Il y a 2 cas, chacun avec une proba 1/2 de se r?aliser :

Notation :
J1 : 1er joueur ? parler, celui qui ? la Q
J2 : L’adversaire qui joue la strat?gie optimale

Strat?gie de Nico :
J1 mise ? 100%
Si J2 ? A, il call ou raise
Si J2 ? K, il fold ? 100%
Si J2 ? Raiser, J1 fold

- Cas J1 ? Q, J2 ? A :
J1 : Ante de 1$ => Pot : 1$
J2 : Ante de 1$ => Pot : 2$
J1 : Bet : 1$ => Pot : 3$
J2 : Call : 1$ => Pot : 4$
(Si J2 Raise, J1 fold, c’est ?quivalent pour les gains et pertes)
=> D?voilement ou Fold : J2 gagne le pot de 4$
Total J1 : -Ante-bet : -2$
Total J2 : -Ante-call+pot : -2$+4$=+2$

- Cas J1 ? Q, J2 ? K :
J1 : Ante de 1$ => Pot : 1$
J2 : Ante de 1$ => Pot : 2$
J1 : Bet : 1$ => Pot : 3$
J2 : Fold => Pot : 3$
=> J1 gagne le pot de 3$
Total J1 : -Ante-bet+pot : -2$+3$=1$
Total J2 : -Ante : -1$

L’esp?rance de J1 est donc de :
E = 1/2*(-2$) + 1/2*(+1$) = -0.5 < 0 Esp?rance n?gative…

Apparament, tu n’inclus pas l’ante de J1 dans les mises mais tu inclus l’ante de J2 dans les gains ce qui me semble incorrect…

Strat?gie du Fold
J1 ? le jeu mini, seul un fold de J2 le fait gagner.
J1 ne prend pas de risque, il fold ? 100% avec Q.

J1 : Ante de 1$ => Pot : 1$
J2 : Ante de 1$ => Pot : 2$
J1 : Fold => Pot : 2$
=> J2 gagne le pot de 2$
Total J1 : -Ante : -1$
Total J2 : -Ante+Pot : -1$+2$ = +1$

Esp?rance de J1 : Perd 1$ ? tous les coups :
E = -1$

La strat?gie de Nico est donc meilleur que de folder ? tous les coups mais ? quand m?me une esp?rance n?gative ? cause des antes.

A noter :
Rien ne prouve actuellement que J2 joue bien la strat?gie optimale.

Et si par exemple je check ? Que fera l’adversaire ?

A noter que l’on a une info de plus que l’adversaire :

  • Nous savons qu’il joue de fa?on optimale, mais ? priori lui ne sais pas que l’on joue aussi de fa?on optimale…

J’ai essayer divers trucs mais pour jouer mon 1er coup, j’arrive vite ? devoir regarder ce qu’il jouera selon ses cartes et selon ce que il aura vu que j’ai jou?.
Mais lui aussi pour jouer il regarde ce que j’ai jou? et ce que je jouerais une fois qu’il aura jou?.
Raisonnement que je dois donc inclure dans mon raisonnement pour jouer le 1er coup !
Etc…
L? ?a bloque y a trop de cas…
Il faut sans doute formaliser cel? math?matiquement et ont devrais, je suppose, tomber sur une relation de r?curence qui donnera le jeu optimal et la solution au probl?me.

La strat?gie optimale de chaque joueur n’est pas de tout relancer chacun :
Y a quand m?me un truc, si l’adversaire et moi m?me jouent de fa?on optimale, l’esp?rance de chacun sur le long terme devrait ?tre nulle.
Dans le jeu r?el, ce qui fera gagner l’un et perdre l’autre, c’est le hasard qui fera fluctuer les tapis et qui stoppera le jeu lorsqu’un des joueurs auras perdu tout son tapis lors de la plus grosse fluctuation statistique. (Je n?glige le temps de jeu, disont plutot que les 2 joueurs ont le m?me tapis au d?part mais pas bien gros)
Sachant cel?, c’est ? dire que dans le jeu r?el l’un perdra tout son tapis et l’autre doublera.

Or si chacun relance tous les coups et met tout son tapis, nous savons que J1 perdra ? coup sur.
Bref, J1 perd toute ses chances de gagner le tournoi.
Pourtant J1 et J2 jouant tous les 2 de fa?on optimale J1 ? autant de chance que J2 de gagner.
On arrive donc ? une contradiction.
Ce qui prouve par l’absurde que la strat?gie optimale n’est pas que les 2 joueurs relances tout !
(Mais cel? n’exclu pas qu’un des 2 joueurs doit tout relancer pour jouer ? l’optimum, l’autre joueur n’aurai pas cette strat?gie optimale dans ce cas.)

Ce probl?me n’est vraiment pas facile ? r?soudre…

Bon, comme cette discussion prend un tour etrange…
Je crois que ce probleme doit etre approche sous l’angle de la frequence de bluff optimal.

En esperant que ca aide.

Jerome.

Bonjour,

Oui, y a de forte chance que ce soit cel? que l’on d?sire comme r?ponse.
Je n’ai pas cette r?ponse pour l’instant :frowning:
Si tu peux nous en dire un peu plus sur le pourquoi tu en ai arriv? ? ce sous probl?me…

Pour ma part, je pense qu’il faut d’abord trouver quel est la strat?gie optimale que jouera l’adversaire.
Or pas facile pour moi de trouver cette strat?gie qui se mord la queue et fini par tout m’embrouiller.

Ainsi, la recherche de la m?thode optimale est pour moi un tr?s bon probl?me surtout avec cet ?nonc? tout simple.
Et comment ?tre sur que c’est bien la m?thode optimale ?

Il faut peut ?tre rajouter les proba de blufs mais ?a risque encore, pour moi, de compliquer les calculs…
Et surtout, on ne sais rien de l’autre joueur (s?rr?/lache, agressif/passif ?) mais juste qu’il joue la strat?gie optimale…

A+

En fait, si ton adversaire joue la strategie optimale, cela veut dire que si tu bluffes trop, il va identifier cette tendance, et toujours te payer. Si tu ne bluffes pas assez, il va identifier cette tendance, et ne jamais te payer.

Pour exprimer les choses plus simplement, dire qe ton adversaire joue une strategie optimale, c’est dire que tu dois toi aussi chercher la frequence de bluff theorique optimale, car ton adversaire n’a pas de « biais » exploitable (trop tight ou trop loose).