NL10 : 3bet BB vs BTN

Stratégies à multiples bet sizings c’est très fortement probable, en revanche je suis très sceptique sur le cbet range sur stratégie théorique GTO. Concernant l’adaptation facile de push une grosse partie de son range pour deny l’équité d’IP j’ai comme des doutes quand on voit le range que tu décris. Bon courage pour deny l’équité de TPTK et de sets, et c’est encore plus faux s’il y’a stratégie à multiples bets sizings puisqu’une grosse proportion des mains nutsés d’OOP seront situées dans le gros sizing de cbet. Et se faire deny l’équité d’un bluff c’est forcément un inconvénient mais cela reste largement admissible.

edit: après vérification il n’y a absolument pas de stratégie de cbet range flop pour BB, si on tightifie le range de BB flop cela devrait cependant augmenter la fréquence de cbet, mais hero est aussi sensé s’adapter PF et avoir un range plus strong également.

Obv avec cette main par contre c’est mieux de call hein.
J’aurai du le préciser au premier post.
Juste le raise en bluff print. Et après quand tes vilains en ont marre de se faire marcher dessus c’est bien de mettre des values dedans, mais en 10 devrait pas trop y avoir besoin

2 « J'aime »

Salut,

non plutôt aux arguments développés par @rekop69 et @Renard9

… et la tentative de glisser TPTK en pot 3bet vs range strong dans la même range que les purs bluffs pour équilibrer une range de raise vis à vis de ce field.

Je ne dis pas que ça sert à rien d’avoir une stratégie de raise en bluff ni de chercher à équilibrer (il faut voir si on parle de la main ou en général) mais ici, il me semble que le raise est contre-productif et que ce n’est pas la peine de se prendre la tête à vouloir équilibrer même contre un reg de NL10 qui est peut-être décent mais qui jouera très loin de l’équilibre.

Nous sommes en situation WA/WB alors la ligne passive est la meilleure, imo (c’est bien aussi d’avoir des vieux ‹ outils › hors solver :wink: ).

Si je veux développer une stratégie de raise en bluff, je ne vais pas commencer par les pots 3bet vs range strong (la range de 3bet de BB en NL10 n’a rien à voir avec la range de 3bet de SB) alors que je suis IP et encore moins en y glissant mes meilleures mains.

Le spot se joue simplement, je pense.

Remarque :

Je ne pense pas que Villain Cbet trop justement. Quand tu as une range PF strong, c’est normal que ton Cbet% soit élevé.

Bien vu aussi, encore un truc que j’ai oublié de préciser hein, si vilain a 4% de 3b en BB on peut oublier le raise bluff flop

Le but n’est pas d’équilibrer mais de maximiser l’EV. Je n’ai pas parlé d’équilibre. Et d’ailleurs le solver non plus n’équilibre pas, il maximise son EV. Si tu penses que la préoccupation d’un solver est d’équilibrer son range alors tu te trompes. Je ne sais pas si c’est ton cas, mais énormément de personnes se trompent sur ce point.

raise TPTK c’est pas spécialement se prendre la tête, en revanche ça n’a pas l’air d’être dans tes habitudes. Rien que pour ça, ça mériterait que t’essayes, et l’avantage c’est qu’en plus si tu travailles un peu la line, tu vas te mettre dans un spot que tu maitriseras mieux que tes adversaires. Parce que tu vas jouer différemment des autres regs. Alors ce n’est pas une justification pour faire un play qui perd de l’EV mais c’est clairement un avantage stratégique très loin d’être anodin. Alors si en plus mathématiquement c’est justifié…

On a un vilain qui semble reg avec 10 de 3B. 400 hands c’est un sample très faible pour du 3b en réalité il se peut très bien que sa vrai stat de 3B soit à 6. Mais s’il a vraiment 10 de 3B alors il n’a pas un range super strong preflop. Même si je suis d’accord avec toi que les stats de 3B SB vs BU du field se rapprochent davantage des standards GTO que celles du 3B BB vs BU. Bref là on rentre dans des pures spéculations sur le range de la BB preflop.

Et pour être 100% honnête est ce que sur les tables tu as une stratégie de raise BUvsSB sur ce flop en 3BP?

Après clairement just call n’a rien de choquant. Le débat est intéressant donc j’ai bien envie de faire quelques nodelock histoire de voir quelle est la meilleure strat avec AQ, ça mérite clairement d’être vérifié et on peut extrapoler quelques conclusions sachant que c’est un spot récurrent de CG.

Oui le débat est intéressant globalement mais la ligne à prendre me semble simple sur ce spot.

Je n’ai pas dit que tu voulais équilibrer, je parlais des intervenants cités.

Pour moi le solver n’a pas de but. Il donne juste la ligne optimale (sous-entendu inexploitable) en fonction des paramètres qu’on lui donne.

Il donne l’EV de la ligne inexploitable. Il ne cherche pas à maximiser l’EV. Ça c’est une stratégie exploitante (mais exploitable) et c’est ce que l’on veut aux tables vu que personne ne joue à l’équilibre.

Je pense que l’action qui dégage la meilleure EV en pratique est un call ici.

La simulation ne va pas apporter grand-chose au débat et surtout pas de preuve mathématique si on est pas d’accord sur le paramétrage de départ.

Un reg nit de NL10 a un taux de 3bet plus proche du 4% que du 10%. Il va rarement avoir un taux de 3bet supérieur à sa moyenne en tout cas.

On va faire tellement d’hypothèses sur les locknodes et autre (il cbet 100% ?) que l’on risque de se perdre dans le débat :slight_smile:

Pour un spot comme ça, pas besoin de sortir le solver imo.

Si on parle plus généralement, oui j’ai des stratégies de raise BUvsSB ;-), un peu moins vsBB en pot3bet.

Oui je suis d’accord que je ne raise probablement pas assez (mais je me soigne) comme la majorité du field alors que ça print (justement parce que le field ne sait pas comment réagir).

Tu prêches un convaincu : Outils d'anayse de sa propre database - #10 par yvan161

Après il faut savoir le faire à bon escient.

Justement, c’est une mauvaise compréhension. Il maximise l’EV avant tout, sauf qu’il le fait contre un joueur qui saura bâtir une contre-stratégie s’il n’est pas équilibré, donc il proposera la solution la moins exploitable parce que s’il ne le fait pas l’EV de la solution va baisser. L’équilibrage est une conséquence et non un objectif. Donc le solver donne bien une solution optimale et non une solution non-exploitable.

Une simulation n’apporte pas grand chose, il faut en faire de multiples. Et si des simulations ne sont « valables » que dans une certaine propension, ça reste malgré tout ce qu’on a de mieux pour calculer des EV.

Le solver donne une solution avec une stratégie optimale, c’est à dire non-exploitable (c’est équivalent).

On peut tenter de maximiser l’EV (avoir une meilleure EV que celle de la solution optimale) en déviant mais au risque de se faire exploiter et donc au final d’avoir une EV inférieure à celle de la GTO.

Effectivement l’équilibrage n’est que le moyen d’obtenir une stratégie inexploitable. L’objectif d’une stratégie GTO est de ne pas se faire exploiter, pas de maximiser l’EV (ça c’est l’objectif d’une stratégie exploitante).

En tout cas, c’est ma compréhension.

D’ailleurs quelques soient le (ou les) sising que l’on demande à un solver, il trouve une solution optimale (=non exploitable)
33% = une solution optimale avec une ev(33%)
75% = une seconde solution optimale avec un ev(75%)
33, 75% une troisième solution optimale avec une ev (33,75%)

Il est à noter :

  1. Les 3 ev peuvent être très proches ou pas,
  2. Mon cerveau va préféré la simplicité d’une des solutions (en tout cas, pour un ev proche),
  3. vilain va faire plus d’erreur avec une solution (et je vais donc dévier vers cette solution pour augmenter mon ev)

Absolument.

Pour un paramétrage donné, le solver indiquera la stratégie avec laquelle ton adverse ne peut pas t’empêcher d’atteindre (a minima) l’EV indiquée même s’il joue parfaitement.

Pour des sizings proposés différents (avec des paramétrages équivalents pour le reste), les EV ne seront pas exactement similaires mais néanmoins très proches.

Du moins si j’ai bien compris Scylla et @freudinou :wink:

Pour les deux autres points, entièrement d’accord.

après vérification il n’y a absolument pas de stratégie de cbet range flop pour BB

Je sais pas quelle range tu donne mais c’est juste un cbet range. En simplification on a grosse fréquence mi pot et une petite portion 75%+.

Concernant l’adaptation facile de push une grosse partie de son range pour deny l’équité d’IP j’ai comme des doutes quand on voit le range que tu décris. Bon courage pour deny l’équité de TPTK et de sets

Si tu as lu la range que j’ai donné j’ai attribué des bluffs à vilain sur raise small IP, obv qu’on va jouer fit or fold si on attribue une range de raise seulement composé de TPTK + sets. Si on ajoute des bluffs (bdfd, bdsd + bdfd, et des mains types middle PP) comme le feront les vilains qui auront une range de raise small IP on a juste a push TP + pour deny l’équité du range global. D’ailleurs je pense que les joueurs qui développent ce type de stratégie sur ce board vont être déséquilibrés bluff avec préférence pour call des mains fortes types TPTK et sets.

Vu les stats de vilain à mon avis il est sur JJ+
Voir il a touché son brelan … pour moi faut pas s ´emballer … on ne bat que JJ dans les combos qu’il représente. C’est mon avis
Après si il a déjà bluffé de cette manière c’est autre chose. Surtout en BVs BTN …a voir

Vu les stats de vilain assez nit …et vu le déroulement du move à mon avis il est sur JJ+
Ou un AK qu’il a du mal à lâcher …Voir il a touché son brelan … pour moi faut pas s ´emballer … on ne bat que JJ et AK dans les combos qu’il représente. C’est mon avis
Après si il a déjà bluffé de cette manière c’est autre chose. Surtout en BVs BTN …a voir

ça c’est vrai.

Ca c’est faux. Comme les test menés avec différents sizings le montre, il n’y a pas " un équilibre" mais plusieurs. Tu peux jouer « équilibré » et jouer en push or fold, que ce soit préflop ou postflop. Si on prend l’exemple du preflop : on peut jouer avec des stratégies de raise sizé en étant 10 bb deep, seulement la différence d’EV est très faible avec une stratégie de push or fold. A contrario 100 bb deep la différence entre la stratégie avec des open sizé et la stratégie push or fold devient beaucoup plus importante en EV. Du coup le solver préférera tout le temps une stratégie d’open entre 2 et 5bb plutôt que de push 100bb. Postflop c’est exactement la même chose, du coup à ton avis pourquoi si tu plug 3 sizings comme 25%p, 75%p, et 1000%p pour qu’il ait un sizing all-in il va privilégier une stratégie à base de 25%p et 75%p alors qu’il pourrait trouver un équilibre plus facile avec le sizing AI ?? tout simplement parce qu’un des 2 joueurs perdrait de l’EV à jouer ainsi, tout en étant inexploitable… Du coup je maintiens qu’être « inexploitable » c’est bien une façon de maximiser l’EV et non un objectif en soit.

Juste non, on est plutôt aux alentours de 70% de cbet. Au delà des ranges, l’arbre va aussi influencer la solution… Si tu ne mets pas de raise à IP par exemple, ou des mauvais sizings ça va très fortement influencer ton résultat.

Le solver raise AQo ici sans avoir peur de quoi que ce soit alors même qu’il n’a pas de sets dans son range de raise IP. Mais ça à la rigueur on s’en moque royalement. Le plus important c’est surtout qu’en pratique on se fait très rarement 3bet flop ici quand on raise. Si on commence à se faire 3Bet ici c’est certainement qu’on commence à avoir des fréquence de raise IP intéressantes et que villain commence à se rebeller et qu’alors il est intéressant de commencer à inclure beaucoup de mains qui sont contentes de raise/call dans notre range de raise IP.

J’ai bien précisé :

Si tu changes les sizings alors tu résous un autre arbre et donc évidemment il y aura un autre équilibre.

Si tu parles de plusieurs sizings disponibles pour le solver dans une situation donnée alors il te donnera la solution à l’équilibre. Si un des joueurs n’applique pas la stratégie proposée (y compris dans l’application des ratios de sizing par main) alors il devient exploitable.

L’équilibre, c’est quand les 2 joueurs jouent la stratégie optimale (chacun cherche à maximiser son gain) : c’est cet équilibre que donne le solver pour une situation donnée (avec un paramétrage donné = ranges et actions/sizings). Il n’y a pas plusieurs équilibres ou stratégies dans la solution qu’il te donne.

Je maintiens que jeu (/stratégie) optimal(/e) et non-exploitable, c’est équivalent.

Donc si tu veux dire que le solver chercher à maximiser l’EV pour les deux joueurs dans la solution qu’il calcule, je suis d’accord.
Mais pour un joueur donné, le solver ne donne pas l’EV maximale (= la plus importante) qu’un joueur peut avoir dans une situation donnée (si son adversaire joue de façon sous-optimale).

Pour résumer ce que je pense et dit (si ce n’est pas clair) :

https://fr.pokerstrategy.com/glossary/GTO-Game-Theoretical-Optimum-_2135/

Je ne comprends pas ce que tu veux dire par là : le solver chercher un équilibre de Nash avec les éléments qu’on lui donne.
Si tu appliques une stratégie GTO alors ton objectif est d’être inexploitable : tu ‹ maximises › ton EV contre un joueur qui lui-même applique une stratégie GTO mais pas contre un joueur qui joue sous-optimal.

Tout vient de mon point de vue de la confusion sur « l’équilibre » une solution de push or fold 100bb deep suivant les tableaux GTO par exemple est « non exploitable » de manière active parce que les autres joueurs en soit ont une unique réponse stratégique à adopter et s’ils en dévient ils vont automatiquement perdre de l’EV.

En revanche ce n’est pas une situation d’équilibre de Nash parce qu’il existe une autre stratégie qui génère plus d’EV avec des sizings de RFI plus small. Sachant que le poker est un jeu à somme nulle ( avec abstraction du rake), mécaniquement si le joueur qui push or fold perd de l’EV alors les autres joueurs gagnent de l’EV Donc en réalité la première solution push or fold n’est pas exploitable « activement » mais elle perd de l’EV tout de même et ce n’est donc pas un équilibre de Nash.

Et étant donné qu’on ne rentrera jamais une infinité de sizings dans le solver on aura jamais un vrai équilibre de Nash mais quelque chose qui s’en rapproche plus ou moins. A contrario en pot limit hold’em là on a des solutions postflop qui correspondent à un équilibre de Nash.

Bon tout ça c’est bien joli, c’est un peu complexe et déroutant mais si on revenait à l’objet qui nous intéresse au départ ?

Tu dis que ça sert à rien de vouloir raise TPTK et équilibrer notre range versus BB dans le spot en question. Pour justifier un play différent du solver qui lui veut équilibrer ses bluffs pour être inexploitable.
Et là est le soucis, si le solver raise TPTK c’est pour maximiser sa value, si l’EV de call TPTK est meilleure alors le solver va call TPTK 100% du temps.

Quand un combo a une stratégie mixée (raise/call en l’occurence) sur le solver c’est que les EV sont similaires, les quelques centièmes d’EV de différence sont dûes au fait que la solution soit imparfaite (dEV > 0). Le solver ne prendra jamais une line EV- sous prétexte d’un équilibrage, ni même une line de raise si EV raise = 1 et EV de call = 2.

Evidemment on ne joue pas contre un bot GTO mais contre un humain ultra leaké, et in fine peut être que dans la situation qui nous intéresse EV de call > EV de raise. Mais on ne peut en aucun cas justifier une action différente du solver par une histoire de " on s’en moque de l’équilibrage", il est parfaitement possible que contre le joueur leaké en question la solution dite exploitante sera de raise 100% AQo ( alors qu’autrement c’est mixé en « GTO »).

Si tu rentres un board à 5 cartes sur GTO+ avec un arbre à 2 branches et que tu lock une stratégie « non GTO » sur une des 2 branches. Tu verras que le solver te donne une stratégie qui maximise l’EV aux petits oignons avec la branche « libre » contre les leaks de la branche verrouillée.

Oui il maximise l’EV des 2 joueurs, mais du coup on est bien d’accord que c’est correct de dire qu’il maximise l’EV du joueur 1 ou l’EV du joueur 2.

Un vieil article qui explique bien quel a été l’objectif donné à ces ordinateurs : counterfactual regret minimization.

Autrement dit : « minimisation du regret » sauf que minimiser son regret c’est aussi synonyme de maximiser son utilité ( = EV au poker).

Il précise également qu’in fine l’ordinateur avait atteint l’équilibre de nash.

Sur les solvers grand public les modèles utilisés sont les mêmes en plus ou moins évolués. Le principe reste le même.

Non ce n’est pas pour cette raison.

Le fameux tableau HeadsUp Push/Fold Nash Equilibrium n’est pas précisément un équilibre de Nash mais une représentation simplifiée de plusieurs équilibres de Nash (situations de HU résolues à différent niveaux de blinds).

Ce qu’il faut comprendre avec les vrais solvers (qui cherchent un équilibre de Nash) c’est qu’ils ne résolvent pas le jeu NLHE dans son ensemble mais une situation donnée.

Ici on solve une situation PF avec un seul sizing possible.

Ce n’est pas parce qu’une autre stratégie non-exploitable existe dans une situation différente (avec d’autres sizings autrement dit dans un autre ‹ jeu › au sens de la solution) que celle-ci n’est pas un équilibre de Nash. Tu peux avoir des stratégies toujours optimales avec des choix de sizing qui dégagent plus d’EV que celle avec un seul choix de sizing.
C’est juste que celle avec un seul sizing sera plus facile à mettre en oeuvre pour un être humain.

En faisant abstraction de la simplification de la précision et de la synthèse des différentes tables suivants les profondeurs :

Il y a donc un (et un seul) équilibre de Nash en PoF HU (par profondeur de tapis effectif) à partir du moment où le seul sizing possible est All-in.

Il faut comprendre qu’un équilibre de Nash, c’est l’ensemble des stratégies des 2 (ou plus) joueurs et pas une stratégie isolée d’un des deux joueurs.

Le solver maximise l’EV du joueur 1 ET du joueur 2.

Les solveurs ne résolvent pas le jeu NLHE dans son ensemble (n’importe quelles ranges, n’importe quel sizing, n’importe quel tapis effectif, n’importe quel nombre de joueurs …). Juste une situation donnée avec un paramétrage (ranges et actions/sizings et souvent uniquement en HU). N’empêche, ils délivrent une solution GTO/Nash/à l’équilibre/optimale.

Justement Il y a une confusion dans l’article de pokernews sur ce point.

Certains outils comme Snowie, Pluribus … sont appelés abusivement ‹ solver › comme s’ils délivraient une solution GTO (un équilibre de Nash) alors que ce n’est pas le cas, même si par leur approche ils peuvent devenir imbattables par des être humains (et encore ça reste à prouver selon moi).

PIO, GTO+, Simple PostFlop … sont des vrais solvers en ce sens qu’ils délivrent une solution GTO (= un équilibre de Nash) et d’ailleurs ils délivrent la même à paramétrage équivalent (abstraction faite de la précision et de bugs éventuels d’implémentation).

Pour le lock node mode, tu changes les paramètres ‹ du jeu étudié › en empêchant le solver d’explorer certaines contre-mesures comme tu le fais lorsque tu choisis certains sizings ‹ autorisés ›.

Reformulons : il est contre productif de vouloir jouer optimal/GTO/à l’équilibre dans ce spot surtout à cette limite. Raise AQo ici est du value cut pour moi.

Le débat est intéressant mais je ne sais pas si l’on va pouvoir conclure : nous avons simplement une compréhension partiellement différente de ce qu’est la GTO. :slight_smile:

Au moins sur le point ci-dessous, nous sommes alignés :wink:

Oui d’accord je ne le savais pas, je ne joue pas en MTT, j’ai juste entendu que les tableaux de Jenifear étaient incorrects. Mais même si ce n’était pas une situation simplifiée ce ne serait toujours pas l’équilibre de Nash au sens où je l’ai décrit parce que le push or fold perd de l’EV dans tous les cas.

Oui, mais j’espère quand même que chaque joueur qui ouvre un solver en a conscience. Et c’est justement pour ça que je dis que le solver ne délivre pas l’équilibre de nash du spot. Parce qu’on est limités sur l’arbre et le nombre de sizings. On pourrait appeler ça une sorte de « sous » équilibre de Nash parce qu’on sait que l’arbre qu’on a configuré est limitant. Mais là c’est discuter sur des détails et une définition différente selon les sources, et personnellement je n’ai pas les compétences pour arbitrer quelle définition est la meilleure et surtout j’ai l’impression qu’on s’en fout royalement au final !!

Je n’ai pas encore assez exploré le sujet, si je ne dis pas de bêtises pluribus and co, snowie sont des neural networks plutôt que des solvers en effet.

Le principe de minimisation du regret ( et donc de maximisation de l’EV ) reste commun tout de même. entre solvers et neural networks.

De ce que j’ai lu en fonction des solvers/bots les modèles de calcul informatiques sont différents et plus ou moins efficaces/évolués, il y en a plusieurs comme par exemple :

  • CFR
  • CFR+
  • MCCFR
  • DCFR
  • ICFR