NL10 : 3bet BB vs BTN

Oui le débat est intéressant globalement mais la ligne à prendre me semble simple sur ce spot.

Je n’ai pas dit que tu voulais équilibrer, je parlais des intervenants cités.

Pour moi le solver n’a pas de but. Il donne juste la ligne optimale (sous-entendu inexploitable) en fonction des paramètres qu’on lui donne.

Il donne l’EV de la ligne inexploitable. Il ne cherche pas à maximiser l’EV. Ça c’est une stratégie exploitante (mais exploitable) et c’est ce que l’on veut aux tables vu que personne ne joue à l’équilibre.

Je pense que l’action qui dégage la meilleure EV en pratique est un call ici.

La simulation ne va pas apporter grand-chose au débat et surtout pas de preuve mathématique si on est pas d’accord sur le paramétrage de départ.

Un reg nit de NL10 a un taux de 3bet plus proche du 4% que du 10%. Il va rarement avoir un taux de 3bet supérieur à sa moyenne en tout cas.

On va faire tellement d’hypothèses sur les locknodes et autre (il cbet 100% ?) que l’on risque de se perdre dans le débat :slight_smile:

Pour un spot comme ça, pas besoin de sortir le solver imo.

Si on parle plus généralement, oui j’ai des stratégies de raise BUvsSB ;-), un peu moins vsBB en pot3bet.

Oui je suis d’accord que je ne raise probablement pas assez (mais je me soigne) comme la majorité du field alors que ça print (justement parce que le field ne sait pas comment réagir).

Tu prêches un convaincu : Outils d'anayse de sa propre database - #10 par yvan161

Après il faut savoir le faire à bon escient.

Justement, c’est une mauvaise compréhension. Il maximise l’EV avant tout, sauf qu’il le fait contre un joueur qui saura bâtir une contre-stratégie s’il n’est pas équilibré, donc il proposera la solution la moins exploitable parce que s’il ne le fait pas l’EV de la solution va baisser. L’équilibrage est une conséquence et non un objectif. Donc le solver donne bien une solution optimale et non une solution non-exploitable.

Une simulation n’apporte pas grand chose, il faut en faire de multiples. Et si des simulations ne sont « valables » que dans une certaine propension, ça reste malgré tout ce qu’on a de mieux pour calculer des EV.

Le solver donne une solution avec une stratégie optimale, c’est à dire non-exploitable (c’est équivalent).

On peut tenter de maximiser l’EV (avoir une meilleure EV que celle de la solution optimale) en déviant mais au risque de se faire exploiter et donc au final d’avoir une EV inférieure à celle de la GTO.

Effectivement l’équilibrage n’est que le moyen d’obtenir une stratégie inexploitable. L’objectif d’une stratégie GTO est de ne pas se faire exploiter, pas de maximiser l’EV (ça c’est l’objectif d’une stratégie exploitante).

En tout cas, c’est ma compréhension.

D’ailleurs quelques soient le (ou les) sising que l’on demande à un solver, il trouve une solution optimale (=non exploitable)
33% = une solution optimale avec une ev(33%)
75% = une seconde solution optimale avec un ev(75%)
33, 75% une troisième solution optimale avec une ev (33,75%)

Il est à noter :

  1. Les 3 ev peuvent être très proches ou pas,
  2. Mon cerveau va préféré la simplicité d’une des solutions (en tout cas, pour un ev proche),
  3. vilain va faire plus d’erreur avec une solution (et je vais donc dévier vers cette solution pour augmenter mon ev)

Absolument.

Pour un paramétrage donné, le solver indiquera la stratégie avec laquelle ton adverse ne peut pas t’empêcher d’atteindre (a minima) l’EV indiquée même s’il joue parfaitement.

Pour des sizings proposés différents (avec des paramétrages équivalents pour le reste), les EV ne seront pas exactement similaires mais néanmoins très proches.

Du moins si j’ai bien compris Scylla et @freudinou :wink:

Pour les deux autres points, entièrement d’accord.

après vérification il n’y a absolument pas de stratégie de cbet range flop pour BB

Je sais pas quelle range tu donne mais c’est juste un cbet range. En simplification on a grosse fréquence mi pot et une petite portion 75%+.

Concernant l’adaptation facile de push une grosse partie de son range pour deny l’équité d’IP j’ai comme des doutes quand on voit le range que tu décris. Bon courage pour deny l’équité de TPTK et de sets

Si tu as lu la range que j’ai donné j’ai attribué des bluffs à vilain sur raise small IP, obv qu’on va jouer fit or fold si on attribue une range de raise seulement composé de TPTK + sets. Si on ajoute des bluffs (bdfd, bdsd + bdfd, et des mains types middle PP) comme le feront les vilains qui auront une range de raise small IP on a juste a push TP + pour deny l’équité du range global. D’ailleurs je pense que les joueurs qui développent ce type de stratégie sur ce board vont être déséquilibrés bluff avec préférence pour call des mains fortes types TPTK et sets.

Vu les stats de vilain à mon avis il est sur JJ+
Voir il a touché son brelan … pour moi faut pas s ´emballer … on ne bat que JJ dans les combos qu’il représente. C’est mon avis
Après si il a déjà bluffé de cette manière c’est autre chose. Surtout en BVs BTN …a voir

Vu les stats de vilain assez nit …et vu le déroulement du move à mon avis il est sur JJ+
Ou un AK qu’il a du mal à lâcher …Voir il a touché son brelan … pour moi faut pas s ´emballer … on ne bat que JJ et AK dans les combos qu’il représente. C’est mon avis
Après si il a déjà bluffé de cette manière c’est autre chose. Surtout en BVs BTN …a voir

ça c’est vrai.

Ca c’est faux. Comme les test menés avec différents sizings le montre, il n’y a pas " un équilibre" mais plusieurs. Tu peux jouer « équilibré » et jouer en push or fold, que ce soit préflop ou postflop. Si on prend l’exemple du preflop : on peut jouer avec des stratégies de raise sizé en étant 10 bb deep, seulement la différence d’EV est très faible avec une stratégie de push or fold. A contrario 100 bb deep la différence entre la stratégie avec des open sizé et la stratégie push or fold devient beaucoup plus importante en EV. Du coup le solver préférera tout le temps une stratégie d’open entre 2 et 5bb plutôt que de push 100bb. Postflop c’est exactement la même chose, du coup à ton avis pourquoi si tu plug 3 sizings comme 25%p, 75%p, et 1000%p pour qu’il ait un sizing all-in il va privilégier une stratégie à base de 25%p et 75%p alors qu’il pourrait trouver un équilibre plus facile avec le sizing AI ?? tout simplement parce qu’un des 2 joueurs perdrait de l’EV à jouer ainsi, tout en étant inexploitable… Du coup je maintiens qu’être « inexploitable » c’est bien une façon de maximiser l’EV et non un objectif en soit.

Juste non, on est plutôt aux alentours de 70% de cbet. Au delà des ranges, l’arbre va aussi influencer la solution… Si tu ne mets pas de raise à IP par exemple, ou des mauvais sizings ça va très fortement influencer ton résultat.

Le solver raise AQo ici sans avoir peur de quoi que ce soit alors même qu’il n’a pas de sets dans son range de raise IP. Mais ça à la rigueur on s’en moque royalement. Le plus important c’est surtout qu’en pratique on se fait très rarement 3bet flop ici quand on raise. Si on commence à se faire 3Bet ici c’est certainement qu’on commence à avoir des fréquence de raise IP intéressantes et que villain commence à se rebeller et qu’alors il est intéressant de commencer à inclure beaucoup de mains qui sont contentes de raise/call dans notre range de raise IP.

J’ai bien précisé :

Si tu changes les sizings alors tu résous un autre arbre et donc évidemment il y aura un autre équilibre.

Si tu parles de plusieurs sizings disponibles pour le solver dans une situation donnée alors il te donnera la solution à l’équilibre. Si un des joueurs n’applique pas la stratégie proposée (y compris dans l’application des ratios de sizing par main) alors il devient exploitable.

L’équilibre, c’est quand les 2 joueurs jouent la stratégie optimale (chacun cherche à maximiser son gain) : c’est cet équilibre que donne le solver pour une situation donnée (avec un paramétrage donné = ranges et actions/sizings). Il n’y a pas plusieurs équilibres ou stratégies dans la solution qu’il te donne.

Je maintiens que jeu (/stratégie) optimal(/e) et non-exploitable, c’est équivalent.

Donc si tu veux dire que le solver chercher à maximiser l’EV pour les deux joueurs dans la solution qu’il calcule, je suis d’accord.
Mais pour un joueur donné, le solver ne donne pas l’EV maximale (= la plus importante) qu’un joueur peut avoir dans une situation donnée (si son adversaire joue de façon sous-optimale).

Pour résumer ce que je pense et dit (si ce n’est pas clair) :

https://fr.pokerstrategy.com/glossary/GTO-Game-Theoretical-Optimum-_2135/

Je ne comprends pas ce que tu veux dire par là : le solver chercher un équilibre de Nash avec les éléments qu’on lui donne.
Si tu appliques une stratégie GTO alors ton objectif est d’être inexploitable : tu ‹ maximises › ton EV contre un joueur qui lui-même applique une stratégie GTO mais pas contre un joueur qui joue sous-optimal.

Tout vient de mon point de vue de la confusion sur « l’équilibre » une solution de push or fold 100bb deep suivant les tableaux GTO par exemple est « non exploitable » de manière active parce que les autres joueurs en soit ont une unique réponse stratégique à adopter et s’ils en dévient ils vont automatiquement perdre de l’EV.

En revanche ce n’est pas une situation d’équilibre de Nash parce qu’il existe une autre stratégie qui génère plus d’EV avec des sizings de RFI plus small. Sachant que le poker est un jeu à somme nulle ( avec abstraction du rake), mécaniquement si le joueur qui push or fold perd de l’EV alors les autres joueurs gagnent de l’EV Donc en réalité la première solution push or fold n’est pas exploitable « activement » mais elle perd de l’EV tout de même et ce n’est donc pas un équilibre de Nash.

Et étant donné qu’on ne rentrera jamais une infinité de sizings dans le solver on aura jamais un vrai équilibre de Nash mais quelque chose qui s’en rapproche plus ou moins. A contrario en pot limit hold’em là on a des solutions postflop qui correspondent à un équilibre de Nash.

Bon tout ça c’est bien joli, c’est un peu complexe et déroutant mais si on revenait à l’objet qui nous intéresse au départ ?

Tu dis que ça sert à rien de vouloir raise TPTK et équilibrer notre range versus BB dans le spot en question. Pour justifier un play différent du solver qui lui veut équilibrer ses bluffs pour être inexploitable.
Et là est le soucis, si le solver raise TPTK c’est pour maximiser sa value, si l’EV de call TPTK est meilleure alors le solver va call TPTK 100% du temps.

Quand un combo a une stratégie mixée (raise/call en l’occurence) sur le solver c’est que les EV sont similaires, les quelques centièmes d’EV de différence sont dûes au fait que la solution soit imparfaite (dEV > 0). Le solver ne prendra jamais une line EV- sous prétexte d’un équilibrage, ni même une line de raise si EV raise = 1 et EV de call = 2.

Evidemment on ne joue pas contre un bot GTO mais contre un humain ultra leaké, et in fine peut être que dans la situation qui nous intéresse EV de call > EV de raise. Mais on ne peut en aucun cas justifier une action différente du solver par une histoire de " on s’en moque de l’équilibrage", il est parfaitement possible que contre le joueur leaké en question la solution dite exploitante sera de raise 100% AQo ( alors qu’autrement c’est mixé en « GTO »).

Si tu rentres un board à 5 cartes sur GTO+ avec un arbre à 2 branches et que tu lock une stratégie « non GTO » sur une des 2 branches. Tu verras que le solver te donne une stratégie qui maximise l’EV aux petits oignons avec la branche « libre » contre les leaks de la branche verrouillée.

Oui il maximise l’EV des 2 joueurs, mais du coup on est bien d’accord que c’est correct de dire qu’il maximise l’EV du joueur 1 ou l’EV du joueur 2.

Un vieil article qui explique bien quel a été l’objectif donné à ces ordinateurs : counterfactual regret minimization.

Autrement dit : « minimisation du regret » sauf que minimiser son regret c’est aussi synonyme de maximiser son utilité ( = EV au poker).

Il précise également qu’in fine l’ordinateur avait atteint l’équilibre de nash.

Sur les solvers grand public les modèles utilisés sont les mêmes en plus ou moins évolués. Le principe reste le même.

Non ce n’est pas pour cette raison.

Le fameux tableau HeadsUp Push/Fold Nash Equilibrium n’est pas précisément un équilibre de Nash mais une représentation simplifiée de plusieurs équilibres de Nash (situations de HU résolues à différent niveaux de blinds).

Ce qu’il faut comprendre avec les vrais solvers (qui cherchent un équilibre de Nash) c’est qu’ils ne résolvent pas le jeu NLHE dans son ensemble mais une situation donnée.

Ici on solve une situation PF avec un seul sizing possible.

Ce n’est pas parce qu’une autre stratégie non-exploitable existe dans une situation différente (avec d’autres sizings autrement dit dans un autre ‹ jeu › au sens de la solution) que celle-ci n’est pas un équilibre de Nash. Tu peux avoir des stratégies toujours optimales avec des choix de sizing qui dégagent plus d’EV que celle avec un seul choix de sizing.
C’est juste que celle avec un seul sizing sera plus facile à mettre en oeuvre pour un être humain.

En faisant abstraction de la simplification de la précision et de la synthèse des différentes tables suivants les profondeurs :

Il y a donc un (et un seul) équilibre de Nash en PoF HU (par profondeur de tapis effectif) à partir du moment où le seul sizing possible est All-in.

Il faut comprendre qu’un équilibre de Nash, c’est l’ensemble des stratégies des 2 (ou plus) joueurs et pas une stratégie isolée d’un des deux joueurs.

Le solver maximise l’EV du joueur 1 ET du joueur 2.

Les solveurs ne résolvent pas le jeu NLHE dans son ensemble (n’importe quelles ranges, n’importe quel sizing, n’importe quel tapis effectif, n’importe quel nombre de joueurs …). Juste une situation donnée avec un paramétrage (ranges et actions/sizings et souvent uniquement en HU). N’empêche, ils délivrent une solution GTO/Nash/à l’équilibre/optimale.

Justement Il y a une confusion dans l’article de pokernews sur ce point.

Certains outils comme Snowie, Pluribus … sont appelés abusivement ‹ solver › comme s’ils délivraient une solution GTO (un équilibre de Nash) alors que ce n’est pas le cas, même si par leur approche ils peuvent devenir imbattables par des être humains (et encore ça reste à prouver selon moi).

PIO, GTO+, Simple PostFlop … sont des vrais solvers en ce sens qu’ils délivrent une solution GTO (= un équilibre de Nash) et d’ailleurs ils délivrent la même à paramétrage équivalent (abstraction faite de la précision et de bugs éventuels d’implémentation).

Pour le lock node mode, tu changes les paramètres ‹ du jeu étudié › en empêchant le solver d’explorer certaines contre-mesures comme tu le fais lorsque tu choisis certains sizings ‹ autorisés ›.

Reformulons : il est contre productif de vouloir jouer optimal/GTO/à l’équilibre dans ce spot surtout à cette limite. Raise AQo ici est du value cut pour moi.

Le débat est intéressant mais je ne sais pas si l’on va pouvoir conclure : nous avons simplement une compréhension partiellement différente de ce qu’est la GTO. :slight_smile:

Au moins sur le point ci-dessous, nous sommes alignés :wink:

Oui d’accord je ne le savais pas, je ne joue pas en MTT, j’ai juste entendu que les tableaux de Jenifear étaient incorrects. Mais même si ce n’était pas une situation simplifiée ce ne serait toujours pas l’équilibre de Nash au sens où je l’ai décrit parce que le push or fold perd de l’EV dans tous les cas.

Oui, mais j’espère quand même que chaque joueur qui ouvre un solver en a conscience. Et c’est justement pour ça que je dis que le solver ne délivre pas l’équilibre de nash du spot. Parce qu’on est limités sur l’arbre et le nombre de sizings. On pourrait appeler ça une sorte de « sous » équilibre de Nash parce qu’on sait que l’arbre qu’on a configuré est limitant. Mais là c’est discuter sur des détails et une définition différente selon les sources, et personnellement je n’ai pas les compétences pour arbitrer quelle définition est la meilleure et surtout j’ai l’impression qu’on s’en fout royalement au final !!

Je n’ai pas encore assez exploré le sujet, si je ne dis pas de bêtises pluribus and co, snowie sont des neural networks plutôt que des solvers en effet.

Le principe de minimisation du regret ( et donc de maximisation de l’EV ) reste commun tout de même. entre solvers et neural networks.

De ce que j’ai lu en fonction des solvers/bots les modèles de calcul informatiques sont différents et plus ou moins efficaces/évolués, il y en a plusieurs comme par exemple :

  • CFR
  • CFR+
  • MCCFR
  • DCFR
  • ICFR

Oui tu as évidemment raison … ce n’est absolument pas ce que je voulais dire… auto-sabotage…

Oui si tu veux mais ça n’apporte rien de dire que ça ne sert à rien de jouer « à l’équilibre » si derrière on se trompe sur la manière de dévier. Et surtout si le solve raise une combo il faut clairement se demander si ce n’est pas pertinent de jouer comme lui plutôt que chercher une excuse pour ne pas jouer comme lui. Beaucoup de joueurs ont quand même tendance à ne pas vouloir implémenter des lines du solver pour de mauvaises raisons. Et l’histoire de « pas besoin d’être « équilibré » » ça me semble sur le podium des mauvaises raisons qu’on voit souvent invoquées.

Ici OOP est sensé call tous ses 55-JJ par exemple, ses 3x, ses SD, et quelques Ace high.et évidemment tous ses Qx. Même si c’est possible qu’il fold quelques unes de ces combinaisons faut bien comprendre que 55-88 vont souvent check/fold turn par exemple. Du coup on gagne de l’EV clairement à les faire payer au flop. Enfin c’est juste un exemple. Mais y’a pleins de bonnes raisons pour raise au flop contrairement à ce que beaucoup peuvent penser.

Il peut y avoir des erreurs dans les tableaux de jennifear (en tout cas moins que celles de joueurs qui l’utilisent en TF :wink: ) et je préfère celles de Kill Elky voire encore mieux d’un solver typer SimpleNash ou ICMIZER (mais c’est un autre débat) mais ça reste une solution de type équilibre de Nash.

Une main que tu solves à partir du postflop est une « situation » et le résultat (du paramétrage) est un équilibre de Nash.
OK on pourrait dire qu’il s’agit d’un équilibre de Nash de la main et qu’il en existe d’autres si l’on change certains paramétrages comme les sizings mais ça ne sera pas pour trouver une EV significativement meilleure puisque l’on a admis que :

Je me doutais bien que ça allait finir comme ça :slight_smile:

J’ai run le spot avec des ranges GTO , le paramétrage que je propose par défaut en pot 3bet OOP (sans retoucher l’arbre) et 1 seul sizing de Cbet à 1/3 (si c’est ce que tu as fais aussi).

Tu vois, on diverge complètement sur les fréquences.

Au vu de ta capture d’écran, tes ranges ne sont pas les bonnes comme te l’a fait remarqué @Stylzraf.
On pourrait déjà s’arrêter là parce que après, Villain n’est plus ‹ censé › faire quoique se soit s’il ne joue pas ses ranges PF à l’équilibre.
On pourrait aussi discuter du choix étrange de BB de raise en se laissant 13bb derrière.

Il y a 1 SPR, de façon réaliste, Villain doit broke : il faut ajuster l’arbre.

image.

Dans ta simulation, je ne sais pas si tu vois les pouillièmes de combos que ça représente les call de BB mais difficile de justifier qu’il faut raise AQo parce qu’il est censé call ces pouillièmes (basés en plus sur de mauvaises ranges de départ).
Le pourcentage de Cbet (10%) me paraît extrêmement bas pour être réaliste (même en théorie).
Bref je pense que ta simulation n’est pas pertinente théoriquement et de toute façon en pratique en NL10 Villain ne jouera jamais ainsi et que l’utilisation du solver ne permettra pas de démontrer qu’il est correct de raise AQo ici (même à supposer que l’on se mettre d’accord sur le paramétrage).

Rangons le solver et le débat théorique sur ce spot qui ne le mérite pas :wink:

Les ranges que j’ai plug ne sont pas GTO en effet. En revanche, il ne faut pas surestimer l’impact sur la solution postflop. C’est pas non plus des ranges complétement à l’ouest que j’ai plug, on est juste sur une légère simplification issue d’une masterclass plutôt bien côtée en français. La différence ce sera plutôt sur l’arbre… Il y a de gros débats sur les avantages et inconvénients de trop simplifier les arbres de décisions et jouer des stratégies mono-sizing. Personnellement je trouve que la simplification excessive des arbres de décision est clairement à éviter. Ici vu que t’as un seul sizing qui est small, forcément le range de BB est très dépolarisé et c’est donc plus difficile pour IP de raise. Vu que ma simulation comporte 2 sizings de cbet au flop, et que le small sizing est minoritaire cela explique le nombre plus faible de combos. Et cela explique aussi une stratégie de raise intensive vs small sizing puisque les combos avec beaucoup d’équité de BB sont bien plus présentes sur l’autre sizing de cbet.

D’ailleurs concernant mon arbre de décision, les 2 sizings ont été choisi suite à une simulation où j’avais indiqué 4 ou 5 sizings de cbet au flop. Suite à ça j’ai tout de même éliminé les sizings très faiblement utilisés.

Et oui y’a un léger artefact que j’ai vu sur le sizing de 3B… mais sincèrement je pourrais re-run la simu et perdre une tonne de temps pour rien… ça ne changera pas pour autant les fréquences de raise de BU. Clairement ce léger artefact n’est pas gênant.

Du coup … désolé mais tu te trompes lourdement.

OK mais donne les sizings que tu as saisi. Je n’ai pas cherché à simplifier, c’est juste qu’on ne peut pas deviner ton paramétrage sur la capture d’écran.

Donne aussi les autres paramètres parce qu’à mon avis, tu n’as pas les mêmes que moi.

image

Bien d’accord avec ça (d’où ma remarque sur sizing de reraise), ceci dit mis bout à bout, si on a trop d’écarts sur les paramétrages (ranges compris), on risque d’arriver à des conclusions complètement différentes.

C’est pas pareil de raise 20% sur 10% de Cbet que 22% sur 75% de Cbet alors je ne sais pas où je me trompe lourdement ni ce que dit la théorie en fréquence de raise sur ce spot.

Je suis d’accord qu’en théorie il a une range de raise (il y a quasiment toujours une range de raise :slight_smile: ) et peut-être que AQo est dans cette range ‹ en théorie › mais en pratique ici, je ne vois toujours pas l’intérêt de raise ce combo.

ça c’est ce qui est préconisé, mais ça demande un certain montant de RAM

ça c’est la version simplifiée, qui nécessite un peu moins de RAM

Relis les arguments que j’ai donné avec un autre paradigme : celui d’accepter les arguments contradictoires plutôt que d’essayer de les réfuter :wink:

PS : j’avais pas remis le « add all-in if push less than XXX% pot » au flop