On vous a menti : le poker n’est pas un jeu à somme nulle.

On vous a menti : le poker n’est pas un jeu à somme nulle.

Suite de l'article “Sur le long terme… on est tous morts. Pourquoi vous n’avez pas envie de maximiser vos gains sur le long terme.” Au menu : fonction d'utilité, paradoxe d'Allais et la vérité sur le poker comme jeu à somme nulle. 


Définition d’une fonction d’utilité

Une fonction d’utilité est une quantification des préférences d’un individu pour certains objets. A chaque objet est associé un certains nombre “d’utiles”, unités de l’utilité. Un objet peut désigner… un objet (!), une somme d’argent ou une loterie.

Imaginons un MTT à 5 prix
1er prix : package tournoi + hôtel à 1500€
2ème prix : un iPhone X
3ème prix : un ticket à 500€
4ème prix : 200€ en cash
5ème prix : 100€ en cash

Un individu peut par exemple attribuer les utilités suivantes aux prix :
100€ en cash -> 100 u
200€ en cash -> 195 u (on n’est pas forcément deux fois plus content quand on gagne deux fois plus d’argent)
ticket à 500 -> 400 u
iPhone X : 900 u
package à 1500 : 1000 u

L’utilité d’une loterie est simplement son espérance d’utilité. Par exemple : la loterie (50% de gagner l’IPhone ; 50% de gagner le package) vaut 950u.

Toutes ces utilités sont personnelles : une autre personne pourrait très bien préférer gagner l’iPhone (pour le revendre) que le package. En HU on pourrait donc voir s’affronter un joueur souhaitant terminer 1er et l’autre 2ème (ils devraient pouvoir s’arranger). On pourrait aussi imaginer le cas de deux joueurs voulant tous deux finir 2ème (une sorte de qui perd gagne).


Le poker est-il vraiment un jeu à somme nulle ?

Dans un jeu à somme nulle, par définition, ce que gagne un joueur l’autre le perd. Au poker sans rake, c’est évidemment vrai si l’on parle en montant d’argent.

NB : Dans un MTT à 1000€ sans rake, avant la première main, chaque joueur a une espérance de 1000€ (en moyenne en tous cas). Imaginons qu’à la toute première main, un joueur en élimine un autre. L’espérance de l’éliminé est donc nulle, tandis que celle de l’éliminateur n’a pas doublé (ce n’est que son stack qui a doublé). Cela ne remet pas en cause le fait que le poker soit un jeu à somme nulle si l’on parle de montant d’argent. La différence vient du fait que l’espérance de tous les autres joueurs, même ceux qui n’ont pas pris part au coup, a augmenté.

En revanche, si l’on parle d’utilité (qui est donc personnelle), le poker n’est plus forcément un jeu à somme nulle.
On a déjà vu un cas, certes alambiqué, où un joueur est content de gagner des jetons et l’autre en perdre.
Dans une table finale, on peut imaginer un deal qui fasse gagner de l’utilité à tout le monde, comparé à jouer sans deal.
Dans un HU en CG, si un joueur scared money perd de l’argent face à un reg, il perd bien plus d’utilité que le reg n’en a gagné, le coup aura donc été à somme négative.
A l’inverse, à chaque fois qu’un pauvre déstacke un riche, de l’utilité se crée.
A l’échelle d’un tournoi comme le main Event des WSOP, un scénario horrible en terme d’utilité serait que : Tous les plus pauvres se font éliminés avant les prix, ils sont tous très dégoûtés car ils ont perdu des grosses sommes (pour eux). Les plus riches gagnent les plus petits prix. Ils sont donc à peine content alors que d’autres à leurs places auraient été très satisfaits. Les plus pauvres parmi les primés gagnent les plus grands prix, ils sont donc très contents mais l’auraient été presque autant avec des prix moindres. Un autre scénario aurait distribué autant d’argent mais plus “d’utiles”.


Intérêt et limite des fonctions d’utilité.

La théorie traditionnelle du poker nous dit qu’il faut jouer le coup le plus Ev+, en argent si l’on joue en CG, en ICM si l’on joue en tournoi. Comme nous l’avons vu, il est en fait meilleur de jouer le coup le plus Eu+, c’est à dire le coup qui donne la meilleure espérance d’utilité. Mais pour calculer cette espérance d’utilité, il faut d’abord connaître l’utilité de toutes les issues possible. Par exemple, si j’envisage de payer, il me faut connaître l’utilité de mon stack si je passe, l’utilité de mon stack si je paie et perd, l’utilité de mon stack si je paie et gagne, et bien sûr la proba que je gagne. En outre, il est impossible de connaître parfaitement les utilités adverses car elles sont personnelles.

En temps réel, il n’y a donc quasiment aucun intérêt pratique aux fonctions d’utilités. Evidemment, il est tout de même conseillé de se rappeler qu’un joueur scared money va limiter ses risques, tandis qu’un joueur très riche pourrait en prendre trop.

Là où le bât blesse, c’est que les fonctions d'utilité ont d’autres biais plus fondamentaux. Tout d’abord, nos préférences sont changeantes (on peut préférer un verre de whisky à un verre d’eau le soir et l’inverse au réveil). Ainsi une fonction d’utilité peut être valable au mieux uniquement de manière ponctuelle. Plus grave, les axiomes de la théorie de l’utilité ne sont pas toujours observés dans les comportements humains. Ainsi, dans une fonction d’utilité les préférences sont transitives : préférer A à B et B à C implique préférer A à C. Dans la vraie vie, même si ça semble irrationnel, on constate que ce n’est pas toujours le cas. Un autre cas de non respect des axiomes est montré par le paradoxe d’Allais.


Le paradoxe d’Allais, version poker.

Préférez-vous ?
A. gagner 1 million €
B. avoir 90% de chance de gagner 1.5 million €

SI vous êtes comme la plupart des gens, vous préférez A et on a vu tout au long des deux articles que c’était normal, même si l’espérance de gain de B est plus grande. Très bien, mais :

Préférez-vous ?
C. avoir 10% de chance de gagner 1 million €
D. avoir 9% de chance de gagner 1.5 million €

Si vous êtes comme la plupart des gens, vous préférez D à C car il n’y a pas trop d’écart entre 9 et 10% alors qu’on joue pour 500k supplémentaires. En fait c’est paradoxal et en désaccord avec la théorie de l’utilité. Pour le comprendre, posez vous la question suivante : on vous propose un heads-up dans lequel vous commencez avec 10% des jetons (on considère donc que vous avez 10% de chance de gagner). Si vous perdez le HU, vous ne gagnez rien. Si vous le remportez, préférez-vous :
A. gagner 1 million €
B. avoir 90% de chances de gagner 1.5 million €
Vous avez déjà répondu à la question, vous préférez A à B… mais à bien y réfléchir, avoir 10% de chance gagner A, ça équivaut à C (avoir 10% de chance de gagner 1 million €) et avoir 10% de chance de gagner B ça équivaut à D… (avoir 9% de chances de gagner 1.5 million €)
On comprend pourquoi la théorie de l’utilité nous dit qu’on ne peut pas préférer A à B et préférer D à C. Pourtant c’est ce que l’on observe. D’où le paradoxe, qui porte le nom de celui qui l’a découvert, le prix Nobel d'Économie français Maurice Allais.

En parlant de nobélisé, la théorie de l’utilité, à cause de ses défauts susmentionnés, a été peu à peu délaissée au profit de la théorie des perspectives qui a apporté à son auteur Daniel Kahneman le nobel d’Economie 2002. Nous en parlerons dans un futur article.