Sur le long terme… on est tous morts. Pourquoi vous n’avez pas envie de maximiser vos gains sur le long terme.

20 septembre 2017
petiteglise
4584
PA 17
11 Commentaires

La théorie du poker postule que chaque joueur cherche à gagner le plus d’argent possible sur le long terme. Et donc, que chaque joueur doit jouer le coup qui maximise son espérance de gain. Nous allons voir que c’est (souvent) faux.

Les limites de l’espérance de gain

Le but de toute théorie des jeux est de trouver quel est le comportement optimal d’un joueur en situation de pari. Pour cela, il faut d’abord savoir ce que veut le joueur. Certains d'entre vous pensent peut-être connaître la réponse : " avoir la plus grande espérance de gain".

L’espérance de gain d’une expérience est la limite de la moyenne des résultats, quand on répète cette expérience à l’infini. Notion développée au XVIIème siècle, l’espérance de gain a longtemps été perçue comme la recette miracle pour évaluer un pari ou un jeu. On calcule notre espérance, si elle est positive, on prend le pari, si elle est négative, on le refuse. Facile et évident. Sauf que…

Combien donneriez-vous d’argent, pour jouer un jeu à espérance infinie ?

En 1713, Nicolas Bernoulli posait le problème suivant : vous jouez à pile ou face contre une banque.
Vous payez une mise de départ et la banque l’encaisse.
Si pile apparaît au 1er lancer, vous gagnez 1€ et on arrête le jeu, sinon on relance la pièce.
Si pile apparaît au 2ème lancer, vous gagnez 2€ et on arrête le jeu, sinon on relance la pièce.
Si pile apparaît au 3ème lancer, vous gagnez 4€, etc…
Si pile apparaît au nième lancer, vous gagnez 2^(n-1)€
Pour jouer à ce jeu, quelle mise de départ maximale êtes vous prêt à payer ?

Si vous êtes à peu près comme tout le monde, ça devrait donner quelque chose comme :
2€ ? Yep, évidemment.
5€ ? Oui je joue.
10€ ? Pourquoi pas, ça dépend si je me sens d’humeur parieuse.
100€ ? Y’a pas de cas.
1000€ ? Tu m’as pris pour un pigeon ?!
1M€ ? LOL…

Maintenant calculons l’espérance du jeu : Vous avez ½ chance de gagner 1€ soit +0.5€ ; ¼ chance de gagner 2€ soit +0.5€ ; ⅛ chance de gagner 4€ soit 0.5€ etc… l’espérance du jeu est donc 0.5+0.5+0.5+... jusqu’à l’infini. Le jeu a donc une espérance infinie.
Autrement dit, peu importe la mise d’entrée, votre espérance est positive car infinie ! Alors faut-il accepter de payer n’importe quelle mise car notre espérance est infinie ou refuser les mises élevées car on a de grandes chances de les perdre et de finir ruiné ? C’est ce qu’on appelle le Paradoxe de Saint-Pétersbourg.

Faut-il ne jamais souscrire à aucune assurance ?

Le but d’un assureur (privé en tous cas) est de gagner de l’argent. Pour cela il vous propose un pari du genre : très souvent (il ne se passe rien), vous lui donnez une petite somme et de temps en temps (accident) il vous en donne une grosse. A priori, tous les assureurs qui sont encore sur le marché font bien leur boulot, sinon ils auraient déjà coulé. Donc les paris qu’ils proposent sont Ev- pour vous. Pour autant, est-il toujours absurde de souscrire à une assurance ? Ou plutôt, vu qu’on sait que la réponse à la question précédente est non : comment expliquer qu’il soit parfois raisonnable de souscrire à une assurance pourtant Ev- ?

Pourquoi les riches s’enrichissent toujours plus ?

Un pauvre monte sa start-up. Après un an, on évalue que l’entreprise a 50% de chance de couler et 50% de chance de finir par valoir 100 millions. A ce moment, un milliardaire lui propose de la racheter pour 10 millions et le pauvre accepte. Qui a commis une erreur : le pauvre, le milliardaire, les deux ou personne ?

A long terme, on est tous morts

La théorie selon laquelle on devrait toujours chercher à maximiser son espérance de gain à long terme souffre d’un énorme défaut : à long terme, on est tous morts. C’est en tous cas vrai pour la plupart des joueurs et dans la majorité des situations de paris. Si certains pros de poker jouent suffisamment pour pouvoir parler de “long terme” de leur vivant, la théorie de la maximisation de l’Ev ne peut s’appliquer dans la majorité des situations.

Reprenons l’exemple du milliardaire qui propose de racheter la start-up du pauvre. Le deal est évidemment Ev- pour le pauvre, mais la notion de long terme n’a pas lieu d’être ici car pour lui il s’agit sûrement d’un deal “once in a lifetime”. A l’inverse, quand on est milliardaire de telles opportunités se présentent régulièrement et la notion de long terme à un sens. Ainsi, les deux ont eu “raison” de dealer ainsi. C’est une des explications à pourquoi les riches s’enrichissent toujours plus : quand ils proposent un pari perdant à un pauvre, le pauvre a souvent “raison” d’accepter.

De même, celui qui peut jouer autant de fois qu’il veut au jeu de Saint-Pétersbourg accepte n’importe quelle mise initiale, quitte à s’endetter dans un premier temps. Mais si on ne peut y jouer qu’une seule fois, alors le long terme disparaît et il devient normal de refuser au delà d’un certain montant.

Utilité de l’argent

Pour expliquer le paradoxe de Saint-Pétersbourg Bernoulli a émis l’hypothèse que l’utilité de l’argent décrit une fonction de type logarithme. Ce qui a plusieurs implications :
L’utilité de l’argent croît de moins en vite. Ainsi gagner 1000€ quand on est riche est beaucoup moins utile que gagner 1000€ quand on est pauvre.
Des variations en % de bankroll ont la même utilité : gagner 100€ quand on en a 1 000 est aussi utile que gagner 1 000€ quand on en a 10 000.

Ce choix du logarithme est basé sur un aspect de la psychologie humaine : on finit toujours par s’habituer à notre condition, qui devient notre nouveau standard. Notre bonheur évolue ensuite en fonction des variations de ce standard.

L’aversion à la perte et au risque.

Quand vous offrez une petite cote à pile ou face, pour un montant non-négligeable de leur richesse, la plupart des gens refusent. Disons que vous proposez un pile ou face à 110€ / 100€ à quelqu’un qui a 1000€. Du point de vue de l’Ev le pari est évidemment gagnant, mais si on remplace les montants par leurs logarithmes, le pari devient perdant. Le refus est donc justifié d’après la théorie de l’utilité de l’argent.

Espérance d’utilité de l’argent

L’idée de procéder aux calculs d’espérance en ayant remplacé les montants par leur utilité (on parle alors d’espérance d’utilité ou Eu et non d’espérance de gain ou Ev) permet de prédire plus de comportements humains que la simple théorie de maximisation de l’Ev. Prenons un exemple :
un joueur a 200€ de bankroll et joue en NL100. Il songe à payer pour un flip à 100€, il se retrouvera soit à 100€ de bankroll, soit à 300, à 1 chance sur 2.
100* ½ + 300 * ½ = 200 donc d’après la théorie de la maximisatione de l’Ev, payer le flip a une espérance nulle.
Mais (log 100) * ½ + (log 300) * ½ < (log 200) d’après la théorie de la maximisation de l’Eu, payer le flip a une espérance négative.

Maintenant si un joueur a 100k de bankroll et joue aussi en NL100, confronté pareillement à un flip à 100€.
D’après la théorie de l’espérance de gain, payer a toujours une espérance nulle rien ne change.
Mais (log 100 100) / 2 + log (99 900) /2 ~= log (100 000) autrement dit, pour un joueur à 100k de BR, le pari devient nul (à environ 0.000001 près...).

C’est d’ailleurs assez proche de ce que l’on observe dans la réalité : un joueur qui joue trop cher sera scared money et refusera de prendre des risques, même quand son Ev est nulle voire positive, car son Eu sera elle négative. En revanche, un joueur suffisamment riche pour sa limite prendra tous les paris Ev+ car son Eu sera elle aussi positive.

La recette de la maximisation de l’Eu est efficace mais elle a ses limites. La première est qu’une fonction d’utilité de l’argent (logarithme ou autre) ne peut donner que des approximations. Il ne saurait exister une fonction d’utilité de l’argent universelle. Par exemple, certains riches sont bien plus sensibles à l’argent que certains pauvres. La deuxième limite est que on recherche pas tout le temps à maximiser son utilité d’argent, ni dans la vie ni même au poker. Certains (moines par exemple) préfèrent ne pas avoir d’argent qu’en avoir. A un WSOP, un joueur comme le néo retraité Luneau peut ne vouloir que le bracelet et s’en ficher des autres prix. Ou alors deux joueurs peuvent tricher en jouant en collusion (et donc plus maximiser chacun leur Ev ou Eu, mais leur Ev ou Eu globale).

Tout ceci pose la question de savoir si on pourrait créer une théorie de l’utilité non uniquement de l’argent, mais qui prenne en compte toutes nos préférences. C'est ce que nous verrons dans un prochain article, mếlant maths, psycho et poker.