Pour l’occasion je vais tout d’abord me présenter: je joue au poker, occasionnellement depuis un an, sous le pseudo everbroken sur les sites PokerStars et Titan. Je joue pour le plaisir en micro limit SNG.
Je suis ingénieur avec spécialité en statistiques. je travaille sur les modélisations attentes clients et évalue des modèles mathématiques visant à prédire l’acceptation de produits par les clients avant la sortie d’un produit. Ces modèles permettant de définir aussi un profil idéal en fonction de variables d’entrées.
Et voilà, je voudrais mettre cela en action avec des données de poker.
Il s’agirait donc de modéliser les résultats (gains ou pertes) de joueurs en fonction de variables d’entrée (VPIP, PFR, agrssion factor, steal de blinds, CB etc.).
Si certains d’entre vous sont intéressés, l’idéal serait de rassembler une base de données de joueurs (gagants mais aussi perdants (sans quoi l’étude serait obsolète)) sur différentes limites en SNG et cash game.
Si les données sont assez conséquentes, un “profil idéal” devrait pouvoir être établi.
A vous devoir, donc, et à vous de m’orienter pour le choix des variables d’entrées les plus pertinentes.
Ci-joitn un exemple de modélisation (la modélisation est là un modèle vectoriel et non circulaire (qui lui serait ideal pour le poker). Plus, un individu est dans le vert meilleure est son évaluation. Les flèches représentent les variables d’entrée (par ex ce sera l’agression factor. Si le vecteur variable d’entrée est dans le sens de la variable de sortie (le résultat, représenté par le dégradé du rouge au vert) alors il favorise la qualité. Imaginons un vecteur en sens opposé qui tend vers la zone rouge, alors il sera anti corrélé au bon résultat.
Evidemment, je ne peux garantir le succès de mise en oeuvre du modèle. Enfin, c’est à voir.
Bon j’ignore si j’ai été clair mais si vous interessés, faites moi le savoir.
Ca peut être interessant. Est-ce que ce genre d’étude n’ont pas déjà été fait?
Sous quelle forme tu voudrais les données? HH, Db HM ou PT3, autre?
Un problème que je vois c’est que les gens n’aiment pas trop donner leur données genre HH de peur d’être eux mêmes profilés.
Eventuellement il est possible de fournir une petite appli pour remplacer le nom des joueurs par des pseudos dans les fichiers HH.
Sincèrement, je ne pense pas que cela ait été fait, en tout cas pas à ma connaissance. Ce sont des méthodes usuelles industrielles. En poker, quand on parle statistiques, on parle plutôt de probabilités.
Et pour les noms, bien sûr, un faux pseudo suffirait. On peut même les nommer J1, J2, J3 etc. Cela n’a aucune importance te c’est même préférable.
Le meix serait un fichier excel. Si plusieurs joueurs sont intéressés (il faut tout de même beaucoup de profils), je pourrai en mettre un à disposition.
La méthode ici utilisée est le Preference Mapping. On pourrait aussi utiliser des modélisations type Partial Least Squares selon les types de données
Je trouve l’approche plutôt intéressante. Par contre on sait aujourd’hui qu’il n’existe pas qu’un seul style gagnant. TAG et LAG sont deux styles gagnants à condition d’être bien maitrisés. Est-ce que ton approche permettrai de prendre en copte ou de mettre en évidence cela?
C’est justement ce que je voudrais voir. Et démontre par les chiffres :).
On aurait sans doute, en effet, et cela serait intéressant de le montrer, que les modèles en micro ou high stakes sont très différents.
De même en SNG vs. CG.
A voir donc.
Je commence la liste des variables:
VPIP
PFR
Steal
3bet
4bet
mais la grand difficulté dans ton étude est le nb de variable, je m’explique:
en SH je suis 20/18
en 9 joueur je suis 15/12
en 18 joueur je sius 17/13
blablabla…
je pense que par simplicité, le mieux est de prendre 6 joueurs en CG et 9 o0 joueurs en SNG. Mais on peut aussi étudier toutes les possibilités.
Moi ce qui me fait peur, et je viens d’y penser, c’est l’indépendance entre les variables. Elles doivent l’être et là hélas elles ne le sont pas. il faut que je réfléchisse à une méthode appropriée…