Equipo Poker En Venezuela
lunes, 27 de junio de 2011
GTO (Game Theory Optimal) vs. Explotabilidad (o juego explotable). O también, (no)polarizar? by Samy4ever
Hola a todos, este artículo lo extraje del Blog del fenómeno español Samuel Jiménez, entrenador de la comunidad hispana de es.pokerstrategy.com y más recientemente campeón del PokerProMaster PPM de Bwin.com… De lo aprendido en el poker mucho se lo debo a sus artículos y videos y en esta ocasión quiero compartir con ustedes un post escrito por el en su blog theultimatemind.com que me pareció súper interesante y estoy seguro que les va a gustar mucho y les hará de mucho provecho…sin más preámbulos aquí les dejo el artículo :
By Samuel Jimenez (Samy4ever)
“¡Lo prometido es deuda! Hace unos días os dije que haría una entrada hablando sobre qué tipo de juego es mejor entre GTO y explotable. Lo que viene a partir de ahora es una apreciación personal y posiblemente leáis en otros sitios que lo que digo puede no ser cierto. Yo expongo los datos, mis argumentos y reflexiones. Después, que cada uno juzgue por si mismo y decida a quién le da la razón.
Personalmente y antes de empezar, comentar que me encanta todo lo relacionado con GTO y ojalá pudiera profundizar al máximo en este aspecto (ya fuera estudiándolo en la universidad o aplicándola de algún modo en una empresa). Me fascina mucho ya que me parece superinteresante poder llegar a ciertas conclusiones analizando variables del entorno.
Ahora si, después de soltaros mi rollo personal, vamos al grano:
Primeramente deberíamos de definir los dos conceptos antes de poder compararlos. GTO son las siglas de teoría de juegos óptima (Game Theory Optimal en inglés) y es una rama de las matemáticas que trata de decidir la mejor estrategia en aquellas situaciones en las que el éxito (success) propio depende de una decisión en la cual no participamos (factores o agentes externos)*1. Se puede aplicar a muchísimos campos además del matemático: negocios, poker (juegos), biología…
En cuanto a juego explotable, me refiero a una aplicación de la teoría de juegos en la que tenemos una estrategia que contiene errores que son explotables por nuestro rival. Pero pensamos que, aún y así, es la mejor, y por eso la aplicamos.
Parece que carece de sentido decir que una estrategia con errores es mejor que una basada en la optimización de todas las estrategias posibles. Sin embargo, llevado a la práctica en el poker, es así. Hago especial hincapié en que estoy hablando sobre texas Holdem únicamente ya que desconozco si en el resto de campos es así. Pero si en un caso es posible, no veo por qué en otro no.
Seguimos. Este descubrimiento (por llamarlo de algún modo), ha sido fundado en la reflexión que he hecho sobre mi juego durante los últimos 6 meses a raíz del down. El caso es que yo tenía un juego X hace 12 meses, siendo este 99,9% gracias a los contenidos de PokerStrategy (especialmente el foro). Entonces empecé a leer más material y a profundizar en algunos temas absorbiendo lo que venía de toda la red en general. Y uno de los problemas que aparecieron, motivo por el cual mi juego empeoró (y hablo desde un tiempo antes del superdown!) fue la aplicación incorrecta de algunos contenidos que había leído (especialmente motivado por comentarios al respecto de algunos jugadores que también se equivocan que aplicaban GTO sistemáticamente).
Ahora mismo debéis estar pensando algo del estilo Samy, me parece muy bien que digas que un juego explotable es mejor, pero por qué? Mucho hablar y nada de datos concretos! Muy bien. Ahí voy. La base de mi afirmación es el hecho de que GTO asume que tus rivales juegan perfecto contra nosotros… Cosa que es totalmente falsa. Ni en NL10, donde hay mucho fish, ni en NL400 que aparecen los primeros supergrinders. Ni siquiera en NL5K+, donde están los mejores jugadores del mundo. Y por qué, si son los mejores del mundo, no juegan con la mejor estrategia de todas? La respuesta es sencilla: no es lo mismo jugar jugar 100% óptimo que maximizar el valor esperado (EV). Podemos tener el mejor juego del mundo y no ser explotables contra el mejor rival. Pero, al no jugar nunca contra él, carece totalmente de sentido adoptar esa estrategia ya que maximizaremos el EV cuando explotemos las debilidades de la estrategia de nuestro oponente, y no cuando estemos jugando contra lo que (en teoría y lo descubierto hasta ahora) es mejor.
Ejemplo 1:
Subir el 100% en SB es muy explotable ya que BB, la cuál ya ha puesto una ciega en el bote, tiene muy buenas odds para igual/resubir tanto preflop como postflop de manera rentable. Además, al ser el bote muy pequeño, el SPR es muy grande y la posición cobra muchísima más importancia*3, y BB está IP, por supuesto. Sin embargo, si estamos jugando en NL100 FR, veremos que la mayoría de rivales tienen unos folds vs. steal en ese spot del 80%+ y lo que nos dará una recompensa mayor será subir todas las manos en SB.
Son cálculos fáciles:
MinSuccess(lo pongo directamente en %) = Risk / Reward (esto deberíais de grabarlo a fuego)
Vamos a poner que abrimos a sólo 2bbs (caso 1), a 2,35bbs (caso 2), a 2,5bbs (caso 3) y a 3bbs (caso 4).
Caso 1) MinSuccess = 1,5 / 1,5 + 1,5 = 50%
Caso 2) MinSuccess = 1,85 / 1,85 + 1,5 = 55%
Caso 3) MinSuccess = 2 / 2 + 1,5 = 57%
Caso 4) MinSuccess = 2,5 / 2,5 + 1,5 = 62.5%
Podríamos abrir el 100% de SB y jugar check/fold todos los flops y sería EV+, ya que el fold de los rivales es superior al mínimo necesario para obtener rentabilidad: [50, 62,5] < 80% average.
Espero que con este ejemplo se vea qué quiero decir. Resumiendo: GTO establece que subir el 100% en SB vs. un buen rival es un error ya que va a explotar nuestro rango al ser demasiado amplio para defenderlo teniendo un SPR grande y fuera de posición. Sin embargo, contra casi todos los rivales regulares de FR en NL100, va a tener un valor esperado superior subir todas las manos en ese spot y jugar check/fold siempre que simplemente foldear y abrir un rango más cerrado.
Eso es sólo un ejemplo y el más básico. Pero cobra mucha importancia en cuanto a decidir con qué manos 3betear, cuando pagar y cuando no…
Ejemplo 2:
El rival tiene un Open Raise muy grande en SB. Su fold3bet es del 75% y su 4bet es del 20%. GTO dice que deberíamos de 3betear siempre nuestro Top Range (no voy a poner las justificaciones, por ahora se ha estudiado y afirmado que contra el mejor rival del mundo no deberíamos de polarizar*4, y por eso hay que 3betear el top range). En cambio, en esa situación será mucho mejor 3betear las manos con las que vamos a ir allin y probablemente muchas manos trash y sin ningún tipo de jugabilidad. ¿Por qué? No tiene mucho misterio. Analizando la estrategia del rival podemos observar que no vamos a ver ningún flop porque su call al 3bet es de sólo el 5% de las veces, o lo que es lo mismo, sólo paga el 3bet 1 de cada 20 ocasiones. Consecuentemente, haciendo una aproximación a ojímetro (es decir, obviando este pequeño porcentaje desviatório), una mano como KJs no podrá ir allin preflop. Sin embargo, un call dado que su rango es amplio y tenemos posición, tendrá un valor esperado positivo. El 3bet, por supuesto que también, ya que el rival se está tirando demasiadas veces a una resubida. Pero como no vamos a ver flops ni a pushearla preflop, el valor esperado de 3betear KJs es prácticamente el mismo que el de 3betear con K5o (con la única diferencia de la J que bloquearía un posible 4bet/call de JJ). Y además, KJs en esa situación tiene un EV mayor en caso de pagar.
De nuevo, en este caso, GTO establece que deberíamos de resubir con esa mano, pero dada la estrategia del rival, es mucho mejor pagar preflop, y 3betear con todas las manos que no tengan un EV mayor que haciendo call, ya que cualquier par de cartas debería de ser suficiente para hacer un 3bet de forma rentable. Os habéis dado cuenta de lo que podemos sacar de aquí? Os habéis fijado en el fold3bet en SB cuando el rival hace OR? Quién lo explota con un 3bet de 25 (yo no lo hago y debería)?
Básicamente, hay muchísimas situaciones en las que nos deberíamos olvidar de los tópicos y razonar cuál es la mejor opción de todas. Cosas como estás foldeando tu top range si no haces call aquí, no polarices tanto tus 3bets/4bets etc són totalmente estúpidas en la inmensa mayoría de los casos en la que la estrategia de nuestro oponente dista mucho de ser la mejor. Sin embargo, como sabemos que eso no se debe hacer, no lo hacemos, cuando en esa situación eso puede ser un error dependiendo del rival al que nos enfrentemos.
Por culpa de haber malinterpretado toda esta información (en algunos foros de Internet las opiniones son muy radicales y no hay espacio para mucho más, de manera que condiciona bastante el pensamiento de uno las primeras veces que lees esos threads), cambiaron algunas cosas de mi juego a peor y eso hizo que perdiera valor en muchas ocasiones. No caigáis en el mismo error. Vais a ganar más si explotáis a los rivales que si hacéis el juego más perfecto del mundo en una base matemática perfecta.
Supongo que se pueden apreciar muchas similitudes con el equilibrio de Nash. Asume que nuestro rival juega la mejor estrategia y intentamos jugar contra ella, pero si lo conocemos, podemos desviarnos del juego más óptimo para hacer una estrategia con errores pero que nos dará mejores resultado. De ahí que el juego explotable sea mejor que el que está basado en GTO. Por otra parte,
Después de todo esto, pensar en algo: al principio del juego hemos dicho que GTO se basaba en encontrar la mejor estrategia cuando el desarrollo del juego venía afectado por variables externas. Hemos dicho que no podíamos tener un OR de 100% en la SB, pero que a la práctica era la mejor opción. Adoptar esa estrategia no es otra cosa que readaptar GTO a la estrategia más óptima de todas. De manera que podemos decir que tenemos la GTO teórica y la GTO práctica (sería la última descrita, la adaptación a los rivales existentes). Sin embargo, si los rivales son competentes se adaptarían a nuestra nueva estrategia y… Volveríamos a empezar. He caído en un bucle, help me !
Y hasta aquí llega mi reflexión. Intentar maximizar el EV de una mano jugando contra un rival y no contra una teoría.
*1: A aquellos que son matemáticos: perdonar por una definición tan superficial, pero creo que de esta manera se entiende mejor.
*2: es increíble la diferencia creada en pocos meses a partir de pocas lecturas que hacía. Lástima aplicarlo mal en ese momento! Por suerte, al entrenar con otros jugadores en los últimos tiempos, me han recordado el motivo por el que era bueno polarizar, tener leaks etc.
*3: si el SPR de un spot es muy pequeño, la posición apenas importa ya que el árbol de decisiones a tomar es muy corto y los datos muy claros. Como más grande sea el SPR, más decisiones implícitas existen y, consecuentemente, más importante será tener posición. En el primer caso, con un SPR de 1, la posición es totalmente anecdótica si estamos en el flop, ya que al quedar 3 calles para hablar, las decisiones sólo tienen un nivel de profundidad.
*4: para los que no sepáis qué es polarizar, consiste en extremar nuestro rango de juego en ciertos spots en lugar de hacerlo con el teóricamente correcto. Un ejemplo práctico: 3betear JJ+/AQ+ y con trash total (K5s, Q8o…) es polarizar nuestros rangos. Cuando nuestro 3bet es de AT+, KJ+ y TT+, estamos 3beteando las mejores manos de la baraja y nuestro rango polarizado es 0.
Por cierto, he actualizado el post Para los posteadores de PokerStrategy. Me calenté con algún post en el foro de PS y pensé que sería bueno poner a la vista lo sobrevalorados que están los stats, aunque apenas lo hiciera por encima. Seguro que algunos lo encontrareis interesantes y otros, un buen recordatorio.
Si has leído hasta aquí e incluso has prestado atención a lo que he dicho, felicidades! Te has ganado un pin, todo un mérito!”
Suscribirse a:
Enviar comentarios (Atom)
No hay comentarios:
Publicar un comentario