Libratus, la supercomputadora de póker que da un gran paso hacia la Inteligencia Artificial


Para ser grande en el póker debes saber cuando foldear, cuando pagar, cuando subir o cuando ir allin entre tantos otras acciones relativas al juego mismo.
Eso es sólo parte de la técnica de un nuevo sistema de IA creado por los investigadores de Carnegie Mellon utilizado para vencer a cuatro de los “mejores jugadores de póker profesional del mundo” – Dong Kim, Jimmy Chou, Daniel McAulay y Jason Les. El IA jugó a los humanos durante 20 días 120.000 manos de Heads-up No-Limit Texas Hold’em en vivo en un piso de casino en Pittsburgh.
La IA, llamado Libratus, profitó $1,766,250 en fichas al final del experimento cuando finalmente venció a los cuatro profesionales en una competencia en Rivers Casino. Los jugadores jugaron casi constantemente, cambiando de estrategia después de cada día de juego.
La IA no sabía originalmente cómo jugar al poker. En cambio, los investigadores le dijeron que probara cosas al azar hasta que, después de billones de manos, aprendió una estrategia ganadora. Los humanos jugaron contra la IA durante 11 horas al día, terminando a las 22:00 horas cada noche, durante veinte días.
“La mejor capacidad de IA para hacer un razonamiento estratégico con información imperfecta ahora supera a la de los mejores seres humanos”, dijo Tuomas Sandholm, profesor de informática y co-creador de la IA.
La IA no ganó dinero, pero los humanos dividieron un pot de $200,000 basado en su desempeño. Después de todo, la computadora solo necesitaba computadoras eléctricas y 600 notas de cálculo en el supercomputador de nodos Bridges 846 del Centro de Supercomputación de Pittsburgh, donde funcionaba a través de manos en 1,35 petaflops. McAulay, uno de los jugadores humanos, dijo que “Libratus era un oponente más duro de lo que esperaba”.
“Cada vez que juegas con un jugador superior en el póker, aprendes de él”, dijo.
Los seres humanos trabajaron juntos para averiguar las debilidades de la IA, incluso cuando la IA aprendió sobre sus propias fallas – y cómo bluff.
“La computadora no puede ganar en el póker si no puede hacer bluff”, dijo Frank Pfenning, jefe del Departamento de Ciencias de la Computación de CMU. “El desarrollo de una IA que puede hacer eso con éxito es un tremendo paso adelante científicamente y tiene numerosas aplicaciones. Imagine que su smartphone algún día será capaz de negociar el mejor precio en un coche nuevo para usted. Eso es solo el comienzo.

Él ve la IA como un paso adelante y puede ser utilizado en “cualquier ámbito en el que la información es incompleta y los oponentes siembran la desinformación”.
La IA también “fijó” su estrategia diariamente, evaluando donde falló en la competición del día anterior.
“Después del juego terminado cada día, un meta-algoritmo analizó qué leaks los profesionales habían identificado y explotado en la estrategia de Libratus”, dijo Sandholm.
“A continuación, priorizó los leaks y parche algorítmico de los tres primeros utilizando el superordenador cada noche. Esto es muy diferente de cómo el aprendizaje se ha utilizado en el pasado en el póker. Normalmente los investigadores desarrollan algoritmos que tratan de explotar las debilidades del oponente. En cambio, aquí la mejora diaria es sobre la fijación algorítmica de leaks en nuestra propia estrategia. ”
La investigación que llevó a Libratus se puede utilizar para ampliar la investigación en negociaciones automatizadas e incluso complejos problemas biológicos y de ingeniería. Al final, la IA fue entrenada para resolver un problema complejo lleno de información incompleta, no simplemente el de cuatro jugadores de póker profesional.
“CMU jugó un papel fundamental en el desarrollo de computadoras de ajedrez” dijo Pfenning. “Ha sido muy emocionante ver el progreso de los programas de poker que finalmente han superado a los mejores jugadores humanos. Cada uno de estos logros representa un hito importante en nuestra comprensión de la inteligencia “.
Saludos Cordiales,
Staff CHILEALLIN.com

Articulos Relacionados