La inteligencia artificial (IA de ahora en adelante) resulta un auténtico misterio incluso para algunos de sus creadores. Estamos muy lejos de que se cumplan algunas de las proféticas películas que nos condenaban a vivir bajo el yugo de las máquinas, pero están ocurriendo cosas realmente curiosas en los últimos tiempos.
Recientemente se ha creado un programa de IA al que han llamado Libratus (nombre en latín que puede traducirse al castellano como “equilibrado”). El programa, creado por el profesor de la Universidad Carnegie Mellon (Pittsburgh, Estados Unidos), Tuomas Sandholm, y su estudiante de doctorado, Noam Brown, ha aprendido a jugar solo al póker. Según sus propias declaraciones: “no hemos enseñado a Libratus a jugar al póker. Lo que hicimos fue facilitarle las reglas del póker y decirle: aprende por tu cuenta”. Para realizar esta hazaña contaron con Bridges, un superordenador que se encuentra en el Pittsburgh Supercomputing Center. Además, resulta importante destacar que el profesor Sandholm ha estado estudiando la teoría de juegos aplicada al póker durante los últimos doce años.
Cabe preguntarse por qué no le facilitaron a Libratus las reglas del ajedrez o de las damas, y es que el póker resulta un juego mucho más complejo y no se había probado ningún programa de IA previamente en este ámbito, mientras que con otros juegos sí se había hecho (Kaspárov frente a Deep Blue, jugando al ajedrez en 1997; Othello, ese mismo año; y Fan Hui frente a AlphaGo, jugando a Go en 2016).
Sin embargo, el principal motivo por el que se eligió el póker es que el ajedrez o las damas son juegos de “información perfecta”, mientras que el póker no lo es. Los jugadores no ven las cartas de sus rivales y no disponen de toda la información necesaria para tomar la más lógica de las decisiones. De esta forma, las posibles jugadas son muchas y dependen de un gran número de variables.
El Pokér es un juego más complejo que el ajedrez o las damas
Para probar la efectividad del aprendizaje autónomo de Libratus, enfrentaron al programa con cuatro jugadores profesionales de póker en el Casino Rivers de Pittsburgh. El torneo duró nada menos que veinte días y se llevaron a cabo sesiones de once horas diarias, alcanzando un total de 120.000 rondas de póker en la modalidad Texas Hold’em. Los cuatro jugadores libraron una batalla mano a mano con Libratus, en la que comenzaban con 20.000 dólares, en fichas virtuales, para realizar apuestas.
Entre los jugadores con los que compitió Libratus se encontraba el chino Jimmy Zhou, que se ha hecho especialmente famoso desde que ganó el Main Event del Asia Championship of Poker (ACOP), celebrado en Macao y perteneciente al célebre Asia Pacific Poker Tour (APPT).
Jimmy Zhou celebrando su victoria en APPT
Los otros tres contendientes también son jugadores de renombre con varios títulos en su palmarés: Jason Les, Daniel McAulay y Dong Kim.
En cualquier caso, cuando terminó la contienda, Libratus había ganado 1.700.000 dólares a sus contrincantes (de un total de 2.000.000 en juego). Los participantes se repartieron 200.000 dólares respondiendo a su clasificación en el torneo y a las fichas que habían conseguido. Los organizadores del torneo afirmaron, con un 99,7 % de certeza, que el resultado no se había debido al azar.
Lo más increíble es que nadie había enseñado a Libratus a tirarse un farol, también lo aprendió él mismo, como parte de las estrategias adquiridas durante su aprendizaje. El programa no sólo aprendió a farolear, sino que detectó faroles en sus contrincantes y actuó en consecuencia, dejando estupefactos a estos cuatro jugadores profesionales. De hecho, las casas de apuestas habían ofrecido un 4 a 1 a favor de los jugadores humanos, por lo que todos estos sucesos fueron una auténtica sorpresa para todos excepto, probablemente, Tuomas Sandholm y Noam Brown.
Ahora cabe preguntarse hasta dónde puede llegar Libratus y si éste es el comienzo de una nueva inteligencia artificial.