Domingo, 3 de julio de 2016 | Hoy
SOCIEDAD › LA HISTORIA DEL TRIUNFO DE UNA COMPUTADORA EN EL JUEGO MAS COMPLICADO DEL MUNDO
Por Adrián Paenza
La historia que quiero contar acá es verdaderamente fascinante. Hace menos de tres meses, en marzo de este año, pasó algo que no fue tapa de los diarios y no solo en nuestro país sino en virtualmente ningún lugar del mundo occidental. Es que lo que sucede en una buena parte del Este asiático nos queda tan lejano no solo geográficamente sino en términos culturales, que es como si lo ignoráramos. Peor aún: no es “como” si lo ignoráramos sino que lo ignoramos, lisa y llanamente. Es por eso que le propongo que lea la historia que sigue como una forma de introducirse en el tema y eventualmente, bucear usted, por su propia cuenta para decidir hasta donde quiere estar informada/o. Yo solamente voy a ser un mero intermediario, alguien que le va a contar una historia que no es ficción, sino real. Acá voy.
Seúl, capital de Corea del Sur. En el hotel Four Seasons, entre el 9 y 15 de marzo, se jugaron cinco partidas de GO. ¿De qué? (estoy casi seguro que está pensando usted). De GO. ¿Qué es GO?
El ‘Go’, se juega hace más de 2500 años. La leyenda indica que fue inventado por el mítico primer emperador chino con el objetivo de educar e instruir a su hijo. Se juega sobre un tablero, como el que se usa para jugar al ajedrez o las damas, solo que en lugar de que haya 64 casillas (un tablero de 8 x 8), al GO se juega en un tablero de 361 casillas, de 19 filas por 19 columnas. Es uno de los juegos más populares en China, India, Japón, ambas Coreas, Indonesia, Pakistán... lugares que nos quedan muy lejos.
Se juega también con fichas blancas y negras, que los dos participantes se turnan en ubicar en las intersecciones de la grilla y no en las casillas como sucede en el ajedrez o las damas. Las piezas (que son todas iguales salvo en el color, como en las damas), una vez que son ubicadas no se mueven más. El objetivo es tratar de rodear las del rival. Una vez que se logra ese objetivo, se consideran capturadas y se sacan del tablero. De esta forma, se generan batallas entre los armadas Blancas y Negras que se disputan en distintas partes del tablero, y que se suelen propagar desde las cuatro esquinas hacia el centro.
Parece un juego ingenuo y sus reglas tan sencillas así lo sugieren. Sin embargo, es muchísimo más difícil que el ajedrez, por poner un ejemplo fácilmente comprensible para nosotros aunque más no sea porque la cantidad de posiciones que pueden suceder durante una partida (1).
Pero... ¿qué fue lo que pasó? El hombre ha intentado siempre diseñar programas que pudieran jugar no solo al GO, sino también al ajedrez o a las damas, o al ta-te-tí. Las damas sucumbieron en el año 1994, pero el ajedrez ofreció un poco más de resistencia. En el año 1996, Garry Kasparov (el campeón mundial indiscutido en ese momento) jugó seis partidas contra Deep Blue, un programa producido por ingenieros de IBM. Kasparov ganó tres partidas, empataron dos y perdió una. Pero al año siguiente, en la revancha, todo cambió... y para siempre. No sólo perdió 3 ½ a 2 ½ sino que Kasparov advirtió como muy pocos que no solo esa batalla estaba perdida, sino que el hombre ya no podría nunca más contra las máquinas. Y así fue. Ningún hombre hoy, gran maestro o aficionado, puede jugar contra un programa con esperanzas de ganar en forma consistente, aún enfrentándose a programas que no requieren de tanta sofisticación. Las computadoras usan su velocidad para revisar sus bases de datos sobre millones de partidas jugadas y su capacidad de memoria para analizar potenciales movidas y evaluar cuál de ellas es la que tiene mayor probabilidad de ganar. A un humano eso le llevaría cientos de miles de siglos. Listo. Asunto concluido. Juguemos entre nosotros porque contra ellas ya no vamos a poder.
Sin embargo, a los humanos nos quedaba una posibilidad más, una vida más: ¡el GO! El GO presenta un grado de complejidad tan grande, que los analistas del momento sospechaban que estábamos todavía a un siglo –sí, un siglo (2)– antes de poder afrontar con posibilidades un enfrentamiento entre máquina vs hombre.
Y aquí es donde entra en escena Demis Hassabis. Hassabis es un joven inglés, que nació y vive en Londres y que está a punto de cumplir 40 años. Es neurocientífico, investigador en inteligencia artificial, programador de video juegos y además, un muy buen ajedrecista. El GO se transformó en una suerte de obsesión, no por el juego en sí mismo, sino porque siendo un apasionado por producir avances en inteligencia artificial, tomó al GO como un desafío personal. Era algo así como el “nuevo mundo a conquistar”, el nuevo Everest por dominar.
En el año 2010, juntó a varios de los más importantes científicos del área y cofundó una empresa que llamó Deep Mind (3), y con la compañía, apareció AlphaGo, un programa especialmente diseñado para jugar al GO. Pero Hassabis y su equipo supieron desde el principio que lo que había hecho Deep Blue con Kasparov no sería el camino a seguir. Por más fuerza bruta que se usara, capacidad de memoria, almacenamiento de enormes bases de datos, rapidez de búsqueda, etc.. eso no sería suficiente. Sería necesario buscar por otro lado, crear un programa que.... ¡aprendiera! Sí, una computadora que pudiera aprender ella sola, como si sacara conclusiones a medida que va incorporando nuevas experiencias. Si me permite, es como decir que se parece más a un comportamiento humano. Pero hay más.
Enterados de lo que estaba sucediendo con Deep Mind y los progresos que producían con su programa, aparecieron dos personas que se interesaron... y mucho: Larry Page y Sergey Brin. Por las dudas, son ambos los creadores y fundadores de Google. Viajaron a Londres en el año 2014 y le hicieron una oferta a Hassabis y su grupo: le comprarían la compañía con ellos adentro, haciéndolos socios y por esa sociedad los compensarían con 650 millones de dólares.
La respuesta fue afirmativa, pero no solo por el dinero en juego (no despreciable, obviamente) pero porque a partir de ese momento, todo lo que pudiera hacer AlphaGo tendría el respaldo de Google. En realidad, AlphaGo es de Google ahora y toda la potencia, toda las computadoras, toda la capacidad de almacenamiento, todo... en fin, todo lo que se le ocurra, está a disposición de Hassabis y su grupo.
Cuando AlphaGo tenía sus primeras versiones listas, empezó a jugarle a los otros programas de GO disponibles. De hecho, les jugaron 500 partidas, a todos los otros; AlphaGo ganó 499. Y llegó octubre del año pasado, 2015. La idea fue contratar a Fan Hui, el campeón europeo de GO. Hui nació en China pero se naturalizó francés y hoy, a los 34 años, es el director técnico del equipo profesional de Go que representa a Francia en las competencias internacionales. Hui no es ni era el mejor jugador en actividad, pero sí es un jugador profesional y en ese momento se ubicaba entre los mejores 650 jugadores del mundo. Teniendo en cuenta que más de una tercera parte del mundo juega al GO, es un logro no menor. Lo contrataron para que jugara cinco partidas contra AlphaGo y sucedió algo inesperado: por primera vez en la historia, AlphaGo (una computadora) le ganó una partida a un humano. En realidad, no solo le ganó una partida sino que le ganó las cinco. El resultado fue tremendo: 5-0. Todo esto tuvo un impacto muy fuerte en China, Corea, Japón...
Sucederían dos cosas más todavía. La primera tuvo lugar en enero de este año 2016. La revista Nature, una de las más importantes del mundo por prestigio y penetración en el mundo de la ciencia, publica un artículo (4) hablando de AlphaGo y termina ubicándolo en el mapa. Bueno, al menos en ese mapa, en donde vivimos los que estamos en este lugar del mundo. Pero faltaría algo más.
Para usted, como lo era para mí hasta hace muy poquito tiempo, ese nombre no dice nada. Sedol es un joven de 33 años, nacido en Corea del Sur. En otras partes del mundo, Sedol es como Maradona o Messi o Federer o Tiger Woods. Es el campeón mundial de GO, pero no solo es el campeón ahora, sino que lo viene siendo desde hace ¡18 años! Todos los que trabajan en DeepMind y produjeron AlphaGo necesitaban jugarle al equivalente de Kasparov hace 20 años. ¿Cómo hacer? Justamente, la gente de Google le hace una oferta. Lo desafían a jugar cinco partidas, en donde él elija (eligió Seúl, de donde es oriundo). Si él ganaba tres de las cinco, le pagarán un millón de dólares. En cambio, si perdía, podrá elegir una obra de beneficencia cualquiera y Google depositaría/donaría ese millón de dólares allí.
Lee no contestó inmediatamente. Primero, según declaró, quería ver cómo y por qué había perdido Hui en octubre del año anterior. De todas formas, en el momento que aceptó el desafío, y cuando se firmó el contrato dijo públicamente que él creía que podía jugar mucho mejor que el campeón europeo, y que su duda estaba en si ganaría 5 a 0 o 4 a 1.
Las cinco partidas se jugaron en el Four Seasons Hotel en Seúl. En un salón especialmente acondicionado, los enfrentamientos tuvieron lugar el 9-10-12-13 y 15 de marzo. A diferencia de lo que sucede con el ajedrez, en donde en promedio cada jugador hace 40 movimientos, al jugar al GO las partidas son mucho más largas. En promedio superan las 200 movidas. Pero había algo más: hasta principios de este año, AlphaGo había jugado solamente una vez contra un humano que hubiera sido un jugador profesional. ¿Cómo les iría contra Sedol? Había llegado el momento de “la verdad” no solo para Hassabis sino también para el grupo de 20 investigadores que habían sumado sus esfuerzos para intentar dar el ‘salto de calidad’ y entrar en la historia. En el sudeste asiático los diarios y los jugadores profesionales se manifestaban con muestras de sarcasmo y sugiriendo el ridículo que habría de hacer AlphaGo al enfrentarse con Lee. De hecho, la convicción era que sería la manera más fácil para Sedol de ganar un millón de dólares....
No tan rápido muchachos....
De las cinco partidas, los organizadores le ofrecieron a Lee que jugara tres veces con blancas, y de esa forma, poder hacer la primera movida. Y así fue. Ni bien empezó la primera partida, cuando se habían hecho las primeras movidas, Lee dijo que advirtió que estaba jugando contra un animal diferente que el que había tenido Hui hacía algunos meses. Es que AlphaGo tiene la capacidad de dividirse en dos y jugar contra ella misma, y lo hace millones de veces por día e incorpora esos datos una y otra vez. Desde octubre del 2015 hasta marzo de este año habían pasado casi cinco meses. Si bien al GO se juega desde hace más de 2.500 años, el hombre junta toda la información que puede y mejora en función de esa experiencia. Más aún: mientras yo escribo estas líneas y usted las lee, AlphaGo jugó millones de partidas sin que se le moviera un pelo. Y la gran diferencia es que encima de todo, se acuerda de todo pero en el camino... y esto es lo increíble....¡aprende!
Esa primera partida, la del 9 de marzo, terminó en forma inesperada para el mundo. Lee perdió después de 188 movimientos. Con el rostro mortificado, Lee pide disculpas... sí, disculpas, y cuando le preguntan qué pronóstico tiene para el día siguiente, su respuesta es muy diferente de la del día en que se firmó el contrato: “50 y 50”. Si bien la máquina sorprendió a Lee (y al resto de los expertos por lo que hizo en la movida 102 de esa primera partida), todavía habría más.
El jueves 10 de marzo, ahora con piezas negras, Lee está dispuesto a dar batalla, pero... algo curioso sucedió en el camino. Cuando AlphaGo hace su movida 37, Lee parece petrificado. Las cámaras lo muestran con la frente transpirada. Se levanta y sale de la sala. Cada jugador tiene dos horas para hacer todos sus movimientos y por lo tanto, cada minuto tiene un peso específico que nadie ignora. Lee vuelve después de un cuarto de hora y juega la mejor partida de su vida (según él mismo), pero... ¡vuelve a perder! Esa movida 37 es un quiebre en la historia para los que juegan al GO. Nunca nadie había jugado así. La probabilidad de que alguien haga esa movida está estimada en una en 10 mil. De hecho, el presidente de la Asociación Norteamericana de Go, Andrew Jackson declara que si alguno de sus maestros hubiera visto que él hacía esa movida, le hubieran dado una palmada en la muñeca diciéndole: “Eso no se hace”. Bueno, uno debería agregar: ¡no se hacía! Ahora sí se hace.. y más aún, esas movidas le sirvieron para ganar! Lee acepta la derrota después de 211 movimientos.
Y eso es lo extraordinario del relato. Lee había jugado la mejor partida de su vida y sin embargo, no le había alcanzado, pero comentó que ese día había aprendido lo que nunca antes había visto. Y de eso se trata.
Dos días más tarde, el sábado 12 se juega la tercera partida. Ahora Lee necesitaría ganar las siguientes tres si quería aspirar al millón de dólares, pero ni siquiera eso era lo importante. Lee vuelve a perder y cuando declara que siente que ha fallado, parece pedir disculpas por lo ‘mal que nos ha representado’. Sin embargo, y como era esperable, Lee no perdió contra una máquina ni una computadora. Lee Sedol acababa de perder contra un grupo de veinte personas que juntaron sus mentes para diseñar un programa que pudiera contra el mejor que podemos exhibir nosotros hoy. AlphaGo somos todos nosotros. AlphaGo no llegó desde un universo desconocido y viajando en una suerte de OVNI nos ganó a un juego que inventamos noso- tros. Una vez más, AlphaGo somos todos nosotros.
Gu Li no solo es uno de los dos amigos íntimos de Sidol sino que también es un jugador profesional importante. Esa noche, contratado por la televisión nacional de china ofrece su opinión: “Lee estuvo jugando una batalla solitaria contra un rival invisible”.
Ya no habría un millón de dólares para Lee pero sí hubo más partidas. Al día siguiente, el domingo 13 de marzo, Lee juega con negras. Curiosamente, AlphaGo comete un error a poco de comenzar la partida y Lee no lo deja pasar. En la jugada 78 hace él también una jugada ingeniosa y creativa, que también tenía una probabilidad de 1 en 10 mil de ser utilizada. Pero a diferencia de lo que había pasado antes, AlphaGo se entrega. El resultado está 3 a 1 ahora. Ya no sería como con Hui.
Lee pide jugar la quinta partida usando piezas negras. Es que su único triunfo y su derrota más cerrada se producen cuando él condujo ese color de piezas. Obviamente, se le concede el pedido. Pero ya no hay mucho más por hacer. Esta vez no hay error de AlphaGo y toda la sabiduría y creatividad de Lee no alcanzaron. Final: AlphaGo 4 - Lee Sedol 1.
Esto recién comienza. Sería inapropiado tratar de sacar conclusiones cuando en el futuro está todo y el pasado nos permitió llegar hasta acá. Cuando Deep Blue le ganó a Kasparov, la máquina que había diseñado IBM virtualmente desapareció de la escena. No hubo posibilidades de extrapolar para ninguna otra cosa lo que obviamente sirvió (y sirve) para ganar al ajedrez. Es decir, no hubo maneras de aprovechar (salvo en cosas menores) la potencia de lo que había sucedido. Ahora, con AlphaGo es diferente.
Tanto Brin como Page dijeron después del triunfo: “Es claro que no invertimos 650 millones de dólares para ganar al GO. Ese no es el objetivo de Google”. No, claro que no lo es. La expectativa es que ahora, con este tipo de programas en donde las máquinas aprenden y se van mejorando, sirven además para mejorarnos a nosotros. El campeón europeo, Fan Hui, estaba ubicado entre los mejores 650 jugadores del mundo. Hoy, ya está entre los mejores 300 después de haber jugado contra AlphaGo. Por otro lado, las movidas que hizo en su enfrentamiento con Lee Sedol, abrieron un universo de posibilidades que los humanos no sabíamos que existían. Para decirlo de otra forma: la diferencia está en que en los programas anteriores, las computadoras tienen predeterminado qué hacer en cada caso. Acá, AlphaGo aprende mientras juega... y en el camino, nos enseña a nosotros. De hecho, AlphaGo no hubiera podido demostrar toda su potencia de no haber sido porque Lee Sedol la empujó hacia ese lugar y la desafió.
La inteligencia artificial no será replicar la ‘inteligencia del hombre’, su creatividad. De hecho, los aviones vuelan pero no tienen alas que muevan, ni plumas ni músculos. El hombre replicó lo que necesitó para obtener el mismo resultado. Ernest Davis, profesor en la universidad de New York acaba de escribir: “Usualmente, uno le dice a una computadora lo que tiene que hacer. En cambio, cuando hablamos de aprender, uno le muestra cómo. Me explico. Suponga que usted quiere que una computadora cruce una calle por ejemplo. Con la programación convencional usted le da un conjunto muy preciso de reglas, diciéndole que tiene que mirar para la derecha, para la izquierda, esperar los autos, usar las cebras para cruzar, etc y después, dejarla que lo haga sola. En cambio, con el aprendizaje del que yo le estoy hablando, uno le muestra 10000 videos de alguien cruzando una calle en forma correcta, y otros 10000 videos de alguien quien al intentar cruzar mal es atropellado por un auto y después la deja a ella sola para que aprenda. ¡Y aprende!”
Como decía al principio, estamos en presencia de algo nuevo, al menos, algo nuevo para mí. El hombre acaba de cruzar una barrera que algunos ni siquiera pensábamos que se podía abordar. Un enorme potencial se acaba de abrir, con todas las implicancias éticas y de tremendo poder para quien posea esta tecnología.
La Argentina está en un lugar muy privilegiado. Nos costó muchísimo llegar hasta acá. Protejámoslo, porque eso marcará la diferencia entre soberanía e independencia.
(1) Las del ajedrez se estiman en 10123 mientras que las del Go, llegan a 10360. Imposible (al menos para mi) en dar un ejemplo que permita imaginar la magnitud de estos números. Mejor dicho, sí. El número de átomos del universo (visible) se calcula en 1080. El ajedrez llegaría a una vez y media a ese número. El Go, sería cuatro veces y media. No sé: creo que a esta altura esos números no dicen más nada ¿no es así?
(2) De hecho, Pier Hut, astrofísico en el Instituto de Estudios Avanzados en Princeton declaró en ese momento: “Puede que pasen cien años (sic) hasta que el hombre pueda derrotar al GO.. o quizás más” (“It may be a hundred years before a computer beats humans at Go -maybe even longer”). http://www.nytimes.com/2016/04/05/science/google-alphago-artificial-intelligence.html?_r=0 (artículo publicado en The New York Times el 4 de abril de este año y firmado por George Johnson, el periodista especializado en ciencia del diario)
(3) DeepMind = Mente Profunda.
(4) http://www.nature.com/nature/journal/ v529/n7587/full/nature16961.html
© 2000-2022 www.pagina12.com.ar | República Argentina | Política de privacidad | Todos los Derechos Reservados
Sitio desarrollado con software libre GNU/Linux.