Pioneros del «aprendizaje por refuerzo» coronados con el Premio Turing

Redacción Cuyo News
5 min
Cortito y conciso:

Andrew Barto y Rich Sutton, pioneros del aprendizaje por refuerzo, técnica clave en la inteligencia artificial moderna, fueron galardonados con el Premio Turing. Su trabajo, que alguna vez fue visto como una excentricidad, hoy impulsa desde ChatGPT hasta la optimización de centros de datos. ¿Será que las máquinas aprendiendo solas nos llevarán a un futuro aún más sorprendente?

Dos capos de la IA se llevan el Turing: ¿Revolución o espejito de colores?

En los turbulentos años ochenta, mientras Argentina intentaba volver a encarrilarse tras años oscuros, dos tipos, Andrew Barto y Rich Sutton, se jugaban el pellejo académico con una idea que pintaba para bizarra: ¡enseñar a las máquinas a aprender solitas, como los humanos y los animales! Sí, suena a película de ciencia ficción berreta, pero estos dos le pusieron garra y terminaron abriendo un camino que hoy recorre hasta el mismísimo ChatGPT.

Por esta patriada, Barto, profe emérito de la Universidad de Massachusetts Amherst, y Sutton, catedrático de la Universidad de Alberta, se alzaron con el Premio Turing, el Nobel de la informática. ¿El truco? El «aprendizaje por refuerzo», una técnica que, como un buen domador, usa premios y castigos virtuales para que las computadoras aprendan a hacer cosas experimentando.

### Aprendizaje por refuerzo: ¿La gallina de los huevos de oro de la IA?

«Cuando empecé, esto no era para nada popular», confesó Barto desde su casa en Massachusetts. ¡Y vaya que cambió la cosa! El aprendizaje por refuerzo saltó a la fama cuando Google DeepMind lo usó para crear AlphaGo, la máquina que le ganó al campeón mundial de Go, ese juego de mesa oriental que parece más difícil que entender la economía argentina.

Desde entonces, la técnica se usa para todo: desde optimizar la publicidad online hasta reducir el consumo energético de los data centers. ¡Incluso para diseñar microchips! Y ni hablar de su papel crucial en los modelos de lenguaje como el ChatGPT, ese bot que te contesta preguntas como si fuera un amigo que sabe de todo (y a veces te chamuya un poco, también).

### ¿Quién manda acá? ¿El humano o la máquina?

Pero ojo al piojo. Sutton advierte que, en muchos casos, los humanos siguen metiendo la cuchara, guiando a las IA con objetivos predefinidos. Para él, el verdadero desafío es lograr que las máquinas aprendan solas, sin la ayuda del hombre. ¿Será que vamos hacia un futuro donde las computadoras se manden solas, como esos políticos que no escuchan a nadie?

Jeff Dean, vicepresidente senior de Google, no escatimó elogios: el trabajo de Barto y Sutton «ha sido el eje del progreso de la IA en las últimas décadas». Palabras mayores, viniendo de un tipo que maneja una de las empresas más poderosas del mundo.

### Del olvido al estrellato: Una historia con sabor a revancha

La historia del aprendizaje por refuerzo es una montaña rusa. Tuvo sus momentos de gloria en los albores de la IA, allá por los años 50, pero después cayó en el olvido, eclipsado por otras teorías. Sin embargo, Barto, Sutton y otros fanáticos siguieron empujando, inspirándose en la biología, la psicología y la neurociencia. ¡Y vaya que les salió bien la jugada!

### ¿El futuro ya llegó?

Ahora, la gran pregunta es: ¿qué nos depara el futuro? ¿Veremos máquinas aprendiendo solas, creando cosas que ni siquiera podemos imaginar? ¿O seguiremos dependiendo de la guía humana, como esos directores técnicos que no se animan a cambiar el esquema táctico? Lo que está claro es que el trabajo de Barto y Sutton marcó un antes y un después en la inteligencia artificial. Y, como dice el dicho, el que persevera, alcanza. ¡Aunque a veces tarde décadas! Habrá que ver si esta revolución tecnológica nos trae más beneficios que dolores de cabeza. Porque, como bien sabemos en Argentina, no todo lo que brilla es oro.

Compartir

🔺 Tendencia

🔺 Tendencia