La promesa de una inteligencia artificial omnipresente, capaz de suplantar masivamente a los oficinistas, ha encontrado un escollo formidable en el terreno del trabajo autónomo. Un reciente experimento, liderado por investigadores de la empresa de anotación de datos Scale AI y el Centro para la Seguridad de la IA (CAIS), dibuja un panorama mucho menos apocalíptico para el empleo humano, revelando que, incluso los agentes de IA más sofisticados, distan de ser una amenaza laboral en el universo freelance.
El Índice de Trabajo Remoto, una nueva referencia desarrollada por estas instituciones, fue diseñado para medir la capacidad de los modelos de IA de vanguardia para automatizar tareas económicamente valiosas. Los resultados son, cuando menos, contundentes: los agentes de IA encomendados a una serie de simulaciones de trabajo autónomo solo pudieron realizar menos del 3% de las tareas, embolsando unos magros 1.810 dólares de un total posible de 143.991. Una cifra que, a cualquier mortal, apenas le alcanzaría para unas merecidas vacaciones de fin de semana largo en la costa atlántica.
La brecha entre la expectativa y la realidad algorítmica
Los investigadores analizaron diversas herramientas, concluyendo que la más capaz era Manus, de una startup china del mismo nombre, seguida por Grok de xAI (la del mismísimo Elon Musk, para que no queden dudas sobre el calibre de los examinados), Claude de Anthropic, ChatGPT de OpenAI y Gemini de Google. Es decir, el dream team de la inteligencia artificial, puesto a prueba en la cancha del trabajo remoto, mostró que todavía tiene mucho por aprender.
Dan Hendrycks, director de CAIS, pone los puntos sobre las íes: «Espero que esto dé una impresión mucho más precisa de lo que está ocurriendo con las capacidades de la IA«. Y añade, con una cuota de realismo tan necesaria como un buen mate amargo en la mañana, que aunque algunos agentes han mejorado notablemente en el último año, eso no garantiza que el progreso se mantenga a la misma velocidad. Los espejismos tecnológicos, al parecer, también tienen fecha de vencimiento.
Delirios de grandeza y el persistente factor humano
Los espectaculares avances de la IA generativa han alimentado profecías de que esta superará pronto la inteligencia humana y reemplazará a un sinnúmero de trabajadores. Dario Amodei, CEO de Anthropic, llegó a sugerir en marzo que el 90% del trabajo de codificación se automatizaría en cuestión de meses. Curioso, porque olas anteriores de IA también inspiraron predicciones erróneas, como la supuesta inminente sustitución de radiólogos por algoritmos de IA. Parece que la historia, a veces, se empeña en rimar con la ficción.
Para su estudio, los investigadores generaron una serie de tareas freelance a través de trabajadores verificados de Upwork. Las asignaciones abarcaban un amplio espectro, desde diseño gráfico y edición de video hasta desarrollo de juegos y tareas administrativas, como el raspado de datos. Cada descripción de trabajo se combinó con un directorio de archivos necesarios y un ejemplo de un proyecto terminado por un humano. La idea era simular un entorno lo más real posible, para que la IA no tuviera excusas.
Hendrycks subraya que, «aunque los modelos de IA han mejorado en codificación, matemáticas y razonamiento lógico en los últimos años, siguen teniendo dificultades para utilizar diferentes herramientas y realizar tareas complejas que implican numerosos pasos: ‘No tienen memoria a largo plazo y no pueden aprender continuamente de las experiencias. No pueden adquirir habilidades en el trabajo como los humanos'». En otras palabras, la IA puede ser un genio en cálculo, pero si se trata de buscar la yerba para el mate o recordar dónde dejó las llaves, sigue necesitando un cerebro humano.
Este análisis ofrece una perspectiva diferente al punto de referencia del trabajo económico presentado en septiembre por OpenAI, llamado GDPval, que afirma que los modelos de IA más avanzados, como GPT-5, se acercan a las capacidades humanas en 220 tareas de una amplia gama de trabajos de oficina. Sobre este contrapunto, OpenAI prefirió el silencio, una postura que dice más que mil palabras.
«Llevamos años debatiendo sobre la IA y el empleo, pero la mayor parte ha sido hipotética o teórica», añade Bing Liu, director de investigación de Scale AI. Ahora, la hipótesis choca de frente con los números.

Los investigadores que estudian el impacto emocional de herramientas como ChatGPT proponen un nuevo tipo de referencia que mide las repercusiones psicosociales de un modelo.
La paradoja de Amazon y el horizonte laboral
Liu y Hendrycks admiten, con la humildad que a veces falta en el universo tecnológico, que el nuevo punto de referencia no es una medida perfecta del impacto económico de la IA. Muchas profesiones incluyen tareas no contempladas en esta métrica y es probable que muchos autónomos utilicen la IA como una herramienta para potenciar su productividad, no para que les haga todo el trabajo. Después de todo, hasta el mejor futbolista necesita una pelota para brillar.
Sin embargo, la idea de que la IA ya está diezmando puestos de trabajo sigue ganando terreno. Esta semana, Amazon anunció la supresión de 14.000 puestos, una medida que atribuyó, en parte, al rápido auge de la inteligencia artificial generativa. «Esta generación de IA es la tecnología más transformadora que hemos visto desde internet. Está permitiendo a las empresas innovar mucho más rápido que nunca», escribió Beth Galetti, vicepresidenta sénior de Experiencia de las Personas y Tecnología de Amazon, en una nota compartida públicamente. La IA, el chivo expiatorio favorito de los despidos masivos, al parecer.
No obstante, si el Índice de Trabajo Remoto sirve de indicación, es poco probable que la IA ocupe alguno de estos puestos vacantes. Los seres humanos, con sus falencias, sus mates y su memoria a largo plazo (a veces), parecen tener su lugar asegurado en el mercado freelance, al menos por un tiempo más. La revolución de las máquinas, por ahora, tendrá que esperar su turno.
Un nuevo estudio de Scale AI y el Centro para la Seguridad de la IA (CAIS) revela la limitada capacidad de los agentes de inteligencia artificial para ejecutar trabajos autónomos en línea. Los resultados muestran que, incluso los modelos más avanzados, lograron completar menos del 3% de las tareas asignadas, ganando una mínima fracción del total posible. Este hallazgo contradice las especulaciones sobre la inminente sustitución masiva de puestos de oficina por sistemas generativos, subrayando las deficiencias actuales de la IA en tareas complejas y multi-paso.
Resumen generado automáticamente por inteligencia artificial
Contenido humorístico generado por inteligencia artificial
La promesa de una inteligencia artificial omnipresente, capaz de suplantar masivamente a los oficinistas, ha encontrado un escollo formidable en el terreno del trabajo autónomo. Un reciente experimento, liderado por investigadores de la empresa de anotación de datos Scale AI y el Centro para la Seguridad de la IA (CAIS), dibuja un panorama mucho menos apocalíptico para el empleo humano, revelando que, incluso los agentes de IA más sofisticados, distan de ser una amenaza laboral en el universo freelance.
El Índice de Trabajo Remoto, una nueva referencia desarrollada por estas instituciones, fue diseñado para medir la capacidad de los modelos de IA de vanguardia para automatizar tareas económicamente valiosas. Los resultados son, cuando menos, contundentes: los agentes de IA encomendados a una serie de simulaciones de trabajo autónomo solo pudieron realizar menos del 3% de las tareas, embolsando unos magros 1.810 dólares de un total posible de 143.991. Una cifra que, a cualquier mortal, apenas le alcanzaría para unas merecidas vacaciones de fin de semana largo en la costa atlántica.
La brecha entre la expectativa y la realidad algorítmica
Los investigadores analizaron diversas herramientas, concluyendo que la más capaz era Manus, de una startup china del mismo nombre, seguida por Grok de xAI (la del mismísimo Elon Musk, para que no queden dudas sobre el calibre de los examinados), Claude de Anthropic, ChatGPT de OpenAI y Gemini de Google. Es decir, el dream team de la inteligencia artificial, puesto a prueba en la cancha del trabajo remoto, mostró que todavía tiene mucho por aprender.
Dan Hendrycks, director de CAIS, pone los puntos sobre las íes: «Espero que esto dé una impresión mucho más precisa de lo que está ocurriendo con las capacidades de la IA«. Y añade, con una cuota de realismo tan necesaria como un buen mate amargo en la mañana, que aunque algunos agentes han mejorado notablemente en el último año, eso no garantiza que el progreso se mantenga a la misma velocidad. Los espejismos tecnológicos, al parecer, también tienen fecha de vencimiento.
Delirios de grandeza y el persistente factor humano
Los espectaculares avances de la IA generativa han alimentado profecías de que esta superará pronto la inteligencia humana y reemplazará a un sinnúmero de trabajadores. Dario Amodei, CEO de Anthropic, llegó a sugerir en marzo que el 90% del trabajo de codificación se automatizaría en cuestión de meses. Curioso, porque olas anteriores de IA también inspiraron predicciones erróneas, como la supuesta inminente sustitución de radiólogos por algoritmos de IA. Parece que la historia, a veces, se empeña en rimar con la ficción.
Para su estudio, los investigadores generaron una serie de tareas freelance a través de trabajadores verificados de Upwork. Las asignaciones abarcaban un amplio espectro, desde diseño gráfico y edición de video hasta desarrollo de juegos y tareas administrativas, como el raspado de datos. Cada descripción de trabajo se combinó con un directorio de archivos necesarios y un ejemplo de un proyecto terminado por un humano. La idea era simular un entorno lo más real posible, para que la IA no tuviera excusas.
Hendrycks subraya que, «aunque los modelos de IA han mejorado en codificación, matemáticas y razonamiento lógico en los últimos años, siguen teniendo dificultades para utilizar diferentes herramientas y realizar tareas complejas que implican numerosos pasos: ‘No tienen memoria a largo plazo y no pueden aprender continuamente de las experiencias. No pueden adquirir habilidades en el trabajo como los humanos'». En otras palabras, la IA puede ser un genio en cálculo, pero si se trata de buscar la yerba para el mate o recordar dónde dejó las llaves, sigue necesitando un cerebro humano.
Este análisis ofrece una perspectiva diferente al punto de referencia del trabajo económico presentado en septiembre por OpenAI, llamado GDPval, que afirma que los modelos de IA más avanzados, como GPT-5, se acercan a las capacidades humanas en 220 tareas de una amplia gama de trabajos de oficina. Sobre este contrapunto, OpenAI prefirió el silencio, una postura que dice más que mil palabras.
«Llevamos años debatiendo sobre la IA y el empleo, pero la mayor parte ha sido hipotética o teórica», añade Bing Liu, director de investigación de Scale AI. Ahora, la hipótesis choca de frente con los números.

Los investigadores que estudian el impacto emocional de herramientas como ChatGPT proponen un nuevo tipo de referencia que mide las repercusiones psicosociales de un modelo.
La paradoja de Amazon y el horizonte laboral
Liu y Hendrycks admiten, con la humildad que a veces falta en el universo tecnológico, que el nuevo punto de referencia no es una medida perfecta del impacto económico de la IA. Muchas profesiones incluyen tareas no contempladas en esta métrica y es probable que muchos autónomos utilicen la IA como una herramienta para potenciar su productividad, no para que les haga todo el trabajo. Después de todo, hasta el mejor futbolista necesita una pelota para brillar.
Sin embargo, la idea de que la IA ya está diezmando puestos de trabajo sigue ganando terreno. Esta semana, Amazon anunció la supresión de 14.000 puestos, una medida que atribuyó, en parte, al rápido auge de la inteligencia artificial generativa. «Esta generación de IA es la tecnología más transformadora que hemos visto desde internet. Está permitiendo a las empresas innovar mucho más rápido que nunca», escribió Beth Galetti, vicepresidenta sénior de Experiencia de las Personas y Tecnología de Amazon, en una nota compartida públicamente. La IA, el chivo expiatorio favorito de los despidos masivos, al parecer.
No obstante, si el Índice de Trabajo Remoto sirve de indicación, es poco probable que la IA ocupe alguno de estos puestos vacantes. Los seres humanos, con sus falencias, sus mates y su memoria a largo plazo (a veces), parecen tener su lugar asegurado en el mercado freelance, al menos por un tiempo más. La revolución de las máquinas, por ahora, tendrá que esperar su turno.
 
					
 
			 
                            
                            
                            
                         
                            
                            
                            
                         
                            
                            
                            
                         
		 
		 
		 
		 
		 
		