DeepSeek-R1: IA china desafía a OpenAI con menor costo

Redacción Cuyo News
6 min
Cortito y conciso:

Un nuevo modelo de inteligencia artificial chino, DeepSeek-R1, irrumpe en la escena tecnológica con un rendimiento comparable a los grandes de la industria, pero a un costo significativamente menor. Este desarrollo no solo desafía el dominio de las empresas estadounidenses en el campo de la IA, sino que también plantea interrogantes sobre las estrategias de control y exportación tecnológica.

En el vasto terreno de la inteligencia artificial, un nuevo jugador emerge desde las entrañas de China. Se trata de DeepSeek-R1, un modelo que ha despertado el interés de la comunidad científica y el sector tecnológico por su propuesta de valor: un rendimiento similar al de los modelos más avanzados, como los de OpenAI, pero a una fracción de su costo. ¿Será este el fin de una era de exclusividad tecnológica?

DeepSeek-R1: El desafío chino a la hegemonía tecnológica

Desarrollado por la startup DeepSeek, este algoritmo no se anda con chiquitas. Según un documento publicado en la revista Nature, el rendimiento del DeepSeek-R1 iguala al del sistema más avanzado de la firma de Sam Altman en la resolución de problemas matemáticos, químicos y de codificación. Un dato no menor es que alcanza una precisión del 97% en la resolución de los desafíos de matemáticas evaluados con el parámetro MATH-500, y, para ponerle más picante al asunto, supera al 96% de los participantes humanos en las pruebas de programación de la iniciativa Codeforces. ¿Será que los chinos nos están comiendo los talones en esto de la tecnología?

Al igual que su contraparte made in USA, DeepSeek-R1 procesa solicitudes a través de “cadenas de pensamiento” que emulan los procesos de razonamiento humano. Fue entrenado sobre la base del funcionamiento del chatbot V3, también de DeepSeek. ¿Cómo lo lograron? Mediante técnicas de aprendizaje de refuerzo, en donde los ingenieros recompensaban al sistema por llegar a una respuesta correcta y por describir su «pensamiento» en el camino. Como si eso no fuera suficiente, también utilizaron una arquitectura de “mezcla de expertos”, que le permite al modelo decidir qué redes de procesamiento debe activar para cada tarea. Todo esto, por supuesto, con una eficiencia de recursos que hace agua la boca.

¿Y cuánto cuesta la fiesta?

Según los expertos, el entrenamiento de este modelo costó alrededor de 6 millones de dólares. Una cifra que suena a calderilla, si la comparamos con los 60 millones que Meta destinó para capacitar a su modelo Llama 3.1. Este ahorro en recursos informáticos permite que el acceso a este modelo sea mucho más barato. Para ponerlo en criollo, el uso del DeepSeek-R1 cuesta una trigésima parte de lo que implica utilizar OpenAI o1. Una diferencia que, sin duda, va a influir en la futura adopción del algoritmo.

“Un experimento que costaba más de 300 libras con OpenAI o1, ahora puede hacerse por menos de 10 dólares», comenta Mario Krenn, director del Laboratorio de Ciencias Artificiales del Instituto Max Planck, demostrando que la visión de los chinos al menos hasta ahora, es «más vale maña que fuerza».

Este modelo fue publicado bajo una licencia del Instituto Tecnológico de Massachusetts, como una herramienta «open-weight«, lo que significa que sus cadenas de pensamiento son accesibles para los investigadores. Y aunque sus datos de entrenamiento no están disponibles, Marco Dos Santos, científico informático de la Universidad de Cambridge, reconoce que la accesibilidad del programa “permite una mejor interpretación de los procesos de razonamiento del modelo”. ¿Un gesto de grandeza o una jugada estratégica? El tiempo lo dirá.

Lo que sí está claro es que DeepSeek-R1 fue construido a pesar de los controles de exportación impuestos por Estados Unidos. ¿Otro golazo de los orientales? Para François Chollet, investigador de IA, “el hecho de que DeepSeek-R1 provenga de China demuestra que la eficiencia en el uso de recursos es más crucial que la mera escala de cómputo”. Y Alvin Wang Graylin, vicepresidente global de HTC, concluye que “la ventaja que Estados Unidos alguna vez percibió tener se ha reducido. Ambas naciones deben adoptar un enfoque colaborativo para desarrollar una IA avanzada en lugar de perpetuar la actual competencia estéril de carrera armamentista”.

En resumen, DeepSeek-R1 no es solo un nuevo modelo de IA; es un cuestionamiento al status quo. Un punto y aparte en la carrera por la innovación tecnológica. ¿Será que el futuro de la inteligencia artificial tendrá acento chino? Habrá que dejar que la historia lo dicte, y nosotros, por supuesto, estaremos acá para contarlo con la misma chispa de siempre, pero con la seriedad que la ocasión amerita.

Compartir

🔺 Tendencia

🔺 Tendencia