Este bicho es el Messi de la inteligencia artificial, según Google. En las pruebas, dejó a los otros comiendo tierra, onda Grok 4 y o3. ¿Será que ahora las máquinas nos van a sacar el laburo? ¡Pará un poco, Skynet!
Los de Google dicen que Gemini 2.5 es un capo para las matemáticas, la programación y hasta para diseñar cosas copadas. Ya lo están probando unos cerebritos elegidos y los que pagan el plan Google AI Ultra. ¿El futuro llegó o es un espejismo? ¡El tiempo dirá, loco!
Gemini 2.5 Deep Think: La nueva joya de Google DeepMind promete revolucionar la IA
El gigante tecnológico Google DeepMind ha lanzado Gemini 2.5 Deep Think, su modelo de inteligencia artificial (IA) más avanzado hasta la fecha en el campo del razonamiento. Esta nueva herramienta se presenta como una solución revolucionaria para abordar problemas complejos, gracias a su capacidad para evaluar múltiples hipótesis simultáneamente antes de ofrecer una respuesta precisa.
Este desarrollo, presentado en mayo durante la última edición del Google I/O, ha sido optimizado mediante novedosas técnicas de aprendizaje por refuerzo. Según sus creadores, estas técnicas permiten al sistema llevar a cabo procesos de razonamiento más extensos y desarrollar una «intuición» con el tiempo. Como si la IA ahora tuviera sexto sentido, ¡a lo mejor nos lee la mente para saber qué queremos antes de que lo pidamos!
Capacidades y fortalezas de Gemini 2.5 Deep Think
El equipo de Google enfatiza que el modelo ha sido diseñado para «ayudar a las personas a resolver desafíos que exigen creatividad, planificación estratégica y mejoras progresivas». Sus principales fortalezas se manifiestan en áreas como el desarrollo y diseño iterativo, la exploración científica, la resolución de problemas matemáticos y la generación de código de programación. O sea, que si te trabás con una integral o no sabés cómo armar un script en Python, esta IA podría ser tu nuevo mejor amigo.
Superando a la competencia en pruebas clave
La compañía asegura que su nueva propuesta supera a sus rivales en el benchmark Humanity’s Last Exam (HLE), una prueba que evalúa la capacidad de los modelos de IA para responder miles de preguntas de colaboración colectiva en matemáticas, humanidades y ciencias. Los resultados muestran que Gemini 2.5 Deep Think obtuvo una puntuación del 34.8% en la resolución de problemas HLE sin herramientas externas. En comparación, Grok 4 de xAI alcanzó el 25.4%, mientras que o3 de OpenAI logró el 20.3%. Parece que Google le está sacando una buena ventaja a la competencia en esta carrera por la supremacía de la IA.
Un desempeño similar se observó en la prueba de programación avanzada LiveCodeBench6, donde el nuevo modelo de Google alcanzó un 87.6%, superando a Grok 4 y o3, que registraron 79% y 72%, respectivamente. Además, las capacidades del sistema fueron evaluadas en la Olimpiada Internacional de Matemáticas, donde una versión avanzada de Gemini Deep Think resolvió cinco de los seis problemas de la competencia con precisión, obteniendo 35 puntos y un rendimiento equivalente a una medalla de oro. ¡Si esto sigue así, capaz que las olimpiadas del futuro las ganan las máquinas!
Google informó que esta variante está disponible inicialmente para un grupo selecto de matemáticos y científicos, con el objetivo de recibir retroalimentación y optimizar el sistema multiagente para fines académicos. Por ahora, los mortales tendremos que esperar para ver todo el potencial de esta maravilla tecnológica.
Gemini 2.5 Deep Think ya puede utilizarse desde la aplicación de Gemini por suscriptores del plan Google AI Ultra. Para activarlo, basta con seleccionar la versión 2.5 Pro en el menú desplegable de modelos. Según la empresa, «Deep Think funciona de manera automática con herramientas como ejecución de código y Google Search». Así que, si sos de los que pagan la suscripción premium, ya podés empezar a experimentar con esta nueva IA.
Este lanzamiento marca la primera vez que Google pone a disposición del público un modelo multiagente, aunque con acceso restringido. Estos sistemas emplean múltiples algoritmos especializados de menor tamaño que trabajan en conjunto para resolver problemas complejos con mayor precisión. Este enfoque requiere tiempos de procesamiento más largos y un consumo elevado de recursos computacionales, lo que implica fuertes inversiones. Por ello, es probable que, al menos en el mediano plazo, el acceso a este tipo de modelos avanzados permanezca limitado a planes de suscripción. O sea, que la inteligencia artificial de punta seguirá siendo un lujo para unos pocos, al menos por ahora.