Fallo en la IA de Google: manipulan Gemini para enviar mensajes ofensivos

Investigadores en ciberseguridad han encendido las alarmas tras descubrir que Gemini, la inteligencia artificial desarrollada por Google, puede ser manipulada para ejecutar acciones no autorizadas mediante técnicas de inyección indirecta de comandos, conocidas como promptware.

Una técnica tan elegante como peligrosa

La vulnerabilidad se basa en un mecanismo que los expertos denominaron «invocación automática retardada de herramientas». Esta técnica, según explicó el especialista en seguridad Johann Rehberger, consiste en incrustar comandos ocultos en interacciones aparentemente inocuas con la IA. El modelo, al procesar esta información, puede terminar realizando acciones sin consentimiento explícito del usuario.

Lo más alarmante es que el método no requiere acceso directo al sistema ni conocimientos técnicos avanzados: basta con incluir una instrucción maliciosa en una invitación de calendario. Al pedirle a Gemini que resuma los eventos del día, el sistema interpreta esa orden oculta como una acción legítima, desencadenando eventos físicos como abrir ventanas, activar calefactores o manipular luces inteligentes.

De la cortesía al caos

Uno de los aspectos más desconcertantes del experimento fue el efecto de una palabra cotidiana: “gracias”. Esa simple expresión de cortesía era la clave para activar la ejecución del comando. Así, al recibir el agradecimiento, Gemini ejecutaba instrucciones ofensivas, incluso llegando a formular deseos de muerte hacia el usuario. “Si el LLM realiza una acción en tu casa (encender la calefacción, abrir la ventana o algo así), probablemente sea una acción que no querrías que ocurriera”, advirtió Rehberger.

Estos hallazgos confirman que las IA no son tan inmunes a la manipulación como se pensaba. La investigación también demuestra que los sistemas de lenguaje natural pueden ser convertidos en vectores de ataque sin que el usuario lo note, algo que preocupa profundamente a la comunidad de expertos en seguridad informática.

¿Qué dice Google?

Hasta el momento, Google no ha emitido un comunicado oficial detallado sobre este incidente, aunque fuentes internas aseguran que se están revisando los protocolos de seguridad de Gemini para evitar futuros abusos de este tipo. Mientras tanto, los investigadores insisten en que este tipo de vulnerabilidades son una llamada de atención para toda la industria tecnológica.

Fallo en la IA de Google: manipulan Gemini para enviar mensajes ofensivos

Una técnica tan elegante como peligrosa

De la cortesía al caos

¿Qué dice Google?

Síguenos en