Alia, la IA española, ¿entrenada con obras sin permiso?

Redacción Cuyo News
6 min
Cortito y conciso:

El modelo de inteligencia artificial Alia, impulsado por el Gobierno, está en el ojo de la tormenta. ¿La razón? Se entrenó utilizando obras protegidas por derechos de autor, generando un debate sobre la legalidad y ética de la práctica. Mientras el Gobierno se defiende con la normativa europea, autores y expertos levantan la voz, anticipando una batalla legal que podría marcar un antes y un después en el mundo de la IA.

¿Alia, la IA argentina, entrenada con material ajeno? La polémica que sacude al Gobierno

El flamante modelo fundacional de inteligencia artificial (IA) Alia, desarrollado con bombos y platillos por el Gobierno, debutó con polémica. Resulta que, en su fase de entrenamiento, Alia se nutrió de obras obtenidas sin pagar derechos de autor, una práctica que ha encendido el debate sobre la ética y la legalidad en el desarrollo de la IA.

Según la descripción oficial de la familia de modelos Alia, uno de los pilares de su aprendizaje fue «Common Crawl», un repositorio donde se vuelcan obras de internet sin pagar licencias. Un recurso también utilizado por los gigantes tecnológicos, pero que ahora pone al Gobierno en una posición incómoda.

Fuentes del Ministerio de Transformación Digital y de la Función Pública aseguran que todo se hizo dentro de la ley, amparándose en la Directiva de Mercado Único Digital y el Reglamento Europeo de IA. «La excepción permite la minería de datos, y Alia respetó los mecanismos de protección de derechos de autor», afirman. La clave está en el artículo 4 de la Directiva, que permite el acceso a obras siempre y cuando sus autores no hayan «reservado expresamente» su uso.

¿Un laberinto legal para los autores?

Pero, ¿qué significa esto en la práctica? Que los autores y creadores que no quieran que sus obras alimenten modelos de IA deben embarcarse en un proceso complejo para protegerlas en cada rincón de internet. Un verdadero laberinto legal, según Eva Moraga, abogada especialista en el sector cultural y portavoz de la Coalición IA Respeta Cultura.

«Es materialmente imposible», se queja Moraga, quien considera que la normativa actual no fue pensada para la IA. «Estaba destinada a la investigación académica y el uso particular», añade, citando un informe del Parlamento Europeo.

El objetivo de Alia, según el Gobierno, es priorizar el contenido en castellano y otras lenguas cooficiales, que representan un 20% del material analizado, superando a modelos como ChatGPT o Gemini. Esto, en teoría, debería traducirse en una IA más precisa en el contexto local.

Alia es un proyecto de código abierto, lo que significa que cualquiera puede descargarlo y adaptarlo. El Gobierno insiste en que se entrenó con documentación pública oficial, como boletines oficiales y resoluciones judiciales. Sin embargo, la inclusión de Common Crawl en la ecuación es lo que desató la controversia.

La batalla legal de la IA: Un terreno minado

Los grandes modelos de lenguaje (LLM) necesitan cantidades ingentes de datos para funcionar. Se estima que las últimas versiones de ChatGPT, por ejemplo, utilizaron prácticamente todo internet. Y ahí es donde empiezan los problemas.

Desde 2022, los gigantes de la IA enfrentan una cascada de demandas colectivas en EE.UU. por usar obras protegidas sin permiso. En enero de 2024, representantes de OpenAI reconocieron que «sería imposible entrenar los modelos actuales de IA sin material con derechos de autor».

Hace poco, Anthropic, la empresa detrás del chatbot Claude, llegó a un acuerdo extrajudicial histórico con un grupo de escritores, pagando 1.500 millones de dólares para evitar un juicio por copyright. ¿Un indicio de que la industria de la IA está empezando a tomarse en serio los derechos de autor?

¿Investigación o uso comercial? La grieta en la normativa

La regulación europea no es del todo clara en este punto. Si bien la Directiva de Mercado Único Digital contempla excepciones para la investigación, el hecho de que Alia pueda tener aplicaciones comerciales abre un interrogante.

«La excepción estaba pensada para propósitos de investigación, que es lo que argumenta Alia que hace. Pero luego pone su modelo de lenguaje a disposición de aplicaciones y usos comerciales, lo cual contradice el espíritu de la norma», sostiene Borja Adsuara, abogado y consultor especializado en derecho digital.

El Reglamento Europeo de IA también menciona los derechos de autor, pero no especifica cómo deben ejercerse. La UE publicó un código de buenas prácticas en junio, pero tampoco resolvió las dudas clave.

En definitiva, serán los tribunales quienes tengan la última palabra. «Hay una discusión de carácter jurídico y doctrinal que se va a debatir en procedimientos judiciales en toda Europa», explica Moraga. La batalla por los derechos de autor en la era de la IA recién comienza, y Alia está en el centro de la escena.

Compartir
🔺 Tendencia