Papers falsos generados por IA: una amenaza para la investigación científica

La amenaza de los papers «made in IA» se cierne sobre la ciencia

La comunidad científica está en alerta roja: la proliferación de "papers" falsos o de calidad cuestionable, generados con la ayuda inestimable (o no tanto) de la inteligencia artificial, amenaza con desbarrancar la investigación académica. El problema, que ya venía haciendo ruido en diversos ámbitos de la divulgación científica, ahora apunta directamente a los servidores de preimpresión, según un análisis publicado en Nature. ¡Más rápido que declaración de político en campaña!

Estos servidores, verdaderos "kioscos" online gestionados en su mayoría por organizaciones sin fines de lucro, permiten a los investigadores darle a conocer al mundo versiones preliminares de sus trabajos (los famosos preprints) antes de mandarlos al riguroso (o no tanto) proceso de revisión por pares y publicarlos en las revistas académicas que dan prestigio (y puntos para el currículum).

La doble filo de la difusión rápida

Los servidores preprint son como ese amigo que te cuenta todo antes de tiempo: ofrecen múltiples ventajas, tanto para los autores como para la comunidad científica en general. Permiten la difusión rápida y abierta de miles de investigaciones, lo que facilita la divulgación de nuevas técnicas o conocimientos que podrían desembocar en descubrimientos clave. Además, fomentan la colaboración y el intercambio de ideas, algo así como un "mate cocido científico" que beneficia a todos.

Pero, como todo en la vida, tienen su lado B. Su papel en la difusión del conocimiento científico se ha visto cuestionado en los últimos años debido a una creciente avalancha de envíos sospechosos. Entre ellos, figuran los provenientes de las temibles "fábricas de papers", esos antros donde se producen trabajos científicos falsificados para vender autorías (¡un curro más grande que la reventa de entradas para un recital de rock!). También preocupan los artículos que muestran indicios de haber sido generados, total o parcialmente, mediante IA. ¡La rebelión de las máquinas llegó a la ciencia!

Esta situación plantea serias dudas sobre la viabilidad y eficiencia futura de los servidores preprint. Identificar contenidos fraudulentos requiere una inversión de recursos considerable, que puede resultar prohibitiva para las organizaciones sin fines de lucro que los gestionan. Además, la implementación de verificaciones más estrictas podría ralentizar el proceso de publicación, afectando la principal ventaja de estas plataformas: la rapidez en la difusión. ¡Un dilema más complicado que explicar la inflación!

Los administradores de estos servicios, sin embargo, mantienen la calma (al menos en apariencia). Reconocen el problema, sí, pero aseguran que los casos detectados representan una proporción mínima del total. Por ejemplo, arXiv estima que cerca del 2% de los documentos que recibe son rechazados "por ser productos de IA, fábricas de papers o ambos", según Nature. bioRxiv y medRxiv, por su parte, calculan que rechazan poco más de 10 manuscritos diarios por estas razones, una fracción reducida si se tiene en cuenta los 7.000 envíos que reciben al mes. ¡Un número que asusta más que el precio del dólar!

¿Un espejismo o una tormenta en el horizonte científico?

Aunque las cifras parezcan bajas, especialistas y organizaciones han advertido sobre un incremento notable de textos creados con IA desde el lanzamiento de ChatGPT. El 25 de julio, el Centro para la Ciencia Abierta (COS), una organización sin fines de lucro que administra PsyArXiv, informó haber observado un aumento notable de artículos que parecen generados en su totalidad o con amplia asistencia de herramientas de IA. ¡El futuro llegó y nos escribió el "paper"!

"Con la aparición de la IA generativa, se ha vuelto muy fácil crear material que parece un artículo de investigación real, pero que no lo es. Esto representa un problema para las revistas y, especialmente, para servicios gratuitos como OSF, que reducen las barreras para compartir investigaciones abiertamente. Una creciente avalancha de contenido generado por IA podría saturar estos servicios y dificultar a los lectores diferenciar entre material legítimo e ilegítimo. Si bien muchos investigadores utilizan IA para mejorar la claridad o resumir datos, nos preocupan especialmente los envíos que falsifican métodos, resultados o autoría por completo", advirtió la organización. ¡Palabras más, palabras menos: se pudrió todo!

Preprints creados con IA invaden la web

El aumento de "papers" generados por IA ha sido documentado en un estudio publicado en Nature Human Behaviour. El estudio señala que, en septiembre de 2024 —casi dos años después del lanzamiento de ChatGPT—, los modelos de lenguaje generaron el 22% de los resúmenes de informática en arXiv y alrededor del 10% de los resúmenes de biología en bioRxiv. ¡La IA se puso las pilas y ahora escribe más que un tuitero enojado!

James Zou, científico informático de la Universidad de Stanford y coautor del estudio, pone paños fríos (o intenta): matiza que parte de estos contenidos pueden ser usos legítimos de IA en la labor científica. Por ejemplo, muchos autores que envían preprints de informática a arXiv no son hablantes nativos de inglés y suelen emplear herramientas automáticas para mejorar su redacción. Thomas Dietterich, presidente de la sección de informática de arXiv, considera plausible la cifra del 22%, pero aclara que no necesariamente implica fraude. ¡Una luz de esperanza en medio del apocalipsis científico! ¿O no? La novela continúa…

Papers falsos generados por IA: una amenaza para la investigación científica

La amenaza de los papers «made in IA» se cierne sobre la ciencia

La doble filo de la difusión rápida

¿Un espejismo o una tormenta en el horizonte científico?

Preprints creados con IA invaden la *web*

Síguenos en

Preprints creados con IA invaden la web