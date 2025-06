El estudio en profundidad de qué aprenden —y cómo aprenden— los modelos de inteligencia artificial está deparándonos muchas sorpresas.

Recientemente, investigadores de las universidades de Stanford, Cornell y Virginia Occidental analizaron la capacidad de memorización de varios modelos de lenguaje de gran escala. En particular, uno de los analizados, creado por Meta y denominado LLaMA 3.1, fue capaz —cuando se le interrogó adecuadamente— de reproducir con notable fidelidad casi todo el primer libro de la serie Harry Potter. ¿Cómo lo comprobaron? Alimentando al modelo con cientos de pequeños fragmentos del libro y viendo si este generaba los textos siguientes del libro de la piedra filosofal como respuesta. Según los investigadores, esto sucedió en más de un 90% de los casos.

No está nada mal para una IA generativa que, supuestamente, no recuerda «textos» sino que construye secuencias de palabras basándose en probabilidades aprendidas de los innumerables textos utilizados en su adiestramiento. Su «experiencia», por así decirlo, es todo lo leído y releído durante su fase de entrenamiento, y su memoria, aunque no almacena fielmente nada, parece poder reconstruir no poco de lo «leído». Al final tenemos un gigantesco refrito maquinal.

Este resultado tiene, y tendrá, múltiples repercusiones: en el ámbito de la investigación, especialmente entre quienes diseñamos, estudiamos o aplicamos estos modelos; entre los creadores de contenido, que legítimamente quieren proteger su obra de usos indiscriminados y no autorizados; en los tribunales, donde proliferan ya las demandas por el presunto uso indebido de obras con derechos de autor durante el entrenamiento de estos sistemas; y, desde luego, entre los usuarios entusiastas de los LLMs, muchos de los cuales creen que todo lo que «devuelve» la máquina está libre de pecado —y de derechos de autor—.

Cuando hay derechos de por medio, copiar, sea con o sin intención, no está permitido. El artista estadounidense Richard Prince fue demandado por apropiarse de fotografías ajenas extraídas de Instagram. Las imprimía y vendía como obras propias, sin pedir permiso. Justificó su práctica diciendo que Instagram estaba hecho para alguien como él y que era como «ir a un concierto gratuito». Olvidó —convenientemente— que asistir a un concierto gratuito no te da derecho a grabar la música, ni mucho menos a venderla como si fuera tuya. Si bien su obra pecó de falta de originalidad, no le faltó creatividad para bautizarla como «arte de apropiación».

George Harrison, sin embargo, fue acusado de «plagio inconsciente» por su canción My Sweet Lord, que presentaba una sospechosa similitud con He’s So Fine, de The Chiffons. Aunque no hubo aparentemente mala intención, sí hubo imitación, y eso bastó para que perdiera el juicio.

Los modelos de IA generativos, parece que no lo son del todo, y en parte son «copiativos». Por lo visto, parece que en ciertos casos producen una suerte de collages o pastiches, que, según el diccionario de la RAE, no son lo mismo. Un collage es una obra —literaria, musical o visual— que combina elementos diversos. Un pastiche, en cambio, es una imitación que toma rasgos distintivos de una obra ajena, mezclándolos de modo que parezca original, aunque no lo sea.

Podemos pensar que estas disquisiciones semánticas que hace el diccionario son irrelevantes en el ámbito del diseño y uso de la IA, pero hay que tener cuidado con las que hace el Código Penal.