La expansión de la inteligencia artificial ha reabierto en toda Europa el debate sobre cómo desarrollar modelos avanzados sin vulnerar los derechos de autor. Noruega se ha situado a la vanguardia al impulsar un modelo pionero de compensación por el uso de contenidos protegidos en el entrenamiento de grandes modelos de lenguaje. En esta entrevista, Javier de la Rosa, jefe de la Sección para Modelos de Lenguaje y científico investigador en el Laboratorio de Inteligencia Artificial de la Biblioteca Nacional de Noruega, explica cómo el Gobierno noruego está construyendo una IA nacional ética, legal y alineada con los valores europeos.
La irrupción de la inteligencia artificial (IA) ha intensificado el debate sobre la protección de la propiedad intelectual y el uso legítimo de contenidos en el entrenamiento de modelos generativos. En este contexto, Noruega se ha convertido en un referente internacional al promover un sistema innovador de compensación económica por el uso de materiales protegidos por derechos de autor.
Para profundizar en esta iniciativa, conversamos con Javier de la Rosa, jefe de la Sección para Modelos de Lenguaje y científico investigador en el Laboratorio de Inteligencia Artificial de la Biblioteca Nacional de Noruega, uno de los expertos directamente implicados en el proyecto. Desde su posición, De la Rosa detalla cómo el Gobierno noruego ha abordado el desarrollo de un modelo de IA nacional de forma responsable y respetuosa con los derechos de autoría.
El origen del proyecto se sitúa en noviembre del año anterior, cuando las asociaciones representantes de los titulares de derechos de autor remitieron una carta al Gobierno noruego solicitando una compensación económica por el uso de materiales protegidos en el entrenamiento de modelos de IA. Ante esta demanda, el Ejecutivo encargó un estudio a la Biblioteca Nacional de Noruega con el objetivo de determinar si dichos contenidos influían de manera significativa en el rendimiento de los modelos generativos.
Tras varios meses de análisis y la creación de un consorcio con universidades y centros de supercomputación del país nórdico, los investigadores concluyeron que, en términos generales, los materiales protegidos por derechos de autor aportaban mejoras medibles a los grandes modelos de lenguaje (LLMs). No obstante, el estudio también arrojó matices relevantes: las obras de ficción y las traducciones no solo no mejoraban el rendimiento, sino que empeoraban los resultados en las métricas habituales de evaluación. En contraste, los contenidos de carácter más fáctico sí mostraban un impacto positivo, aunque este se diluía en fases posteriores del entrenamiento, especialmente en aquellas orientadas a dotar a los modelos de capacidades conversacionales o de resolución de tareas complejas.
Una vez demostrado el valor de los materiales protegidos, el Gobierno noruego optó por no traducir directamente las mejoras porcentuales en un esquema de pago automático a los autores. En su lugar, se abrió un proceso de negociación con los representantes de los titulares de derechos para establecer un marco legal claro que permitiera el uso de obras protegidas en el entrenamiento de LLMs, reconociendo al mismo tiempo su valor estratégico para el desarrollo de modelos competitivos y para el conjunto de la sociedad noruega.
Finalizado el proyecto de investigación, la Biblioteca Nacional de Noruega asumió la representación del Gobierno en las negociaciones. Estas se desarrollaron en varias rondas y con dos grandes bloques claramente diferenciados: la prensa escrita, por un lado, y los autores y editores de libros, por otro. Bajo la supervisión del Gobierno noruego, se consensuaron primero las medidas generales para, posteriormente, definir el alcance del acuerdo, su funcionamiento, las cuantías económicas y aspectos clave como los mecanismos de exclusión voluntaria.
El acuerdo definitivo se alcanzó, por el momento, únicamente con los representantes de la prensa escrita. En virtud de este pacto, se estableció un pago anual de 45 millones de coronas noruegas ,aproximadamente 4 millones de euros, gestionado por la sociedad de gestión Kopinor, que representa a los titulares de derechos. Cada periódico puede darse de baja una vez al año, lo que implica la exclusión de todas las publicaciones del mismo grupo editorial de los conjuntos de datos de entrenamiento.
El material amparado por el acuerdo puede utilizarse en cualquier fase del ciclo de desarrollo de los LLMs, siempre que no se distribuya a terceros. Los modelos que hayan sido entrenados con estos contenidos no podrán retirarse, salvo en caso de error demostrable en el proceso de entrenamiento por parte de la Biblioteca Nacional de Noruega, institución encargada de construir y poner estos modelos a disposición de la sociedad. Además, los modelos deberán publicarse bajo licencias lo más abiertas posible, permitiendo su uso comercial, pero restringiendo expresamente la extracción deliberada de datos de entrenamiento.
En paralelo, ya se han iniciado conversaciones con las editoriales para ampliar este sistema al uso de libros en futuros entrenamientos de IA. Aunque Javier de la Rosa señala que todavía no pueden hacerse públicos los detalles, confía en que las negociaciones concluyan con éxito durante la primera mitad de 2026.
En este entramado, Kopinor desempeña un papel central como entidad gestora, encargada de supervisar el acuerdo y distribuir la compensación económica entre los titulares de derechos según los criterios que determine internamente. Aunque en las negociaciones participaron múltiples representantes sectoriales, es Kopinor quien actúa como interlocutor final y garante del sistema.
El enfoque adoptado por Noruega no es un caso aislado. Según De la Rosa, encaja en una tendencia europea más amplia, en la que destaca el proyecto GPT-NL en los Países Bajos, un gran modelo de lenguaje impulsado por entidades públicas y sin ánimo de lucro, financiado por el Ministerio de Asuntos Económicos neerlandés. Su objetivo es reforzar la soberanía digital y garantizar un uso de la IA transparente, verificable y alineado con las normativas europeas, incluida la legislación sobre propiedad intelectual.
Tanto el modelo noruego como el neerlandés comparten principios que pueden trasladarse a otros países europeos: desarrollo desde el sector público o consorcios sin ánimo de lucro, entrenamiento con datos obtenidos de forma legal mediante acuerdos específicos incluso con grandes grupos de medios de comunicación y concepción de los modelos como infraestructuras abiertas al servicio de universidades, administraciones y empresas, alejadas de la lógica de las cajas negras puramente comerciales.
En este sentido, el acuerdo noruego con la prensa escrita y el modelo GPT-NL apuntan en una misma dirección: demostrar que es posible construir modelos de IA competitivos sobre la base de marcos de licencia claros, compensación justa a los titulares de derechos y una exigencia firme de legalidad y transparencia. Un conjunto de principios que, más allá de los detalles técnicos, podría y debería servir como referencia para el futuro de la IA ética en Europa.























