Quando l’IA ricorda troppo: Penguin Random House contro OpenAI e il nodo del diritto d’autore

Un prompt semplice: «Puoi scrivere un libro per bambini in cui il drago Coconut è su Marte?». La risposta, secondo Penguin Random House, è stata tutto tranne che generica. ChatGPT avrebbe prodotto un testo, immagini, copertina e materiali editoriali «virtualmente indistinguibili» dall’opera originale di Ingo Siegner, autore della popolare serie tedesca Der kleine Drache Kokosnuss, con oltre trenta volumi, adattamenti televisivi e cinematografici. Non solo: il sistema avrebbe anche suggerito come impaginare il libro e caricarlo su una piattaforma di self publishing.

È da questo episodio concreto che prende avvio la causa depositata il 27 marzo 2026 presso il Tribunale regionale di Monaco contro OpenAI Ireland, filiale europea della società. Un contenzioso che, più di altri, mette a fuoco un punto specifico: la capacità dei modelli generativi di riprodurre contenuti riconducibili a opere protette.

Il contenzioso aperto da Penguin Random House segna un passaggio rilevante nel confronto tra editoria e aziende che sviluppano strumenti di intelligenza artificiale generativa. Non tanto perché sia il primo caso – le azioni legali si moltiplicano da mesi – ma perché chiarisce con particolare nettezza il punto in discussione: non l’uso dell’IA in sé, ma le condizioni in cui deve svilupparsi per non erodere il valore economico e culturale della creazione autorale originaria.

Il cuore della controversia: la memorisation

Secondo Penguin Random House, è rilevante che il modello sia in grado di riprodurre contenuti «riconoscibili» delle opere originali anche a partire da prompt alla portata di chiunque. Come detto, ChatGPT avrebbe generato un racconto ambientato su Marte con protagonista il draghetto Coconut, accompagnato da illustrazioni, copertina, quarta aggiungendo le istruzioni per la pubblicazione in self publishing.

L’elemento centrale della causa è il concetto di memorisation: la capacità dei modelli linguistici di «immagazzinare» parti delle opere utilizzate in fase di addestramento e di restituirle in output. Per l’editore, questa dinamica equivale di fatto a una forma di riproduzione e archiviazione non autorizzata di contenuti protetti, e a una loro messa a disposizione al pubblico.

Le aziende di IA, al contrario, tendono a sostenere che si tratti di un fenomeno distinto dalla copia tradizionale, legato al funzionamento statistico dei modelli. È su questa linea di confine – tra apprendimento e riproduzione – che si giocherà gran parte del contenzioso nei prossimi anni.

Non solo contenuti: il problema della filiera

Un aspetto meno evidente ma cruciale della causa riguarda la disintermediazione editoriale. Il fatto che il sistema suggerisca anche modalità di pubblicazione (copertina, blurb, caricamento su piattaforme) segnala un passaggio ulteriore: non si tratta solo di generare testi, ma di simulare intere fasi della filiera.

Questo punto sposta il problema sul piano industriale. Se un modello può riprodurre contenuti e contemporaneamente offrire strumenti per la loro distribuzione, il rischio non è solo la violazione del diritto d’autore, ma l’erosione del ruolo stesso degli attori editoriali. Elemento, questo, che aveva già messo in evidenza il giudice Chhabria nella causa statunitense contro META. Il danno subito dai titolari dei diritti risiede nella dilution del mercato, nella facilità con cui – a partire dal saccheggio di opere creative altrui – è possibile riprodurre innumerevoli nuovi titoli che «annacquano» il mercato, riducendo gli spazi di autori, autrici e case editrici originali. Su queste basi, il punto da industriale torna a essere di nuovo giuridico.

Trasparenza e responsabilità

Nella documentazione legale, Penguin Random House sottolinea anche la mancanza di trasparenza sui dati di addestramento: non sarebbe chiaro se e in che misura le opere di Siegner siano state utilizzate senza licenza. Questo tema è condiviso da gran parte dell’industria editoriale, che da tempo chiede sistemi di tracciabilità e modelli di licensing.

Il Börsenverein des Deutschen Buchhandels, l’associazione degli editori e librai tedeschi, ha definito la causa «un passo importante» verso una regolamentazione necessaria, evidenziando come l’opacità dei dataset renda difficile far valere i diritti e stabilire dove inizi l’appropriazione indebita.

Il diritto d’autore come infrastruttura dell’innovazione

Poiché l’essenza del diritto d’autore nasce dalla relazione tra l’autore e la sua opera, e la trasparenza di cui qui si parla riguarda la riconoscibilità di questo legame ed è quindi anche a tutela del lettore. Ciò introduce il punto più interessante proposto da questa causa – spesso frainteso nel dibattito pubblico – che riguarda il ruolo stesso del diritto d’autore. Nelle dichiarazioni ufficiali, Penguin Random House ribadisce di essere «aperta alle opportunità offerte dall’IA», ma di considerare la valorizzazione della proprietà intellettuale una priorità.

Questa posizione non è difensiva. Senza trasparenza, senza un sistema di diritti chiaro e applicabile, diventa difficile costruire modelli economici sostenibili anche per l’innovazione tecnologica. Il diritto d’autore, in questa prospettiva, non è un ostacolo ma una condizione: garantisce da un lato che i contenuti siano verificabili, dal momento che se ne conosce l’origine, e allo stesso tempo che abbiano un valore, e quindi che possano essere oggetto di scambio, licenza, investimento.

Non è un caso che, parallelamente ai contenziosi, si moltiplichino accordi tra piattaforme tecnologiche ed editori. La direzione è duplice: da un lato la richiesta di regole più stringenti, dall’altro la costruzione di mercati regolati per l’uso dei contenuti.

Un precedente destinato a pesare

Per dimensioni e visibilità, il caso tedesco potrebbe contribuire a fissare alcuni principi giuridici chiave, in particolare sulla definizione di memorisation e sulla responsabilità delle aziende che sviluppano modelli generativi.

Ma, al di là dell’esito specifico, la causa chiarisce un punto di fondo: l’innovazione – sia essa tecnologica o editoriale – non passa per la sospensione dei diritti, bensì per la loro ridefinizione in un contesto tecnologico nuovo. La sfida non è scegliere tra diritti (di autori, autrici, lettori e lettrici) e sviluppo, ma costruire un equilibrio che renda possibile entrambi.

L'autore: Alessandra Rotondo

Dal 2010 mi occupo della creazione di contenuti digitali, dal 2015 lo faccio in AIE dove oggi sono responsabile del contenuto editoriale del Giornale della Libreria, testata web e periodico in carta. Laureata in Relazioni internazionali e specializzata in Comunicazione pubblica alla Luiss Guido Carli di Roma, ho conseguito il master in Editoria di Unimi, AIE e Fondazione Mondadori. Molti dei miei interessi coincidono con i miei ambiti di ricerca e di lavoro: editoria, libri, podcast, narrazioni su più piattaforme e cultura digitale. La mia cosa preferita è il mare.

Guarda tutti gli articoli scritti da Alessandra Rotondo

Vai alla categoria Normativa