L’intelligenza artificiale continua a spostare i confini del diritto d’autore negli Stati Uniti. Un giudice della corte distrettuale della california settentrionale ha stabilito che Anthropic, azienda concorrente di OpenAI e Google, può utilizzare libri coperti da copyright per addestrare il suo chatbot Claude, purché questi testi siano stati legalmente acquistati. La sentenza si basa sul principio del “fair use” previsto dalla legge americana e apre una nuova fase nel confronto tra tecnologia e tutela delle opere culturali.
La decisione del giudice alsup sulla formazione dei modelli linguistici
Il giudice William Alsup ha paragonato l’addestramento delle intelligenze artificiali al modo in cui gli esseri umani apprendono leggendo libri. Secondo la sua interpretazione, usare testi protetti da copyright per insegnare a un modello linguistico non viola automaticamente i diritti degli autori se rientra nel fair use, cioè un uso lecito limitato previsto dalla legge sul diritto d’autore statunitense. Questa pronuncia riguarda specificamente il chatbot Claude sviluppato da Anthropic.
Come è stato utilizzato il materiale protetto
Anthropic aveva acquisito copie digitali di libri protetti da copyright tramite acquisti regolari, poi ne aveva scannerizzato le pagine creando una biblioteca digitale destinata all’addestramento dell’intelligenza artificiale. Il tribunale ha riconosciuto che questo processo rientra nella categoria di usi consentiti dalla normativa vigente e non costituisce una violazione immediata dei diritti degli autori.
La class action degli autori contro anthropic e le accuse di copia illegale
La sentenza arriva dopo una class action promossa dagli scrittori Andrea Bartz, Charles Graeber e Kirk Wallace Johnson che hanno accusato Anthropic di aver copiato illegalmente i loro libri per alimentare Claude senza autorizzazione né compenso adeguato. Gli autori sostenevano che questa pratica danneggiasse economicamente chi produce contenuti originali.
Distinzione tra addestramento e copia pirata
Il tribunale però ha distinto fra l’utilizzo dei testi nell’ambito dell’addestramento — considerato legittimo — e la copia materiale pirata delle opere stesse: quest’ultima è stata riconosciuta come violazione del diritto d’autore a prescindere dal successivo impiego nei modelli IA. Pertanto si procederà con un processo separato dedicato ai danni causati dalle copie abusive.
Implicazioni legali ed economiche della sentenza nel mondo dell’intelligenza artificiale
Questa decisione potrebbe rappresentare un precedente importante in un momento storico in cui molte aziende tecnologiche investono nello sviluppo dei large language models basandosi su enormi quantità di dati testuali provenienti anche da opere protette dal copyright. Il via libera all’utilizzo sotto condizioni precise offre alle società maggiore chiarezza sui limiti entro cui operare senza incorrere in sanzioni penali o civili immediate.
Posizioni di anthropic e prospettive future
Anthropic ha espresso soddisfazione per il riconoscimento giuridico ottenuto ma contesta ancora alcune parti della sentenza relative alle copie pirata utilizzate durante l’attività formativa: l’impresa sta valutando azioni legali successive per tutelarsi contro queste accuse specifiche. Intanto resta aperto il dibattito sulle modalità più corrette ed equilibrate con cui bilanciare innovazione tecnologica e rispetto delle creazioni letterarie o artistiche originali.
Gli sviluppatori dovranno quindi prestare attenzione alla provenienza dei materiali impiegati nell’apprendimento automatico evitando pratiche illegali ma potendo contare su margini normativi più definiti rispetto al passato nelle procedure autorizzate dall’autorità giudiziaria americana sulla base del fair use previsto dal copyright statunitense.