La storica Encyclopedia Britannica ha deciso di passare alle vie legali contro OpenAI, presentando un ricorso presso il tribunale federale di Manhattan insieme alla sua controllata Merriam-Webster. Al centro della disputa c'è l'accusa di violazione massiccia del copyright: secondo la denuncia, OpenAI avrebbe utilizzato quasi centomila articoli dell'enciclopedia e migliaia di definizioni dal celebre dizionario per alimentare l'addestramento dei suoi modelli di intelligenza artificiale generativa, in particolare la famiglia GPT che alimenta ChatGPT.

Nella documentazione presentata in tribunale, Britannica sostiene che gli utenti di ChatGPT ricevono spesso risposte che riproducono in modo parziale o integrale il contenuto dell'enciclopedia e del dizionario, senza che venga fornito alcun rinvio alle fonti originali. Questo meccanismo, diverso da quello dei motori di ricerca tradizionali, comporterebbe un danno economico considerevole all'azienda californiana, che vedrebbe diminuire il traffico verso i propri siti web proprio perché gli utenti trovano le risposte direttamente nell'assistente AI.

La causa include anche un'accusa di violazione dei marchi registrati: Britannica sostiene che ChatGPT fornisce frequentemente risposte imprecise e fuorvianti, quelle che nel gergo del settore vengono chiamate "allucinazioni", e che questi errori vengono erroneamente associati all'autorevolezza dell'enciclopedia. Nel ricorso, Britannica chiede un risarcimento danni e un'ingiunzione permanente che impedisca a OpenAI di continuare a utilizzare i suoi contenuti. Questo contenzioso si inserisce in una serie molto più ampia di cause intentate da editori, autori e altre società titolari di diritti d'autore contro i principali sviluppatori di modelli AI negli ultimi mesi, con accuse praticamente identiche.

Dalla sua parte, OpenAI respinge le accuse e difende la propria pratica ricorrendo alla dottrina del "fair use", un principio del diritto statunitense che consentirebbe l'utilizzo di materiale protetto da copyright a scopi educativi, non commerciali e trasformativi. "I nostri modelli promuovono l'innovazione, sono addestrati su dati disponibili pubblicamente e operano in conformità ai principi del fair use", ha dichiarato un portavoce dell'azienda, sottolineando inoltre come ChatGPT contribuisca all'avanzamento della ricerca scientifica e al miglioramento della vita quotidiana di centinaia di milioni di persone.

Tuttavia, il concetto di fair use rimane fortemente contestato nel contesto dell'intelligenza artificiale generativa. Le aziende del settore lo rivendicano sistematicamente, ma sarà la magistratura a stabilire se questa interpretazione regge dal punto di vista legale. A meno che le parti non raggiungano un accordo stragiudiziale, come accaduto in altri casi, il tribunale federale di Manhattan avrà il compito di definire i confini tra l'utilizzo lecito dei dati pubblici e la violazione vera e propria del copyright nell'era dell'IA. Una decisione che potrebbe avere implicazioni significative per l'intero settore.