Il colosso tecnologico di Mark Zuckerberg si trova al centro di una battaglia legale complessa e dalle implicazioni enormi: Meta avrebbe utilizzato milioni di volumi protetti da copyright, prelevati da archivi digitali illegali come Anna's Archive e Z-Library, per istruire i propri modelli di intelligenza artificiale, in particolare Llama. La pratica è ormai comune nell'industria del machine learning, ma il caso Meta ha assunto contorni particolarmente controversi dopo che l'azienda è stata scoperta a scaricare anche materiale pornografico piratato. La class-action intentata in California vede tra i ricorrenti personalità di spicco come lo scrittore Richard Kadrey, la comica Sarah Silverman e il romanziere Christopher Golden.
Negli ultimi mesi il tribunale californiano ha già espresso un primo giudizio: secondo il magistrato, l'impiego di testi acquisiti illegalmente per l'addestramento del modello Llama rientrerebbe nella dottrina del "fair use", ossia l'uso legittimo di materiale coperto da diritti d'autore senza consenso, a condizione che sia trasformativo e non sostituisca l'opera originale. Questa interpretazione riflette la legislazione americana, assai diversa da come la questione verrebbe affrontata nei sistemi legali europei, compreso quello italiano, dove il verdetto avrebbe probabilmente preso una piega completamente differente.
Ma il capitolo è tutt'altro che concluso. Meta non si è limitata a scaricare libri proibiti: li ha acquisiti utilizzando protocolli torrent, il che significa che durante il download l'azienda ha contemporaneamente funzionato come nodo della rete, ridistribuendo i file a innumerevoli altri utenti. Non si tratta dunque di semplice consumo di materiale illegale, bensì di partecipazione attiva alla distribuzione di massa di contenuti piratati, un aspetto che travalica significativamente le limitazioni etiche e legali del fair use tradizionale.
Di fronte a queste evidenze, Meta ha presentato una difesa tanto audace quanto discutibile: sostiene che anche l'upload involontario dei file verso altri utenti della rete torrent costituirebbe un uso lecito e giustificato. La logica che l'azienda propone è singolare: poiché torrent rappresentava l'unico metodo efficiente per ottenere i dataset completi, e poiché questi dataset erano indispensabili per l'addestramento del modello, ne conseguirebbe che ogni aspetto tecnico del processo, inclusa la redistribuzione indesiderata, dovrebbe rientrare nella protezione del fair use. È una posizione che sfida le interpretazioni consolidate della legge americana e che potrebbe diventare il precedente per altre cause simili già in gestazione nell'industria tech.
La sentenza finale potrebbe ridefinire completamente il modo in cui le aziende tecnologiche si comportano nell'acquisizione di dati per l'IA. Se Meta ottenesse ragione con questa interpretazione allargata del fair use, aprirebbe la strada a una nuova categoria di violazioni del copyright considerate accettabili quando funzionali al "bene superiore" dell'innovazione artificiale. Al contrario, una condanna significativa potrebbe costringere l'industria a rivedere radicalmente le proprie metodologie di addestramento, spingendo verso licenze autorizzate e accordi con gli autori.