Antropico ha concordato un accordo da 1,5 miliardi di dollari con gli autori in un caso di copyright di riferimento, segnando uno dei primi e più grandi pagamenti legali dell’era dell’IA.
La startup AI ha accettato di pagare agli autori di circa $ 3.000 per libro per circa 500.000 opere, dopo che è stato accusato di scaricare milioni di testi piratati dalle biblioteche di Shadow per addestrare il suo modello linguistico di grandi dimensioni, Claude. Come parte dell’accordo, Antropico distruggerà anche i dati, è stato accusato di acquisire illegalmente.
La startup di intelligenza artificiale in rapida crescita ha annunciato all’inizio di questa settimana di aver appena raccolto altri $ 13 miliardi in nuovi finanziamenti per il capitale di rischio in un accordo che ha valutato la società a $ 183 miliardi. Ha anche affermato che è attualmente in procinto di generare entrate almeno $ 5 miliardi nei prossimi 12 mesi. L’insediamento equivale a quasi un terzo di quella cifra o più di un decimo del nuovo finanziamento antropico appena ricevuto.
Sebbene l’insediamento non stabilisca un precedente legale, gli esperti hanno affermato che probabilmente servirà da cifra di ancoraggio per l’importo che altre grandi società di intelligenza artificiale dovranno pagare se sperano di risolvere simili cause di violazione del copyright. Ad esempio, un certo numero di autori stanno facendo causa Meta per usare i loro libri senza permesso. Come parte di quella causa, Meta è stata costretta a divulgare e -mail della società interna che suggeriscono che usavano consapevolmente una biblioteca di libri piratati chiamati libgen, che è una delle stesse biblioteche che Antropico ha usato. Openi e il suo partner Microsoft stanno anche affrontando una serie di casi di violazione del copyright, incluso uno depositato dall’autore Gilda.
Aparna Sridhar, vice consigliere generale di Antropico, ha detto Fortuna in una dichiarazione: “A giugno, il tribunale distrettuale ha emesso una sentenza di riferimento sullo sviluppo dell’intelligenza artificiale e sulla legge sul copyright, scoprendo che l’approccio di Antropico alla formazione dei modelli di intelligenza artificiale costituisce un uso equo. La soluzione di oggi, se approvata, risolverà le restanti richieste di eredità dei querelanti.
Un avvocato per gli autori che ha fatto causa ad Antropic ha affermato che l’insediamento avrebbe avuto impatti di vasta portata.
“Questo insediamento di riferimento supera di gran lunga qualsiasi altro recupero di copyright noto. È il primo del suo genere nell’era dell’IA. Fornirà un risarcimento significativo per ogni lavoro di classe e imposterà un precedente che richiede alle società di intelligenza arti Bartz et al. v. PBC antropicoha detto in una dichiarazione. “Questo insediamento invia un messaggio potente a aziende e creatori di intelligenza artificiale che è sbagliato prendere opere protette da copyright da questi siti Web di pirata.”
Il caso, che originariamente sarebbe stato processato a dicembre, avrebbe potuto esposto antropico a danni fino a $ 1 trilione se il tribunale ha scoperto che la società ha violato volontariamente la legge sul copyright. Il professore di Santa Clara, Ed Lee, ha affermato che se Antropic avesse perso il processo, potrebbe avere “almeno il potenziale per la responsabilità di fine business”. Antropico essenzialmente concordò con la conclusione di Lee, scrivendo in un tribunale che sentiva una “pressione eccessiva” per risolvere il caso date le dimensioni dei potenziali danni.
L’antropico a rischio di fronte a dipendere dai mezzi che aveva usato per ottenere i libri protetti da copyright, piuttosto che sul fatto che avevano usato i libri per addestrare l’IA senza il permesso esplicito dei detentori del copyright. A luglio, il giudice del tribunale distrettuale degli Stati Uniti William Alsup, ha stabilito che l’uso di libri protetti da copyright per creare un modello di intelligenza artificiale costituiva un “fair use” per il quale non era richiesta alcuna licenza specifica.
Ma Alsup si è poi concentrato sull’accusa secondo cui Antropico aveva usato le biblioteche digitali di libri piratati per almeno alcuni dei dati che ha alimentato i suoi modelli di intelligenza artificiale, piuttosto che acquistare copie dei libri legalmente. Il giudice ha suggerito in una decisione che consente al caso di andare al processo che era propenso a vedere questo come violazione del copyright, indipendentemente da ciò che Antropico ha fatto con le biblioteche piratate.
Semplificando il caso, Antropico ha educato un rischio esistenziale per la sua attività. Tuttavia, l’insediamento è significativamente più alto di quanto alcuni esperti legali stessero prevedendo. La mozione sta ora cercando l’approvazione preliminare di quella che si afferma di essere “la più grande ripresa del copyright pubblica nella storia”.
James Grimmelmann, professore di legge presso la Cornell Law School e Cornell Tech, lo ha definito un “modesto insediamento”.
“Non cerca di risolvere tutte le questioni relative al copyright sull’intelligenza artificiale generativa. Invece, si concentra su ciò che il giudice Alsup pensava fosse l’unica cosa egregiamente ingiusta che Antropica ha fatto: scaricare libri in blocco dalle biblioteche d’ombra piuttosto che acquistare copie e scansionarle da sola. Il pagamento è sostanziale, ma non così grande da minacciare la viabilità antropica o la posizione competitiva”, ha detto Fortuna.
Ha detto che l’insediamento aiuta a stabilire che le aziende di intelligenza artificiale devono acquisire legittimamente i loro dati di formazione, ma non risponde ad altre domande sul copyright che devono affrontare le società di intelligenza artificiale, come ciò che devono fare per impedire ai loro modelli generativi di intelligenza artificiale di produrre risultati che violano il copyright. In diversi casi ancora in sospeso contro le società di intelligenza artificiale, incluso un caso Il New York Times ha presentato contro Openi e un caso che lo studio cinematografico Warner Brothers ha presentato proprio questa settimana contro Midjourney, un’azienda che rende l’IA in grado di generare immagini e video: i detentori del copyright sostengono che i modelli AI hanno prodotto output identici o sostanzialmente simili
“La recente vestita di Warner Bros. contro Midjourney, ad esempio, si concentra su come Midjourney può essere usato per produrre immagini di supereroi DC e altri personaggi protetti da copyright”, ha detto Grimmelmann.
Mentre gli esperti legali affermano che l’importo è gestibile per un’impresa delle dimensioni di antropici, Luke McDonagh, professore associato di legge presso LSE, ha affermato che il caso potrebbe avere un impatto a valle su società di intelligenza artificiale più piccole se stabilisce un commercio precedente per affermazioni simili.
“La cifra di $ 1,5 miliardi, in quanto importo complessivo dell’insediamento, indica il tipo di livello che potrebbe risolvere alcuni degli altri casi di copyright di AI. Potrebbe anche indicare la strada per le licenze di opere di copyright per la formazione dell’IA”, ha detto Fortuna. “Questo tipo di somma – $ 3.000 per lavoro – è gestibile per un’azienda valutata tanto quanto antropica e le altre grandi aziende di intelligenza artificiale. Potrebbe essere meno per le aziende più piccole. ”
Un’azienda precedente per altre aziende di intelligenza artificiale
Cecilia Ziniti, avvocato e fondatrice della società di AI legale GC AI, ha affermato che l’insediamento è stato un momento “Napster to iTunes” per l’IA.
“Questo insediamento segna l’inizio di un’evoluzione necessaria verso un legittimo schema di licenze basato sul mercato per la formazione dei dati”, ha affermato. Ha aggiunto che l’insediamento potrebbe segnare “l’inizio di un ecosistema più maturo e sostenibile in cui i creatori sono compensati, proprio come il modo in cui l’industria musicale si è adattata alla distribuzione digitale”.
Ziniti ha anche osservato che le dimensioni dell’insediamento possono costringere il resto del settore a diventare più seri riguardo alle licenze di opere protette da copyright.
“L’argomento secondo cui è troppo difficile tracciare e pagare per i dati di formazione è un’aringa rossa perché a questo punto abbiamo abbastanza accordi per dimostrare che si può fare”, ha detto, indicando che le pubblicazioni di notizie, tra cui Axel Springer e Vox, sono entrate con Openai. “Questo accordo spingerà le altre società di intelligenza artificiale al tavolo dei negoziati e accelererà la creazione di un vero mercato per i dati, probabilmente coinvolgendo autenticazione API e modelli di condivisione delle entrate.”