Così il New York Times guida la rivolta del giornalismo di qualità contro le “allucinazioni” dell’intelligenza artificiale

L’accusa è che la Generative AI minacci il giornalismo di alta qualità in un periodo di crisi del settore e di aumento della disinformazione

La prima cosa che salta agli occhi, scorrendo le 69 pagine dell’atto “The New York Times contro Microsoft e OpenAI”, è la semplicità del linguaggio utilizzato dagli avvocati. Ciò denota la volontà di spiegare ai giudici – quindi a persone non esperte di tecnologia – gli aspetti più sottili della rivoluzione portata dall’intelligenza artificiale generativa (anche) nel giornalismo. Solo le ultime pagine della memoria sono dedicate alle questioni più tecniche: richiesta di danni ed elenco formale delle contestazioni.

Inutile dire che vi siano tanti motivi per analizzare questo documento sin nei minimi dettagli: quando si muove in giudizio il New York Times è facile finire davanti alla Corte suprema, con questioni talmente controverse da toccare il cuore del sistema giudiziario e costituzionale americano. In questo caso, però, al centro della causa non abbiamo il “classico” Primo emendamento, la libertà di manifestazione del pensiero o l’aspettativa di privacy dei personaggi pubblici, ma il futuro del giornalismo, della concorrenza, del mercato e del copyright nella società digitale.

Giornalismo contro ChatGPT

L’atto ripercorre, tratteggiando due mondi paralleli, e in conflitto tra loro, la storia del giornalismo indipendente e l’avvento di ChatGPT e dell’intelligenza artificiale generativa. Li contrappone sotto ogni aspetto, come cane e gatto: la funzione sociale, l’impatto economico, i guadagni, il lavoro alla base della creazione dei contenuti, la fruibilità delle notizie da parte dei lettori in un’era di approcci nuovi alla lettura e alla “digeribilità” dei contenuti online.

Ne esce un quadro affascinante, in alcuni passaggi triste, che sembra annunciare la morte anche del tanto studiato sistema del “pagamento ad articolo” portato avanti non solo dal New York Times ma da altre realtà in tutto il mondo.

In estrema sintesi, l’azione legale prende di mira due big: Microsoft, in primis, e, poi, tutte le società che compongono la galassia di OpenAI, nota produttrice di ChatGPT.

Distruggere la fiducia

L’esordio degli avvocati è diretto: OpenAI starebbe distruggendo l’idea stessa di “giornalismo affidabile” per come si è evoluta nei 170 anni di attività del quotidiano, rubando e usando illegalmente tutto il lavoro sinora svolto, al fine di creare prodotti generati dall’intelligenza artificiale che fanno concorrenza e impediscono di continuare a offrire il servizio.

Il primo termine interessante che viene usato è “compete”, concorrenza (sleale): i Large Language Models starebbero “cannibalizzando” tutti i contenuti del quotidiano, copiandoli da milioni di testi per, poi, generare contenuti simili, dello stesso tenore, che portano i lettori a evitare il NYTimes perché già soddisfatti di questa “prima informazione” ricevuta. Non solo: i contenuti del NYTimes sarebbero quelli più utilizzati, vista la loro autorevolezza, e sarebbero diventati i principali “ingredienti” in questo calderone di informazioni finite nel dataset della AI.

Il primo richiamo normativo è legato alla Costituzione degli Stati Uniti e al Copyright Act: il garantire ai creatori di contenuti diritti esclusivi sui frutti del loro lavoro è l’unico modo per garantire il fiorire di un giornalismo di qualità.

Il sistema alla base di ChatGPT andrebbe contro questi principi: la AI si nutre di contenuti altrui per generare un output che scimmiotta i testi originali e li imita.

L’atto pratico

Nel documento, questo processo viene dimostrato con tanti esempi, sia su ChatGPT, sia su Bing. I più suggestivi sono tre: ChatGPT che restituisce un contenuto identico a un articolo del NYTimes; ChatGPT che restituisce un contenuto perfettamente sintetizzato; ChatGPT che - udite udite - restituisce un contenuto “estratto” dal paywall del quotidiano, permettendone la lettura anche ai non abbonati.

Un simile saccheggio di contenuti avrebbe portato enormi profitti, e capitalizzazione, alle società coinvolte, senza nulla corrispondere al NYTimes.

I contatti tra le parti, avvenuti nei mesi scorsi per cercare un accordo, non sono andati a buon fine. Microsoft e OpenAI hanno insistito che il loro comportamento rientrasse nel “fair use”: l’allenamento, in questo modo, del loro sistema di AI porterebbe infatti a nuovi contenuti “trasformati”. Non c’è nulla di “trasformativo”, sostiene invece l’accusa, se questi contenuti non si pagano e se si rubano lettori.

L’economia dello shopping

Interessante anche il fatto che, accanto ai contenuti celebri del NYTimes, siano portati all’attenzione dei giudici testi per alcuni versi più “leggeri” (ad esempio: recensioni di prodotti) che sono, però, di grandissimo successo in rete e legati al mondo dello sport, del cibo, delle ricette, dei giochi e delle “raccomandazioni per lo shopping”. Questi ultimi, si rifletta, sono contenuti importantissimi da un punto di vista economico: nei testi sono inclusi dei link ai negozi, o ai prodotti, che una volta “mangiati” e rielaborati dai sistemi di AI scompaiono e non generano più valore.

L’accusa, in sintesi, è che la Generative AI minacci questo tipo di giornalismo di alta qualità, per di più in un periodo di crisi del settore, di chiusura di tante testate e di aumento della disinformazione. Occorrerebbe, pertanto, la protezione di questo patrimonio di proprietà intellettuale, e il copyright è l’unica norma che lo può garantire.

Allucinazioni artificiali

Accanto alla disseminazione illegale di testi, vi è anche il problema delle informazioni false riferibili al quotidiano. A pagina 52 si descrivono le “allucinazioni” tipiche di sistemi di questo tipo: vengono attribuiti contenuti al NYTimes che, in realtà, non sono di loro proprietà. Il sistema, invece di rispondere “non so” a una domanda, crea interi paragrafi di fantasia e li attribuisce al quotidiano.

La parte finale dell’atto, si diceva, è quella più processuale: viene fatto l’elenco dei profitti, delle perdite economiche, e delle accuse.

Se il giudizio andrà avanti, e non ci saranno accordi, saranno numerosi i punti che finiranno in aula: la violazione del copyright, in tutti i suoi aspetti, diretti e indiretti, con il concorso di Microsoft, la rimozione degli avvisi previsti per legge da materiale protetto e la violazione dei principi di concorrenza, con contenuti simili, a volte identici, offerti agli utilizzatori dell’AI generativa. Non è domandato, nell’atto, un risarcimento specifico, ma si parla di “miliardi di dollari”, e si chiede una quantificazione esatta in processo.

Giovanni Ziccardi

Professore di Informatica giuridica all’Università di Milano