Salta al contenuto

Apple, Anthropic e altre aziende hanno utilizzato video di YouTube per addestrare l'intelligenza artificiale

Questa pagina contiene un riassunto del seguente articolo:

Apple, Anthropic, and other companies used YouTube videos to train AI
YouTube has previously said AI training would violate its terms.
43%
del testo originale
3
minuti risparmiati

Riassunto

Le indagini condotte da Proof News in collaborazione con Wired hanno rivelato che sono stati utilizzati oltre 170.000 video di YouTube per addestrare i sistemi AI appartenenti alle maggiori aziende tecnologiche, tra cui Apple, Anthropic, Nvidia e Salesforce.

Queste aziende hanno impiegato i transcript di YouTube, estratti senza autorizzazione, come dataset per migliorare i modelli di intelligenza artificiale.

Il dataset comprende transcript da oltre 48.000 canali, tra cui quelli di creatori popolari come MrBeast e Marques Brownlee, oltre che da testate giornalistiche come ABC News, BBC e The New York Times.

Proof News ha anche rilasciato uno strumento interattivo per verificare se i propri contenuti sono stati inclusi nel dataset. 

Marques Brownlee, noto anche come MKBHD, ha dichiarato su X: “Apple ha ottenuto dati per la loro AI da diverse fonti. Una di queste ha racimolato un'enorme quantità di dati e trascrizioni dai video di YouTube, inclusi i miei. Questo sarà un problema in evoluzione per molto tempo”.

YouTube non ha risposto immediatamente alla richiesta di commento da parte di The Verge. 

Il dataset dei transcript fa parte di una collezione più ampia chiamata The Pile, creata dall’organizzazione non profit EleutherAI, che include anche libri, articoli di Wikipedia e altro ancora.

La mancanza di trasparenza delle aziende AI su come utilizzano i dati resta una questione cruciale. Ad esempio, il CTO di OpenAI, Mira Murati, ha evitato di rispondere alle domande sul fatto che il loro strumento di generazione video, Sora, fosse stato addestrato utilizzando contenuti di YouTube, dichiarando che i dati impiegati erano pubblici o con licenza.

Inoltre, il CEO di YouTube, Neal Mohan, e il CEO di Google, Sundar Pichai, hanno affermato che l'uso di contenuti video di YouTube per addestrare AI senza autorizzazione violerebbe i termini della piattaforma.

Attendibilità fonte

The Verge è una fonte affidabile per le notizie tecnologiche e ha una buona reputazione per l'accuratezza delle informazioni. Tuttavia, come molte testate giornalistiche, può mostrare una certa parzialità nei suoi reportage. Secondo Media Bias/Fact Check, The Verge ha un track record positivo per quanto riguarda il fact-checking e raramente è stata coinvolta in controversie riguardanti l'accuratezza delle sue notizie.

L'attendibilità della fonte è stata analizzata tramite Media Bias/Fact Check.

I testi presenti all'interno di questa pagina sono stati inizialmente generati tramite intelligenza artificiale e poi revisionati e corretti a mano.

Commenti

Più recenti