Salta al contenuto

OpenAI utilizzerà i post di Reddit per addestrare ChatGPT grazie a un nuovo accordo

Reddit ha stretto un accordo simile con Google a febbraio ottenendo circa 60 milioni di dollari.

Questa pagina contiene un riassunto e uno schema concettuale dei contenuti presenti nel seguente articolo:

OpenAI will use Reddit posts to train ChatGPT under new deal
Reddit has been eager to sell data from user posts.

Riassunto breve

Reddit ha annunciato una collaborazione con OpenAI per fornire accesso al proprio Data API, consentendo all'azienda di AI di integrare i contenuti di Reddit in ChatGPT e nuovi prodotti. Questo permetterà agli strumenti di OpenAI di comprendere meglio i dati e di mostrare i contenuti di Reddit, soprattutto su argomenti recenti; inoltre inizierà a fare pubblicità su Reddit. Reddit ha stretto un accordo simile con Google a febbraio per migliorare la visualizzazione dei contenuti e l'efficienza nell'addestramento dei modelli. Anche se i termini finanziari con OpenAI non sono stati divulgati, Reddit ha ottenuto circa 60 milioni di dollari da Google. Reddit otterrà accesso ai grandi modelli linguistici di OpenAI per creare nuove funzionalità e supporto per i moderatori volontari. Reddit ha iniziato a far pagare l'accesso al proprio data API, causando la chiusura di molte app di terze parti e proteste degli utenti. La nuova politica dei contenuti pubblici di Reddit afferma che molte entità commerciali abusano degli accessi per raccogliere dati in massa. Reddit sostiene che accordi come quello con OpenAI promuovono un Internet aperto e aiutano a costruire comunità e appartenenza online. Tuttavia, l'uso dei contenuti generati dagli utenti per alimentare i modelli di AI senza compensare gli utenti ha sollevato controversie. OpenAI dovrà affrontare la sfida di lavorare con i dati di Reddit, che possono contenere inesattezze e contenuti inappropriati. Le aziende di AI sono interessate ai dati in tempo reale di Reddit per la loro ampia gamma di argomenti, mentre Reddit cerca di monetizzare i dati dei post degli utenti. Advance Publications, legata alla testata giornalistica Ars Technica, proprietaria della casa madre di Reddit, è la maggior azionista della piattaforma e potrebbe rappresentare un conflitto di interessi.

Panoramica completa

  • Nuova partnership con OpenAI: Reddit ha annunciato una collaborazione con OpenAI per concedere l'accesso al proprio Data API, permettendo all'azienda di AI di accedere in tempo reale ai post di Reddit. Il contenuto di Reddit sarà integrato in ChatGPT e in "nuovi prodotti".
  • Obiettivi della partnership: Secondo un post sul blog di Reddit, questa partnership permetterà agli strumenti di OpenAI di "comprendere meglio e mostrare i contenuti di Reddit, specialmente su argomenti recenti". OpenAI inizierà anche a fare pubblicità su Reddit.
  • Accordo simile con Google: Reddit ha stretto un accordo simile con Google a febbraio, che permette al colosso tecnologico di creare "nuovi modi per visualizzare i contenuti di Reddit" e fornire "modi più efficienti per addestrare i modelli".
  • Termini finanziari non divulgati: Anche se Reddit e OpenAI non hanno rivelato i termini finanziari della loro partnership, l'accordo di Reddit con Google era stato valutato circa 60 milioni di dollari.
  • Accesso ai modelli linguistici: Reddit otterrà accesso ai grandi modelli linguistici (LLM) di OpenAI per creare nuove funzionalità per Reddit, incluso il supporto per i moderatori volontari.
  • Push per la concessione di licenze dati: Reddit ha iniziato a far pagare per l'accesso al proprio data API, causando la chiusura di molte app di terze parti amate dagli utenti e provocando una massiccia protesta degli utenti.
  • Politica di Contenuti Pubblici: Reddit ha pubblicato una politica dei contenuti pubblici affermando: "Purtroppo, vediamo sempre più entità commerciali utilizzare accessi non autorizzati o abusare degli accessi autorizzati per raccogliere dati pubblici in massa, incluso il contenuto pubblico di Reddit".
  • Impegno per un Internet aperto: Nel post sul blog, Reddit ha affermato che accordi come quello con OpenAI fanno parte di un Internet "aperto". Ha aggiunto che "parte dell'essere aperti significa che i contenuti di Reddit devono essere accessibili a coloro che promuovono l'apprendimento umano e ricercano modi per costruire comunità, appartenenza e empowerment online".
  • Controversia sull'uso dei contenuti generati dagli utenti: Reddit è stato esplicito nel perseguire accordi di licenza dati come parte fondamentale del proprio business, sollevando discussioni sull'uso dei contenuti generati dagli utenti per alimentare i modelli di AI senza compensare gli utenti.
  • Sfide per OpenAI: OpenAI dovrà affrontare la sfida di lavorare con i dati di Reddit, che possono essere pieni di inesattezze e contenuti inappropriati. Alcuni dei più grandi oppositori alle nuove regole di Reddit sull'API erano moderatori volontari.
  • Interesse per i dati in tempo reale: Le aziende di AI sono desiderose di accedere alle conversazioni in tempo reale su Reddit, che coprono una vasta gamma di argomenti. Reddit è altrettanto desideroso di concedere in licenza i dati dai post dei suoi utenti.
  • Influenza di Advance Publications: Advance Publications, proprietaria della casa madre di Ars Technica, Condé Nast, è il maggior azionista di Reddit.

*I punti sono stati generati inizialmente tramite intelligenza artificiale e poi revisionati e corretti a mano. L'obiettivo è quello di dare una panoramica più chiara anche ai lettori che non conoscono bene la lingua inglese o che vogliono una lettura svelta.

Commenti

Più recenti