Salta al contenuto

Meta conferma che il suo LLM Llama 3 open source arriverà il mese prossimo

Meta ha annunciato il lancio di Llama 3, un avanzamento dei modelli linguistici per competere con ChatGPT di OpenAI, con rilascio previsto il prossimo mese.

Durante un evento a Londra martedì, Meta ha annunciato il lancio imminente di Llama 3, l'ultimo avanzamento nella sua serie di modelli linguistici di grande dimensione volti a migliorare gli assistenti AI generativi. Questo sviluppo, previsto per il prossimo mese, è in linea con un rapporto di The Information divulgato lunedì. Nick Clegg, presidente degli affari globali di Meta, ha sottolineato la prossima implementazione di molteplici iterazioni di Llama 3, ognuna con capacità e versatilità distinte, previste per essere lanciate progressivamente durante l'anno.

Meta, come descritto dal Chief Product Officer Chris Cox, intende utilizzare Llama 3 per guidare una varietà di prodotti nel suo portafoglio, al fine di competere con ChatGPT di OpenAI, che ha significativamente impattato il panorama tecnologico con il suo rilascio. Nonostante un approccio cauto verso l'AI, le precedenti iterazioni di Llama di Meta hanno ricevuto critiche per le loro limitazioni, un sentimento che Llama 3 cerca di superare migliorando l'accuratezza delle risposte e ampliando l'ambito delle domande, includendo argomenti più controversi.

Joelle Pineau, vicepresidente della ricerca AI di Meta, ha espresso l'ambizione di rendere l'AI alimentato da Llama l'assistente principale a livello globale, nonostante il riconoscimento del notevole lavoro necessario per raggiungere questo obiettivo. Si specula che Llama 3 contenga circa 140 miliardi di parametri, raddoppiando la capacità del suo predecessore, anche se dettagli specifici sul suo framework o dimostrazioni della sua funzionalità non sono stati forniti.

Enfatizzando una partenza dai modelli AI più proprietari, Meta promuove lo sviluppo open-source per i suoi prodotti Llama, mirando a ottenere il supporto degli sviluppatori. Tuttavia, Meta esercita cautela, in particolare con l'AI generativa non testuale, ritardando il rilascio di Emu, il suo strumento di generazione di immagini, a causa di considerazioni riguardanti la latenza, la sicurezza e l'usabilità.

In una prospettiva interna interessante, Yann LeCun, capo scienziato dell'AI di Meta, ha criticato il paradigma dell'AI generativa, sostenendo un cambio verso l'architettura di predizione con embedding congiunto (JEPA), che offre un approccio innovativo nella formazione dei modelli e nella generazione di risultati, in particolare nella generazione di immagini.

Commenti

Più recenti