In breve:
Google ha lanciato Ironwood, un nuovo chip progettato specificamente per le operazioni di inferenza nell'IA, che permette prestazioni doppie rispetto alla generazione precedente (Trillium) consumando meno energia. Google risparmierà riducendo la dipendenza da fornitori esterni come Intel, AMD e Nvidia.
Riassunto completo:
- Google ha presentato Ironwood, un nuovo chip specializzato nell'inferenza, cioè nel fornire risposte rapide e immediate basate su modelli di intelligenza artificiale già addestrati.
Cos'è l'inferenza?
L'inferenza nell'intelligenza artificiale è il momento in cui un modello già addestrato viene "messo al lavoro": riceve un input (ad esempio una domanda o un'immagine) e produce un output. Non è la fase in cui impara, ma quella in cui "usa ciò che ha imparato".
- Questa è la prima volta che Google progetta espressamente un chip per gestire inferenze su larga scala invece che per addestrare i modelli, rispondendo così alla crescente domanda delle aziende che usano quotidianamente l'IA.
- Ironwood fornisce prestazioni doppie per watt rispetto al chip precedente (Trillium) ed è equipaggiato con 192 GB di memoria ad alta velocità, sei volte maggiore rispetto a Trillium, permettendo una gestione più efficiente di grandi quantità di dati.
- L’introduzione di Ironwood riflette una necessità economica sempre più evidente per Google: contenere i costi dell'inferenza di modelli IA, che sono diventati altissimi con la diffusione massiva degli LLM.
- Attualmente, il 99% dei chip utilizzati in Google Cloud provengono da fornitori esterni come Intel, AMD e Nvidia; aumentando l'uso di Ironwood, Google potrebbe ridurre sensibilmente questa dipendenza esterna, risparmiando ingenti costi.
- Google punta a far lavorare insieme centinaia di migliaia di chip Ironwood contemporaneamente, migliorando così le performance generali e riducendo sprechi di risorse.
Questo testo è un riassunto del seguente articolo (eng):
Google’s latest chip is all about reducing one huge hidden cost in AI
The ‘Ironwood’ chip marks a major shift in focus for Google, as performance and efficiency are taking a backseat.

Alternativa in italiano:
Google Cloud Next 25: dai chip per l’inferenza all’aggiornamento dei modelli di Ai
Al via l’evento annuale in cui Google Cloud annuncia le sue novità più importanti che metterà sul mercato nei prossimi mesi Tutte le novità
