Salta al contenuto

Google annuncia Gemini Robotics per la creazione di robot di uso generale

Costruiscono origami, imbustano snack e si adattano a situazioni sconosciute.

In breve:

Google DeepMind lancia Gemini Robotics, un modello di intelligenza artificiale avanzato che consente ai robot di interagire direttamente con il mondo fisico. Basato su Gemini 2.0, questi robot possono eseguire azioni complesse e precise come fare origami o imbustare uno snack, adattandosi anche a situazioni nuove mai affrontate prima.

Riassunto completo:

  • Google DeepMind annuncia il lancio di Gemini Robotics, un nuovo strumento di intelligenza artificiale pensato per applicazioni pratiche nel mondo reale tramite robot.
  • Il sistema è sviluppato a partire dal modello avanzato Gemini 2.0, con l'aggiunta della capacità di impartire comandi fisici per il controllo diretto dei robot.
  • Gemini Robotics punta su tre caratteristiche chiave: generalità, interattività e destrezza manuale.
  • La generalità consente al robot di gestire situazioni, oggetti e ambienti mai visti in precedenza grazie alla comprensione profonda dell'ambiente circostante.
  • La interattività permette di ricevere ed eseguire istruzioni chiare e naturali in vari linguaggi, rispondendo rapidamente anche a cambiamenti improvvisi.
  • La destrezza permette a Gemini Robotics di compiere azioni dettagliate e complesse tipiche delle mani umane, come fare origami e imbustare alimenti.
  • Presentato anche il modello Gemini Robotics-ER (Embodied Reasoning), dotato di una maggiore capacità di comprendere ed interpretare la posizione di oggetti nello spazio, utile per afferrare e posizionare oggetti delicati come tazze.
  • I nuovi modelli testati su diversi tipi di robot (inclusi robot umanoidi e a due braccia) sono già stati affidati a collaboratori come Agile Robots, Agility Robots, Boston Dynamics ed Enchanted Tools.

Cosa significa "Embodied Reasoning"?

"Embodied Reasoning" è un concetto associato al modello Gemini Robotics-ER, che si riferisce alla capacità avanzata di comprendere e interpretare la posizione degli oggetti nello spazio. Questo implica che il robot non solo riconosce gli oggetti, ma può anche ragionare su come interagire con essi in modo efficace, come ad esempio afferrare e posizionare oggetti delicati come tazze senza danneggiarli. Questo tipo di ragionamento corporeo è essenziale per un'interazione sicura e precisa con l'ambiente fisico.

Questo testo è un riassunto del seguente articolo (eng):

Google announces Gemini Robotics for building general purpose robots
Google DeepMind today announced Gemini Robotics to bring “AI into the physical world,” with new models able to “perform a wider range…

Alternativa in italiano:

I nuovi modelli AI di Google DeepMind aiutano i robot a fare cose nuove
Le nuove piattaforme di intelligenza artificiale basate su Gemini mostrano alcune delle loro ampie potenzialità

Commenti

Più recenti