Google porta Gemini nel mondo reale: arriva l’era dei robot
Il nuovo modello di AI darà ai robot più destrezza, interattività e adattabilità.

- Gemini Robotics è un nuovo modello
- Si concentra sul mondo fisico ed è progettato per l'uso nei robot
- È visivo, interattivo e versatile
Google Gemini eccelle nelle attività digitali, come la generazione di testo e immagini. Tuttavia, il nuovo modello Google Robotics porta l'intelligenza artificiale nel mondo reale, accelerando lo sviluppo della robotica umanoide.
Presentato da DeepMind, Gemini Robotics migliora le capacità di Gemini in tre aspetti fondamentali:
- Destrezza
- Interattività
- Generalizzazione
Ognuno di questi tre aspetti è fondamentale per il successo della robotica in ambienti di lavoro e contesti sconosciuti.
La capacità di generalizzazione permette ai robot di applicare le conoscenze di Gemini a nuove situazioni e completare compiti per cui non sono stati addestrati. In un esempio mostrato dai ricercatori, due bracci robotici controllati da Gemini Robotics vengono posti di fronte a un gioco da tavolo di basket. Quando viene chiesto loro di "fare una schiacciata", il robot, pur non avendo mai visto il gioco prima, prende la piccola palla arancione e la infila nel canestro di plastica.
Gemini Robotics migliora anche l'interattività, consentendo ai robot di adattarsi non solo a istruzioni verbali variabili ma anche a condizioni impreviste. In un altro video, i ricercatori chiedono al robot di mettere dell'uva in una ciotola con delle banane, ma spostano la ciotola mentre il braccio robotico si adatta e riesce comunque a completare il compito.
Google ha anche mostrato le capacità di destrezza del robot, permettendogli di affrontare compiti come giocare a tris su una tavoletta di legno, cancellare una lavagna bianca e piegare la carta per creare origami.
A differenza dei metodi tradizionali che richiedono ore di addestramento per ogni singolo compito, i robot rispondono in tempo reale a istruzioni in linguaggio naturale e completano le attività senza bisogno di ulteriori indicazioni. Il risultato è sorprendente.
Ricevi approfondimenti quotidiani, ispirazione e offerte nella tua casella di posta
Iscriviti per ricevere ultime notizie, recensioni, opinioni, offerte tecnologiche e altro ancora.
Ovviamente, l’integrazione dell’IA nella robotica non è una novità.
Lo scorso anno, OpenAI ha stretto una collaborazione con Figure AI per sviluppare un robot umanoide in grado di eseguire compiti seguendo istruzioni verbali. Proprio come Gemini Robotics, il modello visivo-linguistico di Figure 01 lavora insieme al modello vocale di OpenAI per creare un’interazione fluida sulle attività e le priorità da seguire.
Nel video dimostrativo, il robot umanoide si trova davanti a piatti e uno scolapiatti. Alla domanda su cosa vede, elenca gli oggetti presenti, ma l’interlocutore cambia improvvisamente richiesta e gli chiede qualcosa da mangiare. Senza esitazione, il robot prende una mela e gliela porge.
Nei video dimostrativi, Google ha mostrato principalmente bracci e mani robotiche eseguire una varietà di compiti fisici, ma i piani per il futuro sono molto più ambiziosi. L'azienda ha annunciato una collaborazione con Apptroniks per integrare il nuovo modello nel robot umanoide Apollo.
Per perfezionare il sistema, Google sta sviluppando un avanzato modello di linguaggio visivo chiamato Gemini Robotics-ER (Embodied Reasoning), progettato per migliorare la capacità di ragionamento spaziale dei robot e facilitarne l'integrazione con i controller esistenti.
Questo nuovo modello consentirà ai robot di prendere decisioni in tempo reale e di adattarsi rapidamente all'uso di oggetti mai visti prima. Google lo definisce una soluzione completa in grado di gestire ogni aspetto del controllo robotico, dalla percezione all'analisi dello spazio, fino alla pianificazione e alla generazione di codice.
Il modello Gemini Robotics-ER sarà reso disponibile a diverse aziende specializzate in robotica industriale e ricerca, tra cui Boston Dynamics (nota per Atlas), Agile Robots e Agility Robotics.
Sebbene questa innovazione rappresenti un enorme passo avanti per lo sviluppo dei robot umanoidi, al momento questi sistemi sono ancora destinati principalmente all'uso industriale o alla sperimentazione in laboratorio. Probabilmente, ci vorrà ancora del tempo prima di vedere un robot potenziato da Gemini all'interno delle case.
Nato nel 1995 e cresciuto da due genitori nerd, non poteva che essere orientato fin dalla tenera età verso un mondo fatto di videogiochi e nuove tecnologie. Fin da piccolo ha sempre esplorato computer e gadget di ogni tipo, facendo crescere insieme a lui le sue passioni. Dopo aver completato gli studi, ha lavorato con diverse realtà editoriali, cercando sempre di trasmettere qualcosa in più oltre alla semplice informazione. Amante del cioccolato fondente, continua a esplorare nuove frontiere digitali, mantenendo sempre viva la sua curiosità e la sua dedizione al settore.