Google DeepMind ha mostrato grandi migliorie nella robotica grazie all’integrazione dei nuovi modelli Gemini Robotics 1.5. In un video pubblicato lo scorso 25 settembre, i ricercatori hanno svelato come i loro robot umanoidi siano ora capaci di affrontare compiti complessi e multi-step, senza la necessità di ricevere istruzioni una alla volta. L’esperimento simbolo è stato soprannominato “banana test”: invece di limitarsi a spostare un singolo frutto da un punto all’altro, come accadeva con la precedente generazione di Gemini, i robot sono riusciti a distinguere e smistare tre frutti diversi in base al colore, posizionandoli con precisione in piatti separati.
Il protagonista del test è stato il bi-braccio Franka, che ha seguito le istruzioni dimostrando destrezza meccanica e capacità di ragionamento passo dopo passo. Questo perché la nuova versione dei modelli Gemini non si limita a tradurre input visivi in azioni: con Gemini Robotics-ER 1.5, i robot sono in grado di pianificare e adattarsi alle situazioni, creando sequenze di azioni coerenti con l’obiettivo finale.