Microsoft Research presenta Magma: AI multimodale che comanda software e robot
Un'AI integrata che combina visione e linguaggio per un'interazione più naturale e intuitiva con software e robot
Sono vicini i tempi in cui un'AI potrà controllare macchine e robot? Secondo Microsoft si. Microsoft Research ha svelato Magma, un'AI capace di combinare elaborazione visiva e linguistica per interagire con software e robot. Questa nuova tecnologia potrebbe rappresentare un progresso significativo verso una tecnologia multimodale su più livelli, in grado di operare in modo interattivo sia nel mondo digitale che in quello fisico.
A differenza di casi precedenti, come l'Operator di OpenAI, Magma integra in un singolo modello di base le capacità di percezione e controllo. Questo significa che non solo è in grado di elaborare dati multimodali (testo, immagini e video), ma può anche agire direttamente su di essi, navigando in interfacce utente o manipolando oggetti fisici.
Un cambio di passo, almeno teorico, per aziende che usano infrastrutture robotiche, per le quali l'AI potrebbe decidere di eseguire comandi autonomamente, senza l'ausilio di terzi. Ma anche il customer service, ad esempio per gestire in autonomia richieste di clienti a cui dar seguito non solo con risposte testuali o vocali ma agendo, fisicamente, in contesti reali e non solo digitali.