Dal parlato al riassunto: Google Gemini Live trasforma le interazioni vocali
Negli ultimi anni, gli assistenti AI hanno guadagnato popolarità rapidamente, poiché permettono agli utenti di guidare l’interazione e passare da... L'articolo Dal parlato al riassunto: Google Gemini Live trasforma le interazioni vocali proviene da Batista70.

Negli ultimi anni, gli assistenti AI hanno guadagnato popolarità rapidamente, poiché permettono agli utenti di guidare l’interazione e passare da un argomento all’altro, facendo poi collegare i punti dall’AI stessa.
Con l’abilità degli LLM nel gestire grandi quantità di dati e nel riassumere, è possibile condensare interazioni di un’ora nel loro succo essenziale.
Tuttavia, l’interazione vocale basata su AI è ancora in fase di sviluppo, e la funzione di riassunto spesso manca a meno che non venga richiesta esplicitamente prima di terminare la conversazione.
Google sembra avere una soluzione in lavorazione per Gemini Live.
L’esperienza Gemini Live
Gemini Live è un’esperienza basata sulla voce integrata nell’app Gemini per Android, che permette di avere una conversazione uno-a-uno con un chatbot AI onnisciente.
Questa è una delle aggiunte piuttosto recenti al repertorio di funzioni AI di Google, che può risparmiare tempo e sforzo in ogni interazione. Inoltre, si avvicina più a una conversazione naturale rispetto all’interazione testuale con prompt iper-specifici ingegnerizzati.
Trascrizione e riassunto
Mentre Live offre una trascrizione completa della conversazione al termine, il riassunto non è incluso a meno che non venga specificatamente richiesto.
Sembra essere una richiesta abbastanza popolare tale che una recente beta dell’app Google (versione 16.6.23) rivela sforzi di sviluppo in corso utilizzando — come si potrebbe indovinare — un prompt iper-specifico ingegnerizzato.
Il ricercatore di app Google e tipster AssembleDebug su X ha informato Android Authority di un nuovo prompt che l’app sottomette automaticamente alla fine della conversazione, affinché l’AI fornisca un riassunto esecutivo dell’interazione.
Questo prompt spinge l’AI a utilizzare intestazioni in grassetto, combinare dettagli in descrizioni di due frasi, con enfasi sul “sentimento” generale della conversazione.
Miglioramenti e accessibilità
È importante notare che Google sta lavorando anche su un’impostazione di sottotitoli per Gemini Live, così non sarà necessario attendere la fine per vedere le risposte precedenti.
Questo migliorerebbe notevolmente l’accessibilità della funzione. Lo stesso tipster osserva che una trascrizione testuale completa seguirà le conversazioni non sottotitolate, rendendo i riassunti TLDR ancora più utili in questi casi.
Prospettive future
Il tipster non specula quando Google potrebbe impegnarsi in queste modifiche per Gemini, ma speriamo che l’attesa non sia lunga, dato che l’IA è uno spazio competitivo e Google cerca di rimanere aggiornata con la concorrenza.
L'articolo Dal parlato al riassunto: Google Gemini Live trasforma le interazioni vocali proviene da Batista70.