Google annuncia Gemma 3: la famiglia di modelli aperti più potenti per telefoni e portatili

A un anno dal lancio dei primi modelli Gemma, Google ha annunciato la nuova famiglia Gemma 3, presentandola come il...L'articolo Google annuncia Gemma 3: la famiglia di modelli aperti più potenti per telefoni e portatili sembra essere il primo su Smartworld.

Mar 14, 2025 - 09:37

Google annuncia Gemma 3: la famiglia di modelli aperti più potenti per telefoni e portatili

A un anno dal lancio dei primi modelli Gemma, Google ha annunciato la nuova famiglia Gemma 3, presentandola come il modello di intelligenza artificiale più potente al mondo da eseguire su una singola GPU. Quindi perfetto per dispositivi come telefoni e portatili, ma anche per aziende che vogliono elevate prestazioni a costi contenuti.

I modelli della serie Gemma sono modelli aperti, in quanto consentono agli sviluppatori di personalizzare i pesi (aperti sta per open-weight), i parametri pre-addestrati del modello in modo da ottenere risultati migliori per determinati compiti. Non sono quindi open source, in cui si ha accesso completo al codice sorgente, all'architettura e ai pesi.

Con Gemma 3, Google ha ulteriormente migliorato le prestazioni senza aumentare il carico computazionale, tanto che nella classifica Chatbot Arena di LMArena il modello Gemma 3 da 27 miliardi di parametri (Gemma 3 27B) è davanti ad avversari del calibro di Llama-405B, DeepSeek-V3 e o3-mini.

Non solo, ma lo fa utilizzando una sola GPU. Il modello è stato infatti ottimizzato per le GPU NVIDIA e l'hardware AI dedicato, e qui sotto possiamo vedere come Gemma 3 raggiunga un punteggio Elo elevato utilizzando solo una singola GPU Nvidia H100 a differenza dei concorrenti.

Altre caratteristiche Gemma 3 sono il supporto a oltre 35 lingue (ma è pre-addestrato per oltre 140) e una finestra di contesto di 128k token (Gemma 2 per dare un paragone arrivava a 8192 token), che gli consente di elaborare e comprendere grandi quantità di informazioni.

Inoltre Gemma 3 è dotato di un encoder di visione in grado di supportare immagini e brevi video (per i modelli 4B, 12B, e 27B), rendendolo in grado di avanzate di ragionamento visivo e di testo.

Il modello supporta il function calling (la capacità dei modelli di intelligenza artificiale di interagire con strumenti esterni, API o database per eseguire compiti specifici.), per automatizzare le attività e creare agenti, e introduce versioni quantizzate ufficiali per ridurre le dimensioni e i requisiti computazionali. Per chi è interessato, qui c'è l'articolo che descrive le caratteristiche del modello.

Sul fronte della sicurezza, Google dichiara che nello sviluppo di Gemma 3 ha utilizzato una messa a punto in linea con le politiche di sicurezza, con tanto di test approfonditi per evitare di usare i modelli nella creazione di sostanze nocive.

Google ha anche introdotto ShieldGemma 2, un nuovo classificatore di sicurezza delle immagini da 4 miliardi di parametri progettato per filtrare i contenuti espliciti, pericolosi o violenti.

Gemma 3 e ShieldGemma 2 sono disponibili in diverse piattaforme, come Google AI Studio, Hugging Face, Kaggle, Vertex AI e altre. Per incoraggiare la sua adozione (e di altri strumenti del cosiddetto Gemmaverse), Google ha messo in palio 10.000 dollari in crediti attraverso il programma Gemma 3 Academic.

L'articolo Google annuncia Gemma 3: la famiglia di modelli aperti più potenti per telefoni e portatili sembra essere il primo su Smartworld.