Alibaba lancia Qwen3 sfidando i colossi dell’AI

Scopri Qwen3, la nuova famiglia di modelli linguistici di Alibaba con supporto per 119 lingue, architettura ibrida e prestazioni competitive.

Apr 30, 2025 - 08:02
 0
Alibaba lancia Qwen3 sfidando i colossi dell’AI

La nuova famiglia di modelli linguistici avanzati Qwen3, lanciata da Alibaba, rappresenta un punto di svolta nell’evoluzione dell’Intelligenza Artificiale.

Con un range di parametri che spazia da 600 milioni a 235 miliardi, questa innovativa collezione si distingue per le sue prestazioni all’avanguardia e la capacità di adattarsi a diverse esigenze computazionali.

La linea Qwen3 include otto modelli: sei Dense e due basati sull’architettura MoE (Mixture of Experts). Tra questi, il modello di punta è il Qwen3-235B-A22B, che con i suoi 235 miliardi di parametri totali e 22 miliardi attivi, si posiziona come un concorrente diretto di modelli leader come DeepSeek-R1 e Gemini-2.5-Pro. I test sui benchmark AI più impegnativi, dalla programmazione alla matematica avanzata, hanno confermato la sua superiorità tecnica rispetto alla concorrenza.

Qwen3 supporta ben 119 lingue e dialetti

Una delle caratteristiche più distintive della famiglia Qwen3 è la sua architettura ibrida, che permette di alternare tra due modalità operative: la modalità “pensiero” per affrontare problemi complessi e la modalità “rapida” per risposte immediate. Gli utenti possono passare da una modalità all’altra semplicemente utilizzando i comandi da prompt “/think” e “/no_think“.

L’addestramento di questi modelli ha coinvolto un impressionante volume di dati, con oltre 36 trilioni di token elaborati, garantendo una conoscenza ampia e approfondita. Tra i modelli resi disponibili al pubblico, spicca il Qwen3-32B, che ha superato OpenAI o1 in benchmark come LiveCodeBench. Anche i modelli più compatti, come il Qwen3-4B, offrono prestazioni paragonabili a modelli di dimensioni maggiori della generazione precedente.

Per favorire l’accesso e l’adozione, Alibaba ha reso i modelli disponibili su piattaforme popolari come Hugging Face e ModelScope. Inoltre, l’integrazione con strumenti come Ollama, LM Studio e llama.cpp semplifica l’uso locale, sia per la ricerca che per applicazioni produttive.

Un altro elemento di forza della famiglia Qwen3 è il supporto multilingue, che comprende ben 119 lingue e dialetti, dal cinese al giapponese, fino a molte lingue europee e asiatiche. Questa caratteristica rende i modelli estremamente versatili per applicazioni globali.