Ecco perché Claude 3.7 Sonnet è il modello "più potente" che c'è. Ma per quanto?

Anthropic ha appena annunciato Claude 3.7 Sonnet, il suo nuovo modello di intelligenza artificiale che rappresenta un salto avanti enorme...L'articolo Ecco perché Claude 3.7 Sonnet è il modello "più potente" che c'è. Ma per quanto? sembra essere il primo su Smartworld.

Feb 26, 2025 - 10:44

Ecco perché Claude 3.7 Sonnet è il modello "più potente" che c'è. Ma per quanto?

Anthropic ha appena annunciato Claude 3.7 Sonnet, il suo nuovo modello di intelligenza artificiale che rappresenta un salto avanti enorme in un settore che continua a progredire a un ritmo vertiginoso. E il miglioramento è così notevole da "superare" avversari come 03-mini, Grok 3 di xAI o DeepSeek R1.

La novità principale della versione 3.7, che segue la strada attualmente percorsa dal settore di lanciare modelli che ragionano e in grado di compiere diverse operazioni, è che si tratta di un tipo di ragionamento "ibrido".

In pratica, come spiegato da Anthropic, oggi quando usiamo un modello IA dobbiamo scegliere tra un ragionamento approfondito e una risposta rapida, con costi e capacità differenti. Claude 3.7 Sonnet ci evita questo "fastidio", in quanto è in grado di fornire sia risposte in tempo reale che risposte più ragionate.

Al momento è l'utente a chiedere al modello di passare da una modalità all'altra, ma per il futuro Anthropic vuole che sia Claude stesso a "capire" quanto a lungo deve pensare a una domanda.

Questo approccio, abbinato alle potenzialità del modello, è enormemente efficace. Nei benchmark condivisi da Anthropic, Claude 3.7 Sonnet è in grado di superare gran parte degli altri modelli sul mercato. Alcuni esempi sono SWE-Bench, che misura le attività di codifica di parole reali (62,3% contro il 49,3% di o3-mini), o TAU-Bench, che misura la capacità di un modello di interagire con utenti simulati e API esterne in un ambiente di vendita al dettaglio (81,2% contro il 73,5% di o1).

Da vari test sul campo, le risposte di Claude 3.7 Sonnet si sono rivelate in linea con quelle di Grok 3 di xAI, e meglio di altri modelli sul mercato.

Inoltre ora è meno probabile che Claude non risponda alle domande: Anthropic afferma di aver ridotto i rifiuti non necessari del 45% rispetto a Claude 3.5 Sonnet (questo approccio è comune anche ad altri sviluppatori di modelli IA).

Ma c'è un aspetto specifico in cui 3.7 Sonnet eccelle: la programmazione. Per questo motivo, Anthropic ha presentato un agente specifico per queste operazioni chiamato Claude Code, in grado di modificare il codice usando un linguaggio naturale. L'agente descriverà le sue modifiche, testerà il progetto per cercare errori o lo invierà persino a un repository GitHub.

Tutto questo non sarà gratuito, e non costerà pochissimo. Anthropic renderà disponibile Claude 3.7 Sonnet lunedì, ma solo gli abbonati a Claude Pro (18 euro al mese) o Team (28 euro al mese per 5 utenti) potranno accedere alle funzionalità di ragionamento (Extended), mentre gli utenti gratuiti potranno accedere alla versione del modello che non mostra il suo ragionamento.

I costi dell'API sono di 3 dollari per milione di token di input (circa 750.000 parole) e 15 dollari per milione di token in uscita, più di o3-mini (1,10 / 4,40 dollari) e DeepSeek R1 (0,55 / 2,19 dollari).

Il problema è che il settore progredisce così velocemente che non ha neanche senso ormai stabilire chi sia "il migliore". A breve OpenAI lancerà ChatGPT 4.5 e 5, che seguono la stessa strada di Claude 3.7 Sonnet, ovvero un modello unico (e ibrido) in grado di fare tutto.

L'articolo Ecco perché Claude 3.7 Sonnet è il modello "più potente" che c'è. Ma per quanto? sembra essere il primo su Smartworld.