In breve
Una delle complicazioni lato esperienza utente dei modelli "che pensano" è la durata del ragionamento. Claude 3.7 Sonnet ti permette adesso di scegliere tra la modalità "normale", che dura meno, e quella "avanzata", che ragiona per più tempo. Ha battuto 03 di OpenAI in compiti di programmazione.
Riassunto completo
- Anthropic ha lanciato un modello di intelligenza artificiale chiamato Claude 3.7 Sonnet, che può fornire risposte velocemente oppure, attivando una modalità speciale, risposte più ragionate.
- Claude 3.7 Sonnet è presentato come il primo "modello di ragionamento ibrido" e permette di scegliere tra versione "normale", in cui il ragionamento dura meno, e versione "avanzata", in cui dura di più.
- Gli utenti premium del chatbot di Anthropic avranno accesso alle capacità di ragionamento del modello, mentre gli utenti gratuiti utilizzeranno una versione un po' minore in termini di ragionamento ma che comunque supera il modello precedente, Claude 3.5 Sonnet.
- Il costo per utilizzare Claude 3.7 Sonnet è più elevato rispetto ai modelli di ragionamento di soli input o output come o3-mini di OpenAI e R1 di DeepSeek, ma offre funzionalità di ragionamento avanzate.
- Nelle valutazioni di capacità pratiche, Claude 3.7 Sonnet ha ottenuto punteggi superiori rispetto ai modelli di competizione in ambiti di compiti di programmazione complessi e interazioni con API simulate.
- Oltre a Claude 3.7 Sonnet, Anthropic ha introdotto un nuovo strumento di codifica chiamato Claude Code, che consente agli sviluppatori di modificare i progetti di codifica utilizzando comandi in inglese semplice dal terminale.
- Anthropic ha migliorato la capacità di Claude 3.7 Sonnet di distinguere tra domande innocue e dannose rispetto ai modelli precedenti, riducendo del 45% le risposte non necessarie.
Cosa sono i modelli di ragionamento?
I modelli di ragionamento (reasoning models) insegnano ai sistemi a elaborare dati in modo logico, simile a come ragiona un essere umano. Questi modelli analizzano informazioni, trovano connessioni, risolvono problemi, e prendono decisioni basandosi su dati passati o regole prestabilite. Spesso vengono utilizzati per applicazioni come chatbot, assistenti virtuali, o sistemi di raccomandazione.
Questo testo è un riassunto del seguente articolo (eng):

Alternativa in italiano:
