Vai al contenuto principale
OpenAI

13 novembre 2025

Prodotto

Scopri GPT‑5.1 per gli sviluppatori

Caricamento in corso...

Oggi lanciamo GPT‑5.1 sulla piattaforma API, il modello più recente della serie GPT‑5 che bilancia intelligenza e velocità su un'ampia gamma di attività agentiche e di programmazione. GPT‑5.1 adatta dinamicamente il tempo che dedica al ragionamento in base alla complessità dell'attività, rendendo il modello significativamente più veloce ed efficiente in termini di token nelle attività quotidiane più semplici. Il modello include anche una modalità “senza ragionamento” per rispondere più velocemente a attività che non richiedono un ragionamento profondo, mantenendo comunque l'intelligenza all'avanguardia di GPT‑5.1.

Per rendere GPT‑5.1 ancora più efficiente, stiamo introducendo un'estensione della cache dei prompt per una conservazione fino a 24 ore, garantendo risposte più rapide alle domande di follow-up a un costo inferiore. I nostri clienti Priority Processing(si apre in una nuova finestra) sperimenteranno anche prestazioni notevolmente più veloci con GPT‑5.1 rispetto a GPT‑5.

Per quanto riguarda la programmazione, abbiamo collaborato strettamente con startup come Cursor, Cognition, Augment Code, Factory e Warp per migliorare GPT‑5.1 stile di sviluppo, controllabilità e qualità del codice. In generale, GPT‑5.1 è più intuitivo da usare per la programmazione e più comunicativo nel fornire aggiornamenti all'utente durante l'esecuzione delle attività.

Infine, stiamo introducendo due nuovi strumenti con GPT‑5.1: un tool apply_patch progettato per modificare il codice in modo più affidabile, e un tool di shell per consentire al modello di eseguire comandi di shell.

GPT‑5.1 è il nuovo aggiornamento della serie GPT‑5, e prevediamo di continuare a investire in modelli più intelligenti e capaci, per aiutare gli sviluppatori a creare efficaci flussi di lavoro agentici.

Ragionamento efficiente nella risoluzione delle attività

Ragionamento adattivo

Per rendere GPT‑5.1 più veloce, abbiamo completamente rinnovato il metodo con il quale lo addestriamo a pensare. Per le attività semplici, GPT‑5.1 utilizza meno token per elaborare le informazioni, permettendo esperienze di prodotto più veloci e costi di token ridotti. Nelle attività difficili che richiedono una riflessione extra, GPT‑5.1 non si ferma, esplora le possibilità e controlla il suo lavoro per puntare alla massima affidabilità.

Balyasny Asset Management(si apre in una nuova finestra) ha dichiarato che GPT‑5.1 «ha superato sia GPT‑4.1 che GPT‑5 nella nostra suite completa di valutazione dinamica, pur funzionando 2-3 volte più velocemente di GPT‑5». Ha aggiunto che nelle sue attività di ragionamento più complesse, GPT‑5.1 «ha sempre usato circa la metà dei token rispetto ai principali concorrenti, mantenendo una qualità simile o superiore». Allo stesso modo, anche il BPO assicurativo IA Pace(si apre in una nuova finestra) ha testato il modello e ha dichiarato che i suoi agenti funzionano «con una velocità superiore del 50% su GPT‑5.1, superando l'accuratezza di GPT‑5 e di altri modelli leader nelle nostre valutazioni».

GPT‑5.1 varia il tempo di elaborazione in modo più dinamico rispetto a GPT‑5. Su una distribuzione rappresentativa delle attività di ChatGPT, GPT‑5.1 è molto più veloce nei compiti più semplici, anche con un elevato sforzo di ragionamento.

Ad esempio, quando ti viene chiesto "mostra un comando npm per elencare i pacchetti installati globalmente", GPT‑5.1 risponde in 2 secondi invece di 10 secondi.

GPT-5 (Medium) richiede ~250 token (~10 secondi)

show an npm command to list globally installed packages

npm list -g --depth=0

GPT-5.1 (Medium) impiega ~50 token (~2 secondi)

show an npm command to list globally installed packages

You can list globally installed npm packages with:

  • Just package names: npm ls -g --depth=0
  • Including their install paths: npm ls -g

The first one is usually what you want.

Nuova modalità "senza ragionamento"

Gli sviluppatori possono ora utilizzare GPT‑5.1 senza ragionamento impostando il valore “reasoning_effort” su “none”. Questo consente al modello di operare in modalità "senza ragionamento" per scenari a bassa latenza, mantenendo la capacità cognitiva di GPT‑5.1 e prestazioni elevate nel tool-calling. GPT‑5.1 in modalità senza ragionamento è più efficiente di GPT‑5 con ragionamento ridotto: chiama gli strumenti in parallelo più facilmente, programma meglio, segue meglio le istruzioni e usa meglio gli strumenti di ricerca. È anche compatibile con la ricerca web(si apre in una nuova finestra) nella nostra piattaforma API. Sierra(si apre in una nuova finestra) ha dichiarato che GPT‑5.1 in modalità "senza ragionamento" è risultato più veloce del 20% nelle chiamate agli strumenti a bassa latenza rispetto a GPT‑5 con ragionamento minimo, basandosi sui loro test reali.

Con l'introduzione di "none" come valore in reasoning_effort, gli sviluppatori ora hanno ancora più flessibilità e controllo sull'equilibrio tra velocità, costi e intelligenza in base al proprio caso d’uso. GPT‑5.1 ha come valore predefinito "nessuno", il che è ideale per carichi di lavoro sensibili alla latenza. Consigliamo agli sviluppatori di scegliere "basso" o "medio" per attività di maggiore complessità e "alto" quando l'intelligenza e l'affidabilità contano più della velocità.

Estensione della cache dei prompt

Il caching esteso migliora l’efficienza del ragionamento consentendo ai prompt di rimanere attivi nella cache fino a 24 ore, invece dei pochi minuti supportati oggi. Grazie a una memoria più estesa, più richieste successive possono riutilizzare il contesto salvato, così da ridurre la latenza, abbassare i costi e migliorare la fluidità durante interazioni lunghe, come chat continuative, sessioni di programmazione o processi di ricerca di informazioni.

I costi della cache per i prompt non cambiano: i token già in cache costano il 90% in meno rispetto a quelli non in cache, e non ci sono costi extra per scrittura o archiviazione della cache. Per utilizzare la cache estesa con GPT‑5.1, aggiungi il parametro "prompt_cache_retention=24h" nell'API Risposte o nell'API per il completamento delle chat. Consulta i documenti sulla cache del prompt(si apre in una nuova finestra) per maggiori dettagli.

Programmazione

GPT‑5.1 migliora le capacità di programmazione di GPT‑5 con uno stile di sviluppo più controllabile, una minore sovraelaborazione, una qualità del codice superiore, aggiornamenti più mirati all’utente durante le sequenze di chiamate agli strumenti e design frontend più funzionali, soprattutto con basso livello di ragionamento.

Nelle attività di programmazione più semplici, come piccole modifiche al codice, GPT‑5.1 ha velocità più elevate che rendono più facile iterare avanti e indietro. GPT‑5.1 ha velocità più elevate nelle attività semplici, senza compromettere le prestazioni nelle attività complesse. Su SWE-bench Verified, GPT‑5.1 funziona ancora più a lungo di GPT‑5 e raggiunge il 76,3%.

In SWE-bench Verified, a un modello viene fornito un repository di codice e una descrizione del problema, e deve generare una patch per risolvere il problema. Le etichette indicano lo sforzo di ragionamento. L'accuratezza è calcolata come media su tutti i 500 problemi. Tutti i modelli utilizzavano un ambiente con lo strumento apply_patch basato su JSON.

Abbiamo ricevuto i primi feedback su GPT‑5.1 da alcune aziende di programmazione. Ecco le loro impressioni:

  • Augment Code(si apre in una nuova finestra) ha definito GPT‑5.1 come «più accurato nelle azioni, con meno sprechi, e un ragionamento più efficiente nelle attività, unitamente a modifiche più precise, pull request più fluide e iterazioni più veloci in progetti che coinvolgono più file.»
  • Cline(si apre in una nuova finestra) ha condiviso che nelle loro valutazioni, «GPT‑5.1 ha raggiunto il SOTA nel nostro benchmark di modifica delle differenze con un miglioramento del 7%, dimostrando un'affidabilità eccezionale per attività di codifica complesse».
  • CodeRabbit(si apre in una nuova finestra) ha definito GPT‑5.1 il suo «modello di punta per le revisioni PR».
  • Cognition(si apre in una nuova finestra) ha detto che GPT‑5.1 è «notevolmente migliore nel capire cosa stai chiedendo e nel collaborare con te per realizzarlo».
  • Factory(si apre in una nuova finestra) ha dichiarato: «GPT‑5.1 fornisce risposte notevolmente più rapide e adatta la profondità di ragionamento all'attività, riducendo il sovraccarico di pensiero e migliorando l'esperienza complessiva degli sviluppatori».
  • Warp(si apre in una nuova finestra) sta rendendo GPT‑5.1 l'impostazione predefinita per i nuovi utenti, affermando che «si basa sugli impressionanti progressi in termini di intelligenza introdotti dalla serie GPT‑5, pur essendo un modello molto più reattivo».
«GPT 5.1 non è solo un altro LLM: è davvero autonomo, il modello più naturalmente autonomo che abbia mai testato. Scrive come te, programma come te, segue senza sforzo istruzioni complesse ed eccelle nelle attività di front-end, integrandosi perfettamente nel tuo codice esistente. Puoi davvero sbloccare tutto il suo potenziale nell'API Risposte, e siamo entusiasti di offrirlo nel nostro IDE.»
—Denis Shiryaev, Responsabile dell'ecosistema AI DevTools, JetBrains

Nuovi strumenti con GPT‑5.1

Stiamo introducendo due nuovi strumenti con GPT‑5.1 per aiutare gli sviluppatori a ottenere il massimo dal modello nell'API Responses: unostrumento apply_patchper rendere le modifiche al codice ancora più affidabili senza la necessità di escape JSON e uno strumento shell che consente al modello di scrivere comandi da eseguire sulla tua macchina locale.

Strumento Apply_patch

Lo strumento libero apply_patch permette a GPT‑5.1 di creare, aggiornare ed eliminare file in un codice sorgente utilizzando diff strutturati. Anziché limitarsi a suggerire modifiche, il modello genera operazioni di patch che un’applicazione applica e poi restituisce come feedback, rendendo possibili workflow di modifica del codice iterativi e a più passaggi.

Per utilizzare lo strumento apply_patch nell'API Risposte, includilo nell'array degli strumenti con "tools": [{“type”: “apply_patch”}] e includi il contenuto del file nel tuo input o fornisci al modello gli strumenti per interagire con il tuo file system. Il modello genererà elementi apply_patch_call per creare, aggiornare o eliminare file che contengono differenze da applicare al tuo file system. Per ulteriori informazioni su come integrare lo strumento apply_patch, consulta la nostra documentazione per sviluppatori(si apre in una nuova finestra).

Strumento shell

Lo strumento shell consente al modello di interagire con un computer locale tramite un'interfaccia a riga di comando controllata. Il modello genera comandi shell, mentre l’integrazione li esegue e fornisce l’output in risposta. Si crea così un ciclo semplice in cui il modello pianifica, esegue, controlla il sistema, usa gli strumenti e raccoglie dati finché non riesce a completare l'attività.

Per utilizzare lo strumento shell nell'API Risposte, gli sviluppatori possono includerlo nell'array degli strumenti con "tools": [{“type”: “shell”}]. L'API genererà elementi "shell_call" che includono i comandi di shell da eseguire. Gli sviluppatori eseguono i comandi nell'ambiente locale e restituiscono i risultati dell'esecuzione nell'elemento "shell_call_output" nella successiva richiesta API. Scopri di più nella nostra documentazione per sviluppatori(si apre in una nuova finestra).

Tariffe e disponibilità

GPT‑5.1 e gpt-5.1-chat-latest sono disponibili per gli sviluppatori in tutti i piani a pagamento dell'API. Tariffe e limiti di utilizzo(si apre in una nuova finestra) sono gli stessi di GPT‑5. Stiamo anche lanciando gpt-5.1-codex e gpt-5.1-codex-mini nell'API. Mentre GPT‑5.1 eccelle nella maggior parte delle attività di codifica, gpt-5.1-codex utilizza modelli ottimizzati per attività di codifica agentica a lungo termine in Codex o in sistemi simili a Codex.

Gli sviluppatori possono iniziare a lavorare utilizzando la nostra documentazione per sviluppatori GPT‑5.1(si apre in una nuova finestra) e la guida al prompting del modello(si apre in una nuova finestra). Attualmente non abbiamo intenzione di ritirare GPT‑5 dall'API, e informeremo gli sviluppatori con adeguato preavviso se e quando decidessimo di farlo.

Prossimi passi

Il nostro impegno è rilasciare progressivamente modelli sempre più potenti e affidabili per attività agentiche e di programmazione, che pensano in modo efficiente, iterano velocemente e gestiscono compiti complessi senza interrompere il flusso di lavoro degli sviluppatori. Con un ragionamento adattivo, prestazioni di codifica più elevate, aggiornamenti più chiari per l'utente finale e nuovi strumenti come apply_patch e shell, GPT‑5.1 è progettato per aiutarti a sviluppare con meno attriti. E continueremo a investire molto in questa direzione: arriveranno modelli agentici e di programmazione ancora più potenti nelle prossime settimane e mesi.

Appendice: valutazioni del modello

Valutazione

GPT‑5.1 (alto)

GPT‑5 (alto)

SWE-bench Verificato
(tutti i 500 problemi)

76,3%

72,8%

GPQA Diamond
(senza strumenti)

88,1%

85,7%

AIME 2025
(senza strumenti)

94,0%

94,6%

FrontierMath
(con lo strumento Python)

26,7%

26,3%

MMMU

85,4%

84,2%

Tau2-bench Airline

67,0%

62,6%

Tau2-bench Telecom*

95,6%

96,7%

Tau2-bench vendita al dettaglio

77,9%

81,1%

BrowseComp contesto lungo 128.000

90,0%

90,0%

* Per Tau2-bench Telecom, abbiamo dato a GPT‑5.1 un breve prompt generico per migliorare le sue prestazioni.