Predstavljamo GPT‑5.1 za programere
Danas objavljujemo GPT‑5.1 na API platformi, sledeći model u seriji GPT‑5 koji uravnotežuje inteligenciju i brzinu za širok opseg agentičnih zadataka i zadataka programiranja. GPT‑5.1 dinamički prilagođava koliko vremena provodi razmišljajući na osnovu složenosti zadatka, što model čini značajno bržim i efikasnijim po broju tokena na jednostavnijim svakodnevnim zadacima. Model takođe ima režim „bez rezonovanja“ za brže odgovaranje na zadatke koji ne zahtevaju duboko razmišljanje, uz zadržavanje granične inteligencije GPT‑5.1.
Da bismo GPT‑5.1 učinili još efikasnijim, objavljujemo prošireno keširanje instrukcija sa zadržavanjem keša do 24 sata, što omogućava brže odgovore na dodatna pitanja uz niži trošak. Naši korisnici usluge Priority Processing(отвара се у новом прозору) takođe će primetiti znatno bolje performanse GPT‑5.1 u odnosu na GPT‑5.
U oblasti programiranja, тесно смо сарађивали са стартапима као што су Cursor, Cognition, Augment Code, Factory и Warp како бисмо побољшали програмерску личност GPT‑5.1, управљивост и квалитет кода. Уопштено, GPT‑5.1 делује интуитивније за коришћење при програмирању и комуникативније је кроз обавештења окренута кориснику док завршава задатке.
Na kraju, sa GPT‑5.1 uvodimo i dve nove alatke: alatku apply_patch, osmišljenu za pouzdanije uređivanje koda, i shell alatku koja omogućava modelu da pokreće shell komande.
GPT‑5.1 je sledeći napredak u seriji GPT‑5 i planiramo da nastavimo da ulažemo u inteligentnije i sposobnije modele kako bismo pomogli programerima da izgrade pouzdane agentične tokove rada.
Da bismo GPT‑5.1 učinili bržim, temeljno smo preradili način na koji smo ga obučavali da razmišlja. Na jednostavnim zadacima, GPT‑5.1 troši manje tokena na razmišljanje, što omogućava odzivnija korisnička iskustva i niže račune za tokene. Na teškim zadacima koji zahtevaju dodatno razmišljanje, GPT‑5.1 ostaje istrajan, istražuje opcije i proverava svoj rad kako bi maksimalno povećao pouzdanost.
Balyasny Asset Management(отвара се у новом прозору) je naveo da je GPT‑5.1 „nadmašio i GPT‑4.1 i GPT‑5 u našem kompletnom paketu dinamičkih evaluacija, dok je radio 2–3x brže od GPT‑5.“ Takođe su naveli da je GPT‑5.1 u njihovim zadacima rezonovanja sa intenzivnim korišćenjem alatki „dosledno koristio oko upola manje tokena od vodećih konkurenata uz sličan ili bolji kvalitet.“ Slično tome, AI BPO za osiguranje Pace(отвара се у новом прозору) je takođe testirao model i naveo da njihovi agenti rade „50% brže na GPT‑5.1, uz veću tačnost od GPT‑5 i drugih vodećih modela u našim evaluacijama.“
GPT‑5.1 menja vreme razmišljanja dinamičnije nego GPT‑5. Na reprezentativnoj raspodeli ChatGPT zadataka, GPT‑5.1 je znatno brži na lakšim zadacima, čak i uz visok napor rezonovanja.
Na primer, kada dobije zahtev „prikaži npm komandu za listanje globalno instaliranih paketa“, GPT‑5.1 odgovara za 2 sekunde umesto za 10 sekundi.
GPT-5 (srednje) koristi ~250 tokena (~10 sekundi)
GPT-5.1 (srednje) koristi ~50 tokena (~2 sekunde)
Programeri sada mogu da koriste GPT‑5.1 bez rezonovanja tako što će postaviti reasoning_effort na 'none'. To čini da se model ponaša kao model bez rezonovanja za slučajeve upotrebe osetljive na latenciju, uz visoku inteligenciju GPT‑5.1 i dodatnu prednost efikasnog pozivanja alatki. U odnosu na GPT‑5 sa 'minimal' rezonovanjem, GPT‑5.1 bez rezonovanja je bolji u paralelnom pozivanju alatki (što samo po sebi povećava ukupnu brzinu završavanja zadataka), zadacima programiranja, praćenju instrukcija i korišćenju alatki za pretragu — i podržava veb pretragu(отвара се у новом прозору) na našoj API platformi. Sierra(отвара се у новом прозору) je podelila da je GPT‑5.1 u režimu „bez rezonovanja“ pokazao „20% bolje performanse pri pozivanju alatki sa niskom latencijom u poređenju sa GPT‑5 minimal reasoning“ u njihovim realnim evaluacijama.
Uvođenjem vrednosti 'none' u reasoning_effort, programeri sada imaju još više fleksibilnosti i kontrole nad ravnotežom između brzine, cene i inteligencije za svoj slučaj upotrebe. GPT‑5.1 podrazumevano koristi 'none', što je idealno za radna opterećenja osetljiva na latenciju. Preporučujemo programerima da izaberu 'low' ili 'medium' za složenije zadatke, a 'high' kada su inteligencija i pouzdanost važniji od brzine.
Prošireno keširanje poboljšava efikasnost rezonovanja tako što omogućava da instrukcije ostanu aktivne u kešu do 24 sata, umesto nekoliko minuta koliko je danas podržano. Uz duži period zadržavanja, veći broj naknadnih zahteva može da iskoristi keširani kontekst — što rezultira manjom latencijom, nižim troškovima i ujednačenijim performansama za dugotrajne interakcije kao što su višekružni razgovori, sesije programiranja ili tokovi rada za preuzimanje znanja.
Cene keširanja instrukcija ostaju nepromenjene: keširani ulazni tokeni su 90% jeftiniji od nekeširanih tokena, a nema dodatne naplate za upis u keš niti za skladištenje. Da biste koristili prošireno keširanje sa GPT‑5.1, dodajte parametar “prompt_cache_retention='24h'” u Responses API ili API za dovršavanje ćaskanja. Više detalja potražite u dokumentaciji o keširanju instrukcija(отвара се у новом прозору).
GPT‑5.1 nadograđuje programske mogućnosti GPT‑5 kroz upravljiviju programersku ličnost, manje preteranog razmišljanja, bolji kvalitet koda, bolje poruke sa ažuriranjima namenjene korisniku (uvodne poruke) tokom nizova poziva alatki i funkcionalnije frontend dizajne — naročito pri niskom naporu rezonovanja.
Na jednostavnijim zadacima programiranja, kao što su brze izmene koda, veća brzina GPT‑5.1 olakšava brzo iteriranje napred-nazad. Veća brzina GPT‑5.1 na jednostavnim zadacima ne narušava performanse na teškim zadacima. Na SWE-bench Verified, GPT‑5.1 radi čak i duže od GPT‑5 i dostiže 76,3%.
U SWE-bench Verified, model dobija depo koda i opis problema i mora da generiše zakrpu da bi rešio problem. Oznake označavaju napor rezonovanja. Tačnost je usrednjena preko svih 500 problema. Svi modeli koristili su harness sa alatom apply_patch zasnovanim na JSON-u.
Dobili smo rane povratne informacije o GPT‑5.1 od nekolicine kompanija iz oblasti programiranja. Evo njihovih utisaka:
- Augment Code(отвара се у новом прозору) je GPT‑5.1 opisao kao model koji je „promišljeniji, sa manje protraćenih radnji, efikasnijim rezonovanjem i boljim fokusom na zadatak“, a kod njih se vide „tačnije izmene, jednostavniji zahtevi za pregled izmena i brža iteracija kroz projekte sa više fajlova.“
- Cline(отвара се у новом прозору) je podelio da je u njihovim evaluacijama „GPT‑5.1 postigao SOTA na našem benchmarku za uređivanje diff-ova uz poboljšanje od 7%, demonstrirajući izuzetnu pouzdanost za složene zadatke programiranja.“
- CodeRabbit(отвара се у новом прозору) je GPT‑5.1 nazvao svojim „najpoželjnijim modelom za PR preglede.“
- Cognition(отвара се у новом прозору) je rekao da je GPT‑5.1 „primetno bolji u razumevanju onoga što tražite i u saradnji sa vama da se to obavi.“
- Factory(отвара се у новом прозору) je rekao: „GPT‑5.1 pruža primetno odzivnije odgovore i prilagođava dubinu rezonovanja zadatku, smanjujući preterano razmišljanje i poboljšavajući celokupno iskustvo programera.“
- Warp(отвара се у новом прозору) postavlja GPT‑5.1 kao podrazumevani izbor za nove korisnike, navodeći da „nadograđuje impresivna poboljšanja inteligencije koja je uvela serija GPT‑5, a pritom je daleko odzivniji model.“
„GPT 5.1 nije samo još jedan veliki jezički model (LLM) — on je zaista agentičan, najprirodnije autonoman model koji sam ikada testirao. Piše kao vi, programira kao vi, s lakoćom prati složene instrukcije i odlično se snalazi u front-end zadacima, uklapajući se uredno u vašu postojeću bazu koda. Njegov puni potencijal zaista možete otključati u API-ju Responses i uzbuđeni smo što ga nudimo u našem IDE-u.“
Sa GPT‑5.1 uvodimo dve nove alatke kako bismo pomogli programerima da izvuku maksimum iz modela u API-ju Responses: slobodnu apply_patch alatku za još pouzdanije izmene koda bez potrebe za JSON escaping-om i shell alatku koja omogućava modelu da piše komande za pokretanje na vašoj lokalnoj mašini.
Slobodna alatka apply_patch omogućava GPT‑5.1 da kreira, ažurira i briše fajlove u bazi koda koristeći strukturirane diff-ove. Umesto da samo predlaže izmene, model emituje patch operacije koje aplikacija primenjuje i o kojima vraća izveštaj, čime se omogućavaju iterativni, višekoračni tokovi rada za uređivanje koda.
Da biste koristili alatku apply_patch u API-ju Responses, uključite je u niz tools sa "tools": [{“type”: “apply_patch”}] i ili uključite sadržaj fajla u ulaz ili modelu obezbedite alatke za interakciju sa vašim sistemom fajlova. Model će generisati stavke apply_patch_call za kreiranje, ažuriranje ili brisanje fajlova koje sadrže diff-ove koje primenjujete na svom sistemu fajlova. Više informacija o integraciji sa alatkom apply_patch potražite u našoj dokumentaciji za programere(отвара се у новом прозору).
Shell alatka omogućava modelu da komunicira sa lokalnim računarom preko kontrolisanog interfejsa komandne linije. Model predlaže shell komande; integracija programera ih izvršava i vraća izlaze. Time nastaje jednostavna petlja planiranja i izvršavanja koja omogućava modelima da pregledaju sistem, pokreću pomoćne programe i prikupljaju podatke dok ne mogu da završe zadatak.
Da bi koristili shell alatku u API-ju Responses, programeri mogu da je uključe u niz tools sa "tools": [{“type”: “shell”}]. API će generisati stavke "shell_call" koje uključuju shell komande za izvršavanje. Programeri izvršavaju komande u lokalnom okruženju i vraćaju rezultate izvršavanja u stavci "shell_call_output" u sledećem API zahtevu. Više saznajte u našoj dokumentaciji za programere(отвара се у новом прозору).
GPT‑5.1 i gpt-5.1-chat-latest dostupni su programerima na svim plaćenim nivoima u API-ju. Cene i ograničenja brzine(отвара се у новом прозору) isti su kao za GPT‑5. Takođe objavljujemo gpt-5.1-codex i gpt-5.1-codex-mini u API-ju. Iako je GPT‑5.1 odličan u većini zadataka programiranja, modeli gpt-5.1-codex optimizovani su za dugotrajne, agentične zadatke programiranja u okruženjima Codex ili harnessima sličnim Codex-u.
Programeri mogu da počnu da grade koristeći našu dokumentaciju za programere(отвара се у новом прозору) za GPT‑5.1 i vodič za instrukcije modela(отвара се у новом прозору). Trenutno ne planiramo da ukinemo GPT‑5 u API-ju i unapred ćemo obavestiti programere ako i kada odlučimo da to učinimo.
Posvećeni smo iterativnom uvođenju najsposobnijih i najpouzdanijih modela za stvarni agentični rad i programiranje — modela koji efikasno razmišljaju, brzo iteriraju i nose se sa složenim zadacima, a pritom programere održavaju u toku rada. Uz adaptivno rezonovanje, jače performanse u programiranju, jasnija obaveštenja okrenuta korisniku i nove alatke kao što su apply_patch i shell, GPT‑5.1 je osmišljen da vam pomogne da gradite uz manje trenja. I nastavljamo snažno da ulažemo u ovu oblast: u narednim nedeljama i mesecima možete očekivati sposobnije agentične modele i modele za programiranje.
Evaluacija | GPT‑5.1 (visoko) | GPT‑5 (visoko) |
SWE-bench Verified | 76.3% | 72.8% |
GPQA Diamond | 88.1% | 85.7% |
AIME 2025 | 94.0% | 94.6% |
FrontierMath | 26.7% | 26.3% |
MMMU | 85.4% | 84.2% |
Tau2-bench Airline | 67.0% | 62.6% |
Tau2-bench Telecom* | 95.6% | 96.7% |
Tau2-bench Retail | 77.9% | 81.1% |
BrowseComp Long Context 128k | 90.0% | 90.0% |
* Za Tau2-bench Telecom, GPT‑5.1 smo dali kratak, generički koristan prompt kako bismo poboljšali njegove performanse.


