Unapređenje nauke i matematike uz GPT‑5.2
GPT‑5.2 je naš najjači model do sada za rad u matematici i nauci.
Jedna od naših nada za snažnu vještačku inteligenciju je da će ubrzati naučna istraživanja na korist svima, pomažući istraživačima da istražiti više ideja, brže ih testiraju i pretvore otkrića u uticaj.
Tokom protekle godine, blisko smo sarađivali sa naučnicima iz matematike, fizike, biologije i računarstva kako bismo razumjeli gdje UI može pomoći—i gdje još uvijek ne ispunjava očekivanja. Prošlog mjeseca smo objavili rad koji sakuplja rane studije slučaja iz matematike, fizike, biologije, računarstva, astronomije i nauke o materijalima u kojima je GPT‑5 pomogao istraživačima, pokazujući kako je GPT‑5 već počeo doprinositi stvarnom naučnom radu. Sa GPT‑5.2, počinjemo primjećivati da ti dobici postaju konzistentniji i pouzdaniji.
GPT‑5.2 Pro i GPT‑5.2 Thinking su naši najjači modeli do sada za naučni i matematički rad.
Snažno matematičko rezonovanje je osnova za pouzdanost u naučnom i tehničkom radu. Omogućava modelima da slijede višestepenu logiku, održavaju konzistentnost količina i izbjegavaju suptilne greške koje se mogu nagomilati u stvarnim analizama—od simulacija i statistike do predviđanja i modeliranja. Poboljšanja na mjerilima poput FrontierMath ne odražavaju usku vještinu, već snažnije opće rezonovanje i apstrakciju, sposobnosti koje se direktno prenose u naučne tokove rada kao što su programiranje, analiza podataka i eksperimentalni dizajn.
Ove sposobnosti su također usko povezane s napretkom prema općoj inteligenciji. Sistem koji može pouzdano rezonovati kroz apstrakciju, održavati dosljednost kroz duge lance misli i generalizovati kroz domene pokazuje osobine koje su temeljne za AGI—ne trikove specifične za zadatke, već široke, prenosive vještine rezonovanja koje su važne u nauci, inženjeringu i donošenju odluka u stvarnom svijetu.
Vjerujemo da je GPT‑5.2 Pro i GPT‑5.2 Thinking modeli su najbolji svjetski modeli za pomoć i ubrzavanje rada naučnika. Na GPQA Diamond, mjerilu za pitanja i odgovore na nivou postdiplomskih studija koje je otporno na Google pretragu, GPT‑5.2 Pro postiže 93,2%, a slijedi ga GPT‑5.2 Thinking na 92,4%.
U GPQA Diamond(otvara se u novom prozoru), modeli odgovaraju na pitanja s višestrukim izborom iz fizike, kemije i biologije. Nijedan alat nije bio omogućen, a napor rezonovanja je postavljen na maksimum.
Na FrontierMath (Nivo 1–3), evaluacija matematike na ekspertskom nivou, GPT‑5.2 Thinking je postavio novi standard u umjetnosti, rješavajući 40,3% problema.
U FrontierMath(otvara se u novom prozoru), modeli rješavaju matematičke probleme na stručnom nivou. Python alat je omogućen i napor rezonovanja je postavljen na maksimum.
Studija slučaja
Ovaj rezultat sugerira korisnu smjernicu o tome kako UI sistemi mogu pružiti podršku naučnom istraživanju, posebno u domenama s aksiomatskim teorijskim osnovama kao što su matematika i teorijska računalna nauka. U ovakvim okruženjima, granični modeli mogu pomoći u istraživanju dokaza, testiranju hipoteza i identifikaciji veza koje bi inače zahtijevale značajan ljudski napor da se otkriju.
Istovremeno, ovi sistemi nisu nezavisni istraživači. Stručna procjena, potvrda i razumijevanje domene ostaju ključni. Čak i vrlo sposobni modeli mogu praviti greške ili se oslanjati na neizrečene pretpostavke. Ali oni također mogu proizvesti detaljne, strukturirane argumente koji zaslužuju pažljivo ljudsko proučavanje i usavršavanje. Pouzdan napredak u AI stoga ovisi o tokovima rada koji osiguravaju da validacija, transparentnost i saradnja ostanu u procesu.
Posmatrano kao studija slučaja, ovaj rezultat ilustrira novi način istraživačke prakse. Modeli poput GPT‑5.2 mogu služiti kao alati za podršku matematičkom rezonovanju i ubrzavanje istraživanja u ranoj fazi, dok odgovornost za tačnost, interpretaciju i kontekst ostaje na ljudskim istraživačima. Ako se pažljivo koriste, takvi sistemi mogu pomoći u pojednostavljivanju značajnih aspekata teorijskog rada bez zamjene centralne uloge ljudske prosudbe u naučnom istraživanju.


