Унапређење науке и математике уз GPT‑5.2
GPT‑5.2 је наш најмоћнији модел до сада за рад у математици и науци.
Једна од наших нада за снажну вештачку интелигенцију јесте да ће убрзати научна истраживања на добробит свих, помажући истраживачима да истраже више идеја, брже их тестирају и открића претворе у утицај.
Током протекле године, блиско смо сарађивали са научницима из математике, физике, биологије и информатике да бисмо разумели где AI може да помогне — и где још увек не достиже потребан ниво. Прошлог месеца објавили смо рад који прикупља ране студије случаја из математике, физике, биологије, информатике, астрономије и науке о материјалима, у којима је GPT‑5 помогао истраживачима, показујући како је GPT‑5 већ почео да доприноси стварном научном раду. Са GPT‑5.2, почињемо да видимо да ти помаци постају доследнији и поузданији.
GPT‑5.2 Pro и GPT‑5.2 Thinking су наши најмоћнији модели до сада за научни и математички рад.
Снажно математичко резоновање је основа поузданости у научном и техничком раду. Оно омогућава моделима да прате вишекорачну логику, одрже доследност количина и избегну суптилне грешке које се могу нагомилати у стварним анализама — од симулација и статистике до предвиђања и моделирања. Побољшања на бенчмарковима као што је FrontierMath не одражавају уску вештину, већ јаче опште резоновање и апстракцију, способности које се директно преносе у научне токове рада као што су програмирање, анализа података и осмишљавање експеримената.
Ове способности су такође уско повезане са напретком ка општој интелигенцији. Систем који може поуздано да резонује кроз апстракцију, одржава доследност кроз дуге низове мишљења и генерализује кроз различите домене показује особине које су темељне за AGI — не трикове специфичне за задатак, већ широке, преносиве вештине резоновања које су важне у науци, инжењерству и доношењу одлука у стварном свету.
Верујемо да су GPT‑5.2 Pro и GPT‑5.2 Thinking најбољи модели на свету за помоћ научницима и убрзавање њиховог рада. На GPQA Diamond, бенчмарку питања и одговора на постдипломском нивоу отпорном на Google претрагу, GPT‑5.2 Pro постиже 93,2%, а одмах иза њега GPT‑5.2 Thinking са 92,4%.
У GPQA Diamond(отвара се у новом прозору), модели одговарају на питања вишеструког избора из физике, хемије и биологије. Ниједан алат није био омогућен, а ниво уложеног резоновања постављен на максимум.
На FrontierMath (Tier 1–3), евалуацији математике на нивоу стручњака, GPT‑5.2 Thinking поставио је нови најсавременији резултат, решивши 40,3% проблема.
У FrontierMath(отвара се у новом прозору), модели решавају математичке проблеме на нивоу стручњака. Python алат је био омогућен, а ниво уложеног резоновања постављен на максимум.
Студија случаја
Овај резултат указује на користан правац у томе како AI системи могу да подрже научна истраживања, посебно у доменима са аксиоматским теоријским основама као што су математика и теоријска информатика. У оваквим окружењима, гранични модели могу помоћи у истраживању доказа, тестирању хипотеза и препознавању веза за чије би откривање иначе био потребан значајан људски труд.
Истовремено, ови системи нису независни истраживачи. Стручно расуђивање, провера и разумевање домена и даље су од суштинског значаја. Чак и веома способни модели могу правити грешке или се ослањати на непоменуте претпоставке. Али могу и да произведу детаљне, структурисане аргументе који заслужују пажљиво људско проучавање и дораду. Зато поуздан напредак уз AI зависи од токова рада који чврсто задржавају валидацију, транспарентност и сарадњу у самом процесу.
Посматран као студија случаја, овај резултат илуструје нови начин истраживачке праксе. Модели као што је GPT‑5.2 могу служити као алати за подршку математичком резоновању и убрзавање истраживања у раној фази, док одговорност за тачност, тумачење и контекст остаје на људским истраживачима. Ако се користе пажљиво, овакви системи могу помоћи да се поједноставе значајни аспекти теоријског рада без потискивања централне улоге људског расуђивања у научном истраживању.


