Напредок на науката и математиката со GPT‑5.2
GPT‑5.2 е нашиот најсилен модел досега за работа во математиката и науката.
Една од нашите надежи за силната вештачка интелигенција е дека ќе го забрза научното истражување за доброто на сите, помагајќи им на истражувачите да истражи повеќе идеи, побрзо да ги тестираат и да ги претворат откритијата во влијание.
Во текот на изминатата година, бевме во тесна соработка со научници од областа на математиката, физиката, биологијата и компјутерските науки за да разбереме каде вештачката интелигенција може да помогне, а каде сè уште не успева. Минатиот месец објавивме труд што собира рани студии на случај од областа на математиката, физиката, биологијата, компјутерските науки, астрономијата и науката за материјали во кој GPT‑5 им помогна на истражувачите да покажат како GPT‑5 веќе почна да придонесува кон вистинска научна работа. Со GPT‑5.2, почнуваме да ги гледаме тие придобивки како стануваат поконзистентни и посигурни.
GPT‑5.2 Pro и GPT‑5.2 Thinking се нашите најсилни модели досега за научна и математичка работа.
Силното математичко расудување е темел за доверливост во научната и техничката работа. Тоа им овозможува на моделите да следат повеќечекорна логика, да ги одржуваат количините конзистентни и да избегнуваат суптилни грешки кои можат да се натрупаат во реални анализи – од симулации и статистика до предвидување и моделирање. Подобрувањата на реперите како што е FrontierMath не одразуваат тесна вештина, туку посилно општо расудување и апстракција, способности кои директно се пренесуваат во научни работни процеси како кодирање, анализа на податоци и дизајн на експерименти.
Овие способности се исто така тесно поврзани со напредокот кон општата интелигенција. Систем што може сигурно да расуди преку апстракција, да одржува конзистентност низ долги синџири на мисли и да генерализира низ домени, покажува карактеристики кои се основни за AGI – не трикови специфични за задачи, туку широки, преносливи вештини за расудување кои се важни низ науката, инженерството и донесувањето одлуки во реалниот свет.
Веруваме дека GPT‑5.2 Pro и GPT‑5.2 Thinking се најдобрите модели во светот за помош и забрзување на научниците. На GPQA Diamond, постдипломско ниво на бенчмарк за прашања и одговори отпорен на Google, GPT‑5.2 Pro постигнува 93,2%, следен блиску од GPT‑5.2 Thinking на 92,4%.
Во GPQA Diamond(се отвора во нов прозорец), моделите одговараат на прашања со повеќе избори за физика, хемија и биологија. Ниту една алатка не беше овозможена и напорот за расудување беше поставен на максимум.
На FrontierMath (Ниво 1–3), евалуација на експертско ниво на математика, GPT‑5.2 Thinking постави нов стандард, решавајќи 40.3% од проблемите.
Во FrontierMath(се отвора во нов прозорец), моделите решаваат експертски математички проблеми. Python алатката беше овозможена и напорот за расудување беше поставен на максимум.
Студија на случај
Овој резултат сугерира корисна насока за тоа како системите на вештачка интелигенција можат да поддржуваат научни истражувања, особено во домени со аксиоматски теоретски основи како што се математиката и теоретската компјутерска наука. Во вакви поставки, најсовремените модели можат да помогнат да се истражат докази, да се тестираат хипотези и да се идентификуваат врски кои инаку би барале значителен човечки напор за да се откријат.
Во исто време, овие системи не се независни истражувачи. Експертска проценка, потврда и разбирање на доменот остануваат суштински. Дури и многу способни модели можат да направат грешки или да се потпрат на неизречени претпоставки. Но, тие исто така можат да создадат детални, структурирани аргументи кои заслужуваат внимателно човечко проучување и усовршување. Постигнувањето на сигурен напредок со вештачка интелигенција зависи од работни процеси кои ја одржуваат валидацијата, транспарентноста и соработката цврсто во текот на процесот.
Гледано како студија на случај, овој резултат илустрира нов начин на истражувачка практика. Модели како GPT‑5.2 можат да служат како алатки за поддршка на математичко расудување и забрзување на раната фаза на истражување, додека одговорноста за точност, интерпретација и контекст останува кај човечките истражувачи. Ако се користат внимателно, ваквите системи може да помогнат во рационализирање на значајни аспекти од теоретската работа без да ја заменат централната улога на човечката проценка во научното истражување.


