Avancimi i shkencës dhe i matematikës me GPT‑5.2
GPT‑5.2 është modeli ynë më i fuqishëm deri sot për punë në matematikë dhe shkencë.
Një nga shpresat tona për inteligjencën artificiale të fortë është që ajo do të përshpejtojë kërkimet shkencore për përfitimin e të gjithëve, duke ndihmuar studiuesit të eksplorojnë më shumë ide, t'i testojnë më shpejt dhe të kthejnë zbulimet në ndikim.
Gjatë vitit të kaluar, kemi punuar ngushtë me shkencëtarë në matematikë, fizikë, biologji dhe shkencë kompjuterike për të kuptuar se ku AI mund të ndihmojë—dhe ku ende ka mangësi. Muajin e kaluar, ne publikuam një punim që përmbledh studime të hershme rastesh në matematikë, fizikë, biologji, shkencë kompjuterike, astronomi dhe shkencë materialesh, ku GPT‑5 ndihmoi studiuesit duke treguar se si GPT‑5 ka filluar tashmë të kontribuojë në punën e mirëfilltë shkencore. Me GPT‑5.2, po fillojmë të shohim që këto përfitime po bëhen më të qëndrueshme dhe më të besueshme.
GPT‑5.2 Pro dhe GPT‑5.2 Thinking janë modelet tona më të fuqishme deri më tani për punë shkencore dhe matematikore.
Arsyetimi i fortë matematikor është themeli për besueshmëri në punën shkencore dhe teknike. Kjo aktivizon modelet të ndjekin logjikën me shumë hapa, të ruajnë sasinë konsistente dhe të shmangin gabimet e imta që mund të grumbullohen në analiza reale—nga simulimet dhe statistikat deri te parashikimi dhe modelimi. Përmirësimet në standarde si FrontierMath nuk pasqyrojnë një aftësi të ngushtë, por një arsyetim dhe abstragim më të fortë të përgjithshëm, aftësi që kalojnë drejtpërdrejt në flukset e punës shkencore si kodimi, analiza e të dhënave dhe dizajni eksperimental.
Këto aftësi janë gjithashtu të lidhura ngushtë me përparimin drejt inteligjencës së përgjithshme. Një sistem që mund të arsyetojë në mënyrë të besueshme përmes abstraksionit, të ruajë konsistencën në zinxhirë të gjatë mendimesh dhe të përgjithësojë nëpër fusha të ndryshme, po shfaq tipare që janë themelore për AGI—jo truke specifike për detyra, por aftësi të gjera dhe të transferueshme të arsyetimit që kanë rëndësi në shkencë, inxhinieri dhe marrjen e vendimeve në botën reale.
Ne besojmë se GPT‑5.2 Pro dhe GPT‑5.2 Thinking janë modelet më të mira në botë për të ndihmuar dhe përshpejtuar shkencëtarët. Në GPQA Diamond, një standard pyetje-përgjigjesh në nivelin e diplomantëve që është i papërshkueshëm nga Google, GPT‑5.2 Pro arrin 93.2%, i ndjekur nga afër nga GPT‑5.2 Thinking në 92.4%.
Në GPQA Diamond(hapet në një dritare të re), modelet i përgjigjen pyetjeve me zgjedhje të shumëfishta për fizikë, kimi dhe biologji. Asnjë mjet nuk ishte aktivizuar dhe përpjekja e arsyetimit u vendos në maksimum.
Në FrontierMath (Niveli 1–3), një vlerësim i matematikës në nivel ekspertësh, GPT‑5.2 Thinking vendosi një standard të ri, duke zgjidhur 40.3% të problemeve.
Në FrontierMath(hapet në një dritare të re), modele zgjidhin probleme matematike të nivelit ekspert. Një mjet Python u aktivizua dhe përpjekja e arsyetimit u vendos në maksimum.
Studim rasti
Ky rezultat sugjeron një drejtim të dobishëm për mënyrën se si sistemet AI mund të ofrojnë mbështetje për kërkimin shkencor, veçanërisht në fushat me baza teorike aksiomatike si matematika dhe informatika teorike. Në mjedise si këto, modelet kufitare mund të ndihmojnë në eksplorimin e provave, testimin e hipotezave dhe identifikimin e lidhjeve që përndryshe do të kërkonin përpjekje të konsiderueshme njerëzore për t'u zbuluar.
Në të njëjtën kohë, këto sisteme nuk janë studiues të pavarur. Gjykimi i ekspertëve, verifikimi dhe kuptimi i fushës mbeten thelbësore. Edhe modelet shumë të afta mund të bëjnë gabime ose të mbështeten në supozime të pashprehura. Por ato gjithashtu mund të prodhojnë argumente të detajuara dhe të strukturuara që meritojnë studim dhe përpunim të kujdesshëm nga njerëzit. Përparimi i besueshëm me AI prandaj varet nga ciklet e punës që mbajnë vlefshmërinë, transparencën dhe bashkëpunimin të përfshirë në proces.
I parë si një studim rasti, ky rezultat ilustron një modalitet të ri të praktikës kërkimore. Modelet si GPT‑5.2 mund të shërbejnë si mjete për të mbështetur arsyetimin matematikor dhe për të përshpejtuar eksplorimin në fazat e hershme, ndërsa përgjegjësia për saktësinë, interpretimin dhe kontekstin mbetet te studiuesit njerëzorë. Nëse përdoren me kujdes, sisteme të tilla mund të ndihmojnë në thjeshtimin e aspekteve të rëndësishme të punës teorike pa zëvendësuar rolin qendror të gjykimit njerëzor në kërkimin shkencor.


