Framsteg inom vetenskap och matematik med GPT‑5.2
GPT‑5.2 är vår starkaste modell hittills för matematik och naturvetenskapligt arbete.
En av våra förhoppningar för stark AI är att den ska påskynda vetenskaplig forskning till förmån för alla, hjälpa forskare att utforska fler idéer, testa dem snabbare och omvandla upptäckter till verklig påverkan.
Under det senaste året har vi arbetat nära med forskare inom matematik, fysik, biologi och datavetenskap för att förstå var AI kan hjälpa till – och var det fortfarande inte räcker till. Förra månaden publicerade vi en artikel som sammanställer tidiga fallstudier inom matematik, fysik, biologi, datavetenskap, astronomi och materialvetenskap där GPT‑5 hjälpte forskare att visa hur GPT‑5 redan har börjat bidra till verkligt vetenskapligt arbete. Med GPT‑5.2 börjar vi se att dessa vinster blir mer konsekventa och mer tillförlitliga.
GPT‑5.2 Pro och GPT‑5.2 Thinking är våra starkaste modeller hittills för vetenskapligt och matematiskt arbete.
Starkt matematiskt resonemang är en grund för tillförlitlighet inom vetenskapligt och tekniskt arbete. Det aktiverar modeller att följa flerstegslogik, hålla kvantiteter konsekventa och undvika subtila fel som kan förvärras i verkliga analyser – från simuleringar och statistik till prognoser och modellering. Förbättringar för riktmärken som FrontierMath återspeglar inte en smal färdighet, utan starkare allmänna resonemang och abstraktioner, förmågor som direkt överförs till vetenskapliga arbetsflöden som kodning, dataanalys och experimentell design.
Dessa förmågor är också nära kopplade till framsteg mot allmän intelligens. Ett system som på ett tillförlitligt sätt kan resonera genom abstraktion, upprätthålla konsekvens över långa tankekedjor och generalisera över domäner uppvisar egenskaper som är grundläggande för AGI – inte uppgiftsspecifika knep, utan breda, överförbara resonemangsfärdigheter som är viktiga inom vetenskap, teknik och beslutsfattande i den verkliga världen.
Vi anser att GPT‑5.2 Pro och GPT‑5.2 Thinking är världens bästa modeller för att bistå och accelerera forskare. På GPQA Diamond, ett Google-säkert Q&A-riktmärke på avancerad nivå, GPT‑5.2 Pro 93,2 %, tätt följt av GPT‑5.2 Thinking med 92,4 %.
I GPQA Diamond(öppnas i ett nytt fönster) besvarar modeller flervalsfrågor om fysik, kemi och biologi. Inga verktyg var aktiverade och resonemangsinsatsen var inställd på maximal nivå.
På FrontierMath (Tier 1–3), en utvärdering av matematik på expertnivå, GPT‑5.2 Thinking satte en ny standard genom att lösa 40,3 % av problemen.
I FrontierMath(öppnas i ett nytt fönster) löser modeller matematiska problem på expertnivå. Ett Python-verktyg aktiverades och resonemangsinsatsen ställdes in på maximal.
Fallstudie
Detta resultat antyder en användbar riktning för hur AI-system kan ge stöd för vetenskaplig forskning, särskilt inom domäner med axiomatiska teoretiska grunder som matematik och teoretisk datavetenskap. I miljöer som dessa kan banbrytande modeller hjälpa till att utforska bevis, testa hypoteser och identifiera samband som annars skulle kräva betydande mänskliga insatser att upptäcka.
Samtidigt är dessa system inte självständiga forskare. Expertbedömning, verifiering och förståelse av domäner förblir avgörande. Även mycket kapabla modeller kan göra misstag eller förlita sig på outtalade antaganden. Men de kan också skapa detaljerade, strukturerade argument som förtjänar noggrann mänsklig granskning och förfining. Att göra tillförlitliga framsteg med AI beror därför på arbetsflöden som säkerställer att validering, transparens och samarbete är en del av processen.
Sett som en fallstudie illustrerar detta resultat ett framväxande forskningssätt. Modeller som GPT‑5.2 kan fungera som verktyg för att stödja matematiskt resonemang och påskynda tidig utforskning, medan ansvaret för korrekthet, tolkning och kontext kvarstår hos mänskliga forskare. Om de används försiktigt kan sådana system hjälpa till att effektivisera viktiga aspekter av teoretiskt arbete utan att ersätta den centrala rollen av mänskligt omdöme i vetenskaplig forskning.


