OpenAI-forskning | Publikation

Forskning

Byt kort för att visa media

Byt kort för att dölja media

Säkerhet

15 juli 2026

Utforska GPT-Red, OpenAI:s automatiserade red teaming-system som använder självspel för att förbättra AI-säkerhet, anpassning och robusthet mot promptinjektioner.

Säkerhet

9 juli 2026

GPT‑5.6 System Card

GPT-5.6 is a new family of three models: Sol, our new flagship model; Terra, a capable lower-cost option; and Luna, our fastest and most cost-efficient model. The safeguards we have built for this launch—our most robust yet—are built to deliver these models safely and at scale, around the world.

Forskning

8 juli 2026

Skilja signal från brus i kodningsutvärderingar

En ny analys från OpenAI avslöjar problem i SWE-Bench Pro, ett populärt riktmärke för kodning, och väcker frågor om tillförlitlighet och precision vid utvärdering av AI-modeller.

Säkerhet

8 juli 2026

GPT‑Live System Card

GPT-Live-1 and GPT-Live-1 mini are a new generation of voice models designed to make conversations with AI feel more natural and intelligent.

Forskning

30 juni 2026

Vi introducerar GeneBench-Pro

Vi introducerar GeneBench-Pro, ett nytt benchmark som testar AI-prestanda inom genomik, biologi och forskning med komplexa, verkliga dataset.

Säkerhet

26 juni 2026

GPT‑5.6 Preview System Card

GPT-5.6 is a new family of three models: Sol, our new flagship model; Terra, a capable lower-cost option; and Luna, our fastest and most cost-efficient model. The safeguards we have built for this launch – our most robust yet – are built to deliver these models safely and at scale, around the world.

Forskning

17 juni 2026

En nästan autonom AI-kemist förbättrar en utmanande reaktion inom läkemedelskemi

OpenAI och Molecule.one visar hur en nästan autonom AI-kemist med GPT-5.4 förbättrade en viktig reaktion för läkemedelsframställning och främjade forskning inom läkemedelskemi.

Forskning

17 juni 2026

Introduktion av LifeSciBench

Introduktion av LifeSciBench, ett expertförfattat och expertgranskat benchmark för att utvärdera hur AI-system hanterar verkliga uppgifter och beslut inom livsvetenskap.

Säkerhet

5 maj 2026

GPT-5.5 Instant System Card