OpenAI Research | Publikation

Research

Skift kort for at vise medie

Skift kort for at skjule medie

Sikkerhed

15. jul. 2026

GPT-Red: Frigør selvforbedring for robusthed

Udforsk GPT-Red, OpenAI’s automatiserede red-teaming-system, der bruger self-play til at forbedre AI-sikkerhed, alignment og robusthed mod prompt injection.

Sikkerhed

9. jul. 2026

GPT‑5.6 System Card

GPT-5.6 is a new family of three models: Sol, our new flagship model; Terra, a capable lower-cost option; and Luna, our fastest and most cost-efficient model. The safeguards we have built for this launch—our most robust yet—are built to deliver these models safely and at scale, around the world.

Research

8. jul. 2026

At skelne signal fra støj i kodeevalueringer

En ny analyse fra OpenAI afslører problemer i SWE-Bench Pro, en populær benchmark for kodning, og rejser spørgsmål om pålidelighed og nøjagtighed ved evaluering af AI-modeller.

Sikkerhed

8. jul. 2026

GPT‑Live System Card

GPT-Live-1 and GPT-Live-1 mini are a new generation of voice models designed to make conversations with AI feel more natural and intelligent.

Research

30. jun. 2026

Vi introducerer GeneBench-Pro

Vi introducerer GeneBench-Pro, en ny benchmark, der tester AI-ydeevne inden for genomik, biologi og videnskabelig forskning ved hjælp af komplekse datasæt fra den virkelige verden.

Sikkerhed

26. jun. 2026

GPT‑5.6 Preview System Card

GPT-5.6 is a new family of three models: Sol, our new flagship model; Terra, a capable lower-cost option; and Luna, our fastest and most cost-efficient model. The safeguards we have built for this launch – our most robust yet – are built to deliver these models safely and at scale, around the world.

Research

17. jun. 2026

En næsten autonom AI-kemiker forbedrer en udfordrende reaktion i medicinalkemi

OpenAI og Molecule.one viser, hvordan en næsten autonom AI-kemiker med GPT-5.4 forbedrede en central reaktion til lægemiddelfremstilling og fremmede forskning i medicinalkemi.

Research

17. jun. 2026

Introduktion til LifeSciBench

Introduktion til LifeSciBench, et ekspertforfattet og ekspertbedømt benchmark til at vurdere, hvordan AI-systemer håndterer virkelige life science-opgaver og beslutninger.

Sikkerhed

5. maj 2026

GPT-5.5 Instant System Card