OpenAI-research | Publikasjoner

Research

Bytt kort for å vise medier

Bytt kort for å skjule medier

Sikkerhet

15. juli 2026

GPT-Red: Låser opp selvforbedring for robusthet

Utforsk GPT-Red, OpenAIs automatiserte red teaming-system som bruker selvspill til å forbedre KI-sikkerhet, alignment og robusthet mot promptinjeksjon.

Sikkerhet

9. juli 2026

GPT‑5.6 System Card

GPT-5.6 is a new family of three models: Sol, our new flagship model; Terra, a capable lower-cost option; and Luna, our fastest and most cost-efficient model. The safeguards we have built for this launch—our most robust yet—are built to deliver these models safely and at scale, around the world.

Research

8. juli 2026

Skille signal fra støy i kodeevalueringer

En ny analyse fra OpenAI avdekker problemer i SWE-Bench Pro, en populær kodebenchmark, og reiser spørsmål om pålitelighet og nøyaktighet i evaluering av KI-modeller.

Sikkerhet

8. juli 2026

GPT‑Live System Card

GPT-Live-1 and GPT-Live-1 mini are a new generation of voice models designed to make conversations with AI feel more natural and intelligent.

Research

30. juni 2026

Vi introduserer GeneBench-Pro

Vi introduserer GeneBench-Pro, en ny referansetest som tester KI-ytelse innen genomikk, biologi og vitenskapelig forskning ved hjelp av komplekse datasett fra den virkelige verden.

Sikkerhet

26. juni 2026

GPT‑5.6 Preview System Card

GPT-5.6 is a new family of three models: Sol, our new flagship model; Terra, a capable lower-cost option; and Luna, our fastest and most cost-efficient model. The safeguards we have built for this launch – our most robust yet – are built to deliver these models safely and at scale, around the world.

Research

17. juni 2026

En nær-autonom AI-kjemiker forbedrer en utfordrende reaksjon i legemiddelkjemi

OpenAI og Molecule.one viser hvordan en nær-autonom AI-kjemiker som bruker GPT-5.4, forbedret en nøkkelreaksjon for legemiddelproduksjon og fremmet forskning innen legemiddelkjemi.

Research

17. juni 2026

Introduksjon til LifeSciBench

LifeSciBench: ekspertutviklet og ekspertvurdert benchmark for å evaluere hvordan AI-systemer håndterer reelle forskningsoppgaver og beslutninger innen livsvitenskap.

Sikkerhet

5. mai 2026

GPT-5.5 Instant System Card