Riset OpenAI | Publikasi

Riset

Ganti kartu untuk menampilkan Media

Ganti kartu untuk menyembunyikan Media

Keselamatan

15 Jul 2026

GPT-Red: Membuka Jalan Peningkatan Diri untuk Ketangguhan

Jelajahi GPT-Red, sistem red teaming otomatis OpenAI yang memakai self-play untuk meningkatkan keamanan, keselarasan, dan ketahanan terhadap injeksi prompt.

Keselamatan

9 Jul 2026

GPT‑5.6 System Card

GPT-5.6 is a new family of three models: Sol, our new flagship model; Terra, a capable lower-cost option; and Luna, our fastest and most cost-efficient model. The safeguards we have built for this launch—our most robust yet—are built to deliver these models safely and at scale, around the world.

Riset

8 Jul 2026

Memisahkan sinyal dari derau dalam evaluasi pengodean

Analisis baru OpenAI mengungkap masalah di SWE-Bench Pro, benchmark pengodean populer, yang memunculkan kekhawatiran atas keandalan dan akurasi evaluasi model AI.

Keselamatan

8 Jul 2026

GPT‑Live System Card

GPT-Live-1 and GPT-Live-1 mini are a new generation of voice models designed to make conversations with AI feel more natural and intelligent.

Riset

30 Jun 2026

Memperkenalkan GeneBench-Pro

Memperkenalkan GeneBench-Pro, benchmark baru yang menguji performa AI dalam genomika, biologi, dan penelitian ilmiah menggunakan kumpulan data dunia nyata yang kompleks.

Keselamatan

26 Jun 2026

GPT‑5.6 Preview System Card

GPT-5.6 is a new family of three models: Sol, our new flagship model; Terra, a capable lower-cost option; and Luna, our fastest and most cost-efficient model. The safeguards we have built for this launch – our most robust yet – are built to deliver these models safely and at scale, around the world.

Riset

17 Jun 2026

Ahli kimia AI yang hampir otonom meningkatkan reaksi sulit dalam kimia medisinal

OpenAI dan Molecule.one menunjukkan bagaimana ahli kimia AI yang hampir otonom yang menggunakan GPT-5.4 meningkatkan reaksi kunci dalam pembuatan obat, memajukan penelitian kimia medisinal.

Riset

17 Jun 2026

Memperkenalkan LifeSciBench

Memperkenalkan LifeSciBench, benchmark yang ditulis dan ditinjau pakar untuk menilai cara sistem AI menangani tugas dan keputusan riset ilmu hayati nyata.

Keselamatan

5 Mei 2026

GPT-5.5 Instant System Card