Investigações da OpenAI | Publicação

Investigações

Trocar cartões para mostrar mídia

Trocar cartões para ocultar mídia

Segurança

15 de jul. de 2026

GPT-Red: Desbloqueando autoaperfeiçoamento para robustez

Conheça o GPT-Red, sistema automatizado de red teaming da OpenAI que usa self-play para melhorar segurança, alinhamento e robustez contra injeção de prompt.

Segurança

9 de jul. de 2026

GPT‑5.6 System Card

GPT-5.6 is a new family of three models: Sol, our new flagship model; Terra, a capable lower-cost option; and Luna, our fastest and most cost-efficient model. The safeguards we have built for this launch—our most robust yet—are built to deliver these models safely and at scale, around the world.

Pesquisa

8 de jul. de 2026

Separando sinal de ruído em avaliações de programação

Nova análise da OpenAI revela problemas no SWE-Bench Pro, benchmark popular de programação, levantando dúvidas sobre confiabilidade e precisão na avaliação de modelos de IA.

Segurança

8 de jul. de 2026

GPT‑Live System Card

GPT-Live-1 and GPT-Live-1 mini are a new generation of voice models designed to make conversations with AI feel more natural and intelligent.

Pesquisa

30 de jun. de 2026

Apresentamos o GeneBench-Pro

Apresentamos o GeneBench-Pro, um novo benchmark que testa o desempenho de IA em genômica, biologia e pesquisa científica usando conjuntos de dados complexos e do mundo real.

Segurança

26 de jun. de 2026

GPT‑5.6 Preview System Card

GPT-5.6 is a new family of three models: Sol, our new flagship model; Terra, a capable lower-cost option; and Luna, our fastest and most cost-efficient model. The safeguards we have built for this launch – our most robust yet – are built to deliver these models safely and at scale, around the world.

Pesquisa

17 de jun. de 2026

Um químico de AI quase autônomo melhora uma reação desafiadora na química medicinal

OpenAI e Molecule.one mostram como um químico de AI quase autônomo usando GPT-5.4 melhorou uma reação-chave para produzir medicamentos, avançando a pesquisa em química medicinal.

Pesquisa

17 de jun. de 2026

Apresentando o LifeSciBench

Apresentamos o LifeSciBench, benchmark criado e revisado por especialistas para avaliar sistemas de AI em tarefas e decisões reais de ciências da vida.

Segurança

5 de mai. de 2026

GPT-5.5 Instant System Card