Como as saídas com goblins se espalharam nos modelos de IA: cronologia, causa raiz e correções por trás de peculiaridades de comportamento no GPT-5.
Saiba como as Especificações do Modelo da OpenAI servem como uma estrutura pública para o comportamento do modelo, equilibrando segurança, liberdade do usuário e prestação de contas à medida que os sistemas de IA avançam.
Como a OpenAI usa monitoramento de chain-of-thought para estudar o desalinhamento em agentes internos de programação — analisando implantações no mundo real para detectar riscos e reforçar salvaguardas de segurança de IA.
O IH-Challenge treina modelos para priorizar instruções confiáveis, melhorando a hierarquia de instruções, a orientabilidade de segurança e a resistência a ataques de injeção de prompt.
OpenAI introduces CoT-Control and finds reasoning models struggle to control their chains of thought, reinforcing monitorability as an AI safety safeguard.
Um novo preprint estende amplitudes single-minus para grávitons, com o GPT-5.2 Pro ajudando a derivar e verificar amplitudes de árvore de grávitons não nulas em gravidade quântica.