Estamos a ampliar o nosso programa Trusted Access for Cyber (TAC) a milhares de defensores individuais verificados e a centenas de equipas responsáveis por defender software crítico. Há anos que estamos a construir um programa de ciberdefesa assente nos princípios de acesso democratizado, implementação iterativa e resiliência do ecossistema. Para nos prepararmos para modelos cada vez mais capazes da OpenAI nos próximos meses, estamos a afinar os nossos modelos para casos de utilização defensivos de cibersegurança, começando hoje com uma variante do GPT‑5.4 treinada para ser permissiva em cibersegurança: GPT‑5.4‑Cyber. Neste artigo, partilhamos como esperamos que a nossa abordagem de escalar a ciberdefesa em sintonia com o aumento das capacidades dos modelos oriente os testes e a implementação de lançamentos futuros.
A utilização progressiva de IA acelera os defensores — aqueles responsáveis por manter sistemas, dados e utilizadores seguros — permitindo-lhes encontrar e corrigir problemas mais depressa na infraestrutura digital de que todos dependemos. Da mesma forma, a IA está a ser usada por atacantes que procuram causar dano. Temo-nos preparado para isto. Desde 2023, temos apoiado defensores através do nosso Cybersecurity Grant Program e reforçado salvaguardas através do nosso Preparedness Framework. Nesse mesmo ano, começámos a avaliar as capacidades de cibersegurança dos nossos modelos e, em 2025, começámos a incluir salvaguardas específicas de cibersegurança(abre numa nova janela) nas nossas implementações de modelos. No início deste ano, reforçámos o nosso apoio aos defensores com o lançamento do Codex Security, para identificar e corrigir vulnerabilidades à escala. A nossa abordagem a este avanço contínuo de capacidades é orientada por três princípios:
- Acesso democratizado: o nosso objetivo é disponibilizar estas ferramentas o mais amplamente possível, prevenindo ao mesmo tempo o uso indevido. Concebemos mecanismos que evitam decidir de forma arbitrária quem tem acesso para uso legítimo e quem não tem. Isto significa usar critérios e métodos claros e objetivos — como KYC rigoroso e verificação de identidade — para orientar quem pode aceder a capacidades mais avançadas e automatizar estes processos ao longo do tempo. Em última análise, pretendemos disponibilizar capacidades defensivas avançadas a intervenientes legítimos, grandes e pequenos, incluindo os responsáveis por proteger infraestrutura crítica, serviços públicos e os sistemas digitais de que as pessoas dependem todos os dias.
- Implementação iterativa: aprendemos mais ao colocar estes sistemas no mundo de forma cuidadosa e ao melhorá-los ao longo do tempo. À medida que compreendemos melhor tanto as suas capacidades como os seus riscos, atualizamos os nossos modelos e sistemas de segurança em conformidade. Isto inclui compreender os benefícios e riscos diferenciados de modelos específicos, melhorar a resiliência a jailbreaks e outros ataques adversariais e reforçar capacidades defensivas — mitigando danos.
- Investir na resiliência do ecossistema: apoiamos e aceleramos a comunidade de defensores através de vias de acesso de confiança, subsídios direcionados, contributos para iniciativas de segurança open source(abre numa nova janela) e tecnologias como o Codex Security que ajudam os defensores a encontrar e corrigir vulnerabilidades mais depressa.
A nossa estratégia para resiliência em cibersegurança e aceleração defensiva
Há anos que a nossa estratégia de cibersegurança passa por investir em investigação, prevenir o uso indevido e acelerar os defensores. À medida que as capacidades dos modelos avançaram, expandimos os nossos programas em direção a estes objetivos, assentes nas seguintes convicções:
- O risco de cibersegurança já está aqui e está a acelerar, mas podemos agir.A infraestrutura digital já é vulnerável(abre numa nova janela) há anos, mesmo antes de surgir a IA avançada. Agora, os modelos existentes podem ajudar a encontrar vulnerabilidades, raciocinar sobre bases de código e suportar partes relevantes do fluxo de trabalho de cibersegurança, e os agentes de ameaça estão a experimentar novas abordagens orientadas por IA. Temos visto harnesses sofisticados extraírem capacidades cada vez mais fortes ao usarem mais computação em tempo de teste com modelos existentes. Isto significa que as salvaguardas não podem esperar por um único limiar futuro.
- Expandir o acesso com base em quem usa estes sistemas e como são usados.As capacidades de cibersegurança são inerentemente de dupla utilização, pelo que o risco não é definido apenas pelo modelo. Depende também do utilizador, dos sinais de confiança(abre numa nova janela) em seu torno e do nível de acesso que lhe é concedido.
- Um acesso amplo a modelos gerais com salvaguardas pode coexistir com controlos mais granulares para capacidades de maior risco, suportados por verificação mais rigorosa, sinais de intenção mais claros e melhor visibilidade sobre a utilização.
- Para permitir um uso responsável à escala, precisamos de sistemas que validem utilizadores e casos de utilização de confiança de formas mais automatizadas e mais objetivas. Isto permite-nos expandir o acesso com base em evidência e sinais reais de confiança, em vez de dependermos de decisões manuais. Não achamos prático nem apropriado decidir centralmente quem pode defender-se. Em vez disso, pretendemos permitir o acesso ao maior número possível de defensores legítimos, com acesso assente em verificação, sinais de confiança e responsabilização.
- As defesas devem escalar continuamente com a capacidade. À medida que as capacidades dos modelos aumentam, as defesas têm de escalar em paralelo. Temos observado melhorias consistentes na codificação agêntica, com implicações diretas para a cibersegurança, e ajustámos a nossa abordagem em conformidade.
- Começámos a formação de segurança específica para cibersegurança com o GPT‑5.2 e depois expandimo-la com salvaguardas adicionais no GPT‑5.3‑Codex e no GPT‑5.4, onde também classificámos o modelo como tendo uma capacidade de cibersegurança «alta» ao abrigo do nosso Preparedness Framework. Em paralelo, aumentámos o apoio aos defensores: lançámos um Cybersecurity Grant Program de 10 milhões USD, chegámos a mais de 1 000 projetos open source com o Codex for Open Source(abre numa nova janela), que fornece verificações de segurança gratuitas, e continuámos a melhorar o Codex Security.
- O Codex Security, lançado em beta privado há seis meses e, no início deste ano, como research preview, monitoriza automaticamente bases de código, valida problemas e propõe correções. À medida que os modelos melhoraram, também aumentaram a precisão e a utilidade do sistema. Desde o lançamento recente, o Codex Security contribuiu para a correção de mais de 3 000 vulnerabilidades críticas e de gravidade alta, além de muitas outras correções de menor gravidade em todo o ecossistema.
- Ao longo destes lançamentos, também refinámos a forma como os modelos lidam com pedidos sensíveis, calibrando limites de recusa enquanto expandimos o acesso de confiança através de programas como o TAC.
- O próprio desenvolvimento de software tem de ser mais seguro.O ecossistema mais robusto é aquele que identifica, valida e corrige continuamente problemas de segurança à medida que o software é escrito. Ao integrarmos modelos avançados de codificação e capacidades agênticas nos fluxos de trabalho dos programadores, podemos dar-lhes feedback imediato e acionável enquanto estão a desenvolver, passando de auditorias episódicas e inventários estáticos de bugs para uma redução contínua e tangível do risco.
Queremos capacitar os defensores ao dar-lhes acesso amplo a capacidades de ponta, incluindo modelos concebidos à medida para a cibersegurança. Em fevereiro, apresentámos o Trusted Access for Cyber (TAC) com verificação automática de identidade para indivíduos, para reduzir o atrito das salvaguardas em tarefas relacionadas com cibersegurança, e com parcerias com um conjunto limitado de organizações para modelos mais permissivos em cibersegurança.
Hoje, estamos a expandir este programa com níveis adicionais de acesso para utilizadores dispostos a trabalhar com a OpenAI para se autenticarem como defensores de cibersegurança. Os clientes nos níveis mais elevados terão acesso ao GPT‑5.4‑Cyber, um modelo ajustado de propósito para capacidades adicionais de cibersegurança e com menos restrições às capacidades. Esta é uma versão do GPT‑5.4 que reduz o limite de recusa para trabalho legítimo de cibersegurança e disponibiliza novas capacidades para fluxos de trabalho defensivos avançados, incluindo capacidades de engenharia reversa de binários que permitem a profissionais de segurança analisar software compilado quanto ao potencial de malware, vulnerabilidades e robustez de segurança sem precisar de acesso ao respetivo código-fonte.
Como este modelo é mais permissivo, estamos a começar com uma implementação limitada e iterativa junto de fornecedores de segurança, organizações e investigadores validados. O acesso a modelos permissivos e com capacidades de cibersegurança pode ter limitações, sobretudo em utilizações sem visibilidade, como o Zero-Data Retention(abre numa nova janela) (ZDR). Isto é particularmente verdade para programadores e organizações que acedem aos nossos modelos através de plataformas de terceiros, em que a OpenAI pode ter menos visibilidade direta sobre o utilizador, o ambiente ou o objetivo do pedido.
Obter acesso ao TAC é simples:
- Os utilizadores individuais podem verificar a sua identidade em chatgpt.com/cyber(abre numa nova janela).
- As empresas podem solicitar acesso de confiança para a sua equipa através do seu representante da OpenAI.
Todos os clientes aprovados através deste processo terão acesso a versões dos modelos existentes com menos atrito nas salvaguardas que podem ser acionadas por atividade de cibersegurança de dupla utilização, permitindo-lhes continuar a apoiar a educação em segurança, a programação defensiva e a investigação responsável de vulnerabilidades. Os clientes já no TAC que queiram autenticar-se mais como defensores legítimos de cibersegurança podem manifestar interesse(abre numa nova janela) em níveis adicionais de acesso, incluindo solicitar acesso ao GPT‑5.4‑Cyber.
As nossas defesas de cibersegurança são o resultado de muitos meses de melhoria iterativa. Acreditamos que a classe de salvaguardas atualmente em uso reduz o risco de cibersegurança o suficiente para suportar a implementação ampla dos modelos atuais. Esperamos que versões destas salvaguardas sejam suficientes para os próximos modelos mais poderosos, enquanto os modelos treinados explicitamente e tornados mais permissivos para trabalho de cibersegurança exigem implementações mais restritivas e controlos adequados.
A longo prazo, para garantir que a segurança de IA em cibersegurança continua a ser suficiente, esperamos também a necessidade de defesas mais abrangentes para modelos futuros, cujas capacidades irão rapidamente exceder até os melhores modelos concebidos de propósito atualmente.


