10 de dezembro de 2025

Reforçar a resiliência cibernética à medida que as capacidades da IA avançam

À medida que os nossos modelos ganham mais capacidades em cibersegurança, estamos a investir em reforçá-los, adicionando camadas de salvaguardas e estabelecendo parcerias com especialistas globais de segurança.

A carregar…

As capacidades de cibersegurança nos modelos de IA estão a avançar rapidamente, trazendo benefícios significativos para a ciberdefesa, bem como novos riscos de dupla utilização que têm de ser geridos com cuidado. Por exemplo, as capacidades avaliadas através de desafios capture-the-flag (CTF) melhoraram de 27% no GPT‑5⁠(abre numa nova janela), em agosto de 2025, para 76% no GPT‑5.1‑Codex‑Max⁠(abre numa nova janela), em novembro de 2025.

Esperamos que os próximos modelos de IA continuem nesta trajetória; em preparação, estamos a planear e a avaliar como se cada novo modelo pudesse atingir níveis «High» de capacidade de cibersegurança, tal como medidos pelo nosso Preparedness Framework⁠(abre numa nova janela). Com isto, referimo-nos a modelos que podem desenvolver exploits remotos zero-day funcionais contra sistemas bem defendidos ou prestar assistência significativa a operações de intrusão empresariais ou industriais complexas e furtivas, com impacto no mundo real. Esta publicação explica como pensamos sobre salvaguardas para modelos que atingem estes níveis de capacidade e como garantimos que ajudam de forma significativa os defensores, ao mesmo tempo que limitamos o uso indevido.

À medida que estas capacidades avançam, a OpenAI está a investir em reforçar os nossos modelos para tarefas defensivas de cibersegurança e em criar ferramentas que permitem aos defensores executar mais facilmente fluxos de trabalho como auditar código e corrigir vulnerabilidades. O nosso objetivo é que os nossos modelos e produtos tragam vantagens significativas para os defensores, que muitas vezes estão em menor número e com poucos recursos.

Tal como noutros domínios de dupla utilização, os fluxos de trabalho cibernéticos defensivos e ofensivos recorrem muitas vezes ao mesmo conhecimento e às mesmas técnicas subjacentes. Estamos a investir em salvaguardas para ajudar a garantir que estas capacidades poderosas beneficiam sobretudo utilizações defensivas e limitam o aumento de capacidade para fins maliciosos. A cibersegurança abrange quase todas as áreas, o que significa que não podemos depender de uma única categoria de salvaguardas — como restringir o conhecimento ou usar apenas acesso verificado —, mas precisamos antes de uma abordagem de defesa em profundidade que equilibre risco e capacite os utilizadores. Na prática, isto significa moldar a forma como as capacidades são acedidas, orientadas e aplicadas, para que modelos avançados reforcem a segurança em vez de reduzirem as barreiras ao uso indevido.

Vemos este trabalho não como um esforço pontual, mas como um investimento sustentado e de longo prazo para dar uma vantagem aos defensores e reforçar continuamente a postura de segurança da infraestrutura crítica em todo o ecossistema.

Mitigar utilizações maliciosas

Os nossos modelos são concebidos e treinados para operar de forma segura, apoiados por sistemas proativos que detetam e respondem a abusos em cibersegurança. Aperfeiçoamos continuamente estas proteções à medida que as nossas capacidades e o panorama de ameaças evoluem. Embora nenhum sistema consiga garantir a prevenção completa do uso indevido em cibersegurança sem afetar gravemente as utilizações defensivas, a nossa estratégia é mitigar o risco através de uma stack de segurança em camadas.

Na base desta abordagem, adotamos uma defesa em profundidade, assente numa combinação de controlos de acesso, hardening da infraestrutura, controlos de egress e monitorização. Complementamos estas medidas com sistemas de deteção e resposta e com programas dedicados de inteligência de ameaças e risco interno, garantindo que ameaças emergentes são identificadas e bloqueadas rapidamente. Estas salvaguardas são concebidas para evoluir com o panorama de ameaças. Assumimos a mudança e construímos de forma a podermos ajustar-nos de forma rápida e adequada.

Com base nesta fundação:

Treinar o modelo para recusar ou responder de forma segura a pedidos nocivos, mantendo-se útil para casos de uso educativos e defensivos: Estamos a treinar os nossos modelos de fronteira para recusarem ou responderem de forma segura a pedidos que permitiriam abuso claro em cibersegurança, mantendo-se o mais úteis possível para casos de uso defensivos e educativos legítimos.
Sistemas de deteção: Aperfeiçoamos e mantemos monitorização a nível de sistema em produtos que usam modelos de fronteira para detetar atividade potencialmente maliciosa em cibersegurança. Quando a atividade parece insegura, podemos bloquear a saída, redirecionar prompts para modelos mais seguros ou menos capazes, ou escalar para aplicação de medidas. A nossa aplicação de medidas combina revisão automática e humana, informada por fatores como requisitos legais, gravidade e comportamento reincidente. Também trabalhamos de perto com programadores e clientes empresariais para alinharmos padrões de segurança e permitir uma utilização responsável, com vias claras de escalonamento.
Red teaming de ponta a ponta: Estamos a trabalhar com organizações de red teaming especializadas para avaliar e melhorar as nossas medidas de mitigação de segurança. O seu trabalho é tentar contornar todas as nossas defesas, trabalhando de ponta a ponta, tal como faria um adversário determinado e com muitos recursos. Isto ajuda-nos a identificar lacunas cedo e a reforçar o sistema como um todo.

Iniciativas do ecossistema para reforçar a resiliência cibernética

A OpenAI investiu desde cedo em aplicar IA a casos de uso de cibersegurança defensiva e a nossa equipa coordena-se de perto com especialistas globais para amadurecer tanto os nossos modelos como a forma como são aplicados. Valorizamos a comunidade global de profissionais de cibersegurança que trabalham arduamente para tornar o nosso mundo digital mais seguro e estamos empenhados em disponibilizar ferramentas poderosas que apoiem a segurança defensiva. À medida que lançamos novas salvaguardas, continuaremos a trabalhar com a comunidade de cibersegurança para compreender onde a IA pode reforçar de forma significativa a resiliência e onde salvaguardas ponderadas são mais importantes.

A par destas colaborações, estamos a estabelecer um conjunto de esforços concebidos para ajudar os defensores a avançar mais depressa, ancorar as nossas salvaguardas em necessidades do mundo real e acelerar a correção responsável à escala.

Programas de acesso de confiança para ciberdefesa

Em breve, vamos introduzir um programa de acesso de confiança no qual exploramos fornecer a utilizadores e clientes elegíveis que trabalham em ciberdefesa acesso em níveis a capacidades melhoradas nos nossos modelos mais recentes para casos de uso defensivos. Ainda estamos a explorar o limite certo entre as capacidades a que podemos dar acesso amplo e aquelas que exigem restrições por níveis, o que pode influenciar o desenho futuro deste programa. Queremos que este programa de acesso de confiança seja um elemento fundamental rumo a um ecossistema resiliente.

Expandir a capacidade defensiva com o Aardvark

O Aardvark, o nosso investigador de segurança agêntico que ajuda programadores e equipas de segurança a encontrar e corrigir vulnerabilidades à escala, está agora em beta privada. Analisa bases de código à procura de vulnerabilidades e propõe patches (correções) que os mantenedores podem adotar rapidamente. Já identificou CVEs inéditos em software de código aberto ao raciocinar sobre bases de código inteiras. Planeamos oferecer cobertura gratuita a repositórios de código aberto não comerciais selecionados, para contribuir para a segurança do ecossistema e da cadeia de fornecimento de software de código aberto. Candidate-se para participar aqui.

Frontier Risk Council

Vamos estabelecer o Frontier Risk Council, um grupo consultivo que aproximará defensores de cibersegurança experientes e profissionais de segurança numa colaboração estreita com as nossas equipas. Este conselho começará com um foco na cibersegurança e expandir-se-á, no futuro, para outros domínios de capacidades de fronteira. Os membros aconselharão sobre o limite entre capacidades úteis e responsáveis e potencial uso indevido, e estas conclusões informarão diretamente as nossas avaliações e salvaguardas. Partilharemos mais sobre o conselho em breve.

Desenvolver um entendimento partilhado sobre modelos de ameaça com a indústria

Por fim, antecipamos que o uso indevido em cibersegurança possa ser viável a partir de qualquer modelo de fronteira da indústria. Para responder a isto, trabalhamos com outros laboratórios de fronteira através do Frontier Model Forum, uma organização sem fins lucrativos apoiada por laboratórios líderes de IA e parceiros da indústria, para desenvolver um entendimento partilhado de modelos de ameaça e boas práticas. Neste contexto, a modelação de ameaças ajuda a mitigar o risco ao identificar como as capacidades de IA poderiam ser armadas, onde existem estrangulamentos críticos para diferentes agentes de ameaça e de que forma modelos de fronteira podem proporcionar um aumento significativo de capacidade. Esta colaboração visa construir um entendimento consistente, em todo o ecossistema, sobre agentes de ameaça e vetores de ataque, permitindo que laboratórios, mantenedores e defensores melhorem melhor as suas medidas de mitigação e garantindo que informações críticas de segurança se propagam rapidamente por todo o ecossistema. Estamos também a envolver equipas externas para desenvolver avaliações de cibersegurança⁠(abre numa nova janela). Esperamos que um ecossistema de avaliações independentes ajude ainda mais a construir um entendimento partilhado das capacidades dos modelos.

Em conjunto, estes esforços refletem o nosso compromisso de longo prazo com o reforço do lado defensivo do ecossistema. À medida que os modelos se tornam mais capazes, o nosso objetivo é ajudar a garantir que essas capacidades se traduzem numa vantagem real para os defensores — ancorada em necessidades do mundo real, moldada por contributos de especialistas e implementada com cuidado. A par deste trabalho, planeamos explorar outras iniciativas e bolsas de cibersegurança para dar visibilidade a ideias disruptivas que podem não surgir de canais tradicionais e para mobilizar, via crowdsourcing, defesas ousadas e criativas da academia, da indústria e da comunidade de código aberto. Em conjunto, este é um trabalho contínuo, e esperamos continuar a fazer evoluir estes programas à medida que aprendemos o que mais eficazmente reforça a segurança no mundo real.