À medida que os sistemas de IA assumem tarefas mais complexas — especialmente aquelas que envolvem a web e aplicações conectadas —, os riscos de segurança alteram-se.
Um risco emergente tornou-se especialmente importante: a injeção de prompt. Nestes ataques, um terceiro tenta induzir um sistema de IA de conversação em erro, levando-o a seguir instruções maliciosas ou a revelar informações sensíveis.
Hoje, estamos a introduzir duas novas proteções concebidas para ajudar utilizadores e organizações a mitigar ataques de injeção de prompts, proporcionando uma visibilidade mais clara do risco e controlos mais fortes:
- O Modo de Bloqueio no ChatGPT, uma configuração de segurança avançada e opcional para utilizadores de alto risco
- Etiquetas de "Risco Elevado" para determinadas capacidades que podem introduzir riscos adicionais no ChatGPT, ChatGPT Atlas e Codex
Estas adições reforçam as nossas proteções existentes nos níveis de modelo, produto e sistema. Isto inclui sandboxing, proteções contra exfiltração de dados baseada em URL, monitorização e aplicação, e controlos empresariais como controlos de acesso baseados em funções e registos de auditoria.
O Modo de Bloqueio é uma configuração de segurança avançada e opcional, concebida para um pequeno grupo de utilizadores altamente preocupados da segurança — como executivos ou equipas de segurança em organizações proeminentes — que necessitam de maior proteção contra ameaças avançadas. Não é necessário para a maioria dos utilizadores. O Modo de Bloqueio restringe fortemente a forma como o ChatGPT pode interagir com sistemas externos para reduzir o risco de exfiltração de dados baseada em injeção de prompt.
O Modo de Bloqueio desativa deterministicamente certas ferramentas e capacidades do ChatGPT que um adversário poderia tentar explorar para exfiltrar dados sensíveis das conversas dos utilizadores ou de aplicações conectadas, através de ataques como injeção de prompt.
Por exemplo, a navegação na web no Modo de Bloqueio está restrita a conteúdo em cache, de modo que não são feitas solicitações de rede em tempo real fora da rede controlada da OpenAI. Esta restrição foi concebida para evitar que dados sensíveis sejam exfiltrados para um atacante através da navegação. Algumas funcionalidades são desativadas por completo quando não conseguimos garantir com certeza a segurança dos dados.

O Modo de Bloqueio é uma nova configuração determinística que ajuda a evitar que os dados sejam inadvertidamente partilhados com terceiros, ao restringir rigorosamente a forma como o ChatGPT pode interagir com determinados sistemas externos.
Os planos empresariais do ChatGPT já oferecem segurança de dados de nível empresarial. O Modo de Bloqueio baseia-se nessas proteções e está disponível para o ChatGPT Enterprise, o ChatGPT Edu, o ChatGPT para Cuidados de Saúde e o ChatGPT para Professores. Os administradores podem ativá-lo em Definições do espaço de trabalho(abre numa nova janela) ao criar uma nova função(abre numa nova janela). Quando ativado, o Modo de Bloqueio impõe restrições adicionais sobre as definições de administrador existentes.
Saiba mais sobre o Modo de Bloqueio no nosso Centro de Apoio(abre numa nova janela).
Como alguns fluxos de trabalho críticos dependem de aplicações, os administradores do espaço de trabalho mantêm controlos mais granulares. Podem escolher exatamente que aplicações — e que ações específicas dentro dessas aplicações — estão disponíveis para os utilizadores no Modo de Bloqueio. Além disso, e separadamente do Modo de Bloqueio, a Plataforma de Registos da API de Conformidade(abre numa nova janela) oferece visibilidade detalhada sobre a utilização da aplicação, os dados partilhados e as fontes conectadas, ajudando os administradores a manter a supervisão.
Planeamos tornar o Modo de Bloqueio disponível para os consumidores nos próximos meses.
Os produtos de IA podem ser mais úteis quando conectados às suas aplicações e à web, e investimos fortemente em manter os dados conectados seguros. Simultaneamente, algumas capacidades relacionadas com a rede introduzem novos riscos que ainda não são totalmente abordados pelas medidas de proteção e segurança do setor. Alguns utilizadores podem sentir-se à vontade para assumir estes riscos, e acreditamos que é importante que os utilizadores tenham a capacidade de decidir se e como os utilizam, especialmente quando trabalham com os seus dados privados.
A nossa abordagem tem sido a de fornecer orientações no produto para funcionalidades que possam introduzir riscos adicionais. Para tornar isto mais claro e consistente, estamos a padronizar a forma como rotulamos uma pequena lista de capacidades existentes. Estas funcionalidades utilizarão agora uma etiqueta de "Risco elevado" consistente no ChatGPT, no ChatGPT Atlas e no Codex, para que os utilizadores recebam a mesma orientação sempre que as encontrarem.
Por exemplo, no Codex, o nosso assistente de programação, os programadores podem conceder ao Codex acesso à rede para que este possa realizar ações na web, como consultar documentação. O ecrã de definições relevante inclui a etiqueta "Risco elevado", juntamente com uma explicação clara das alterações, dos riscos que podem ser introduzidos e de quando esse acesso é adequado.

Uma captura do ecrã de definições do Codex, onde os utilizadores podem configurar o acesso à rede que o Codex tem.
Continuamos a investir no fortalecimento das nossas medidas de segurança e proteção, especialmente para riscos novos, emergentes ou em crescimento. À medida que formos reforçando as salvaguardas destas funcionalidades, retiraremos o rótulo de "Risco Elevado" quando determinarmos que os avanços na segurança atenuaram suficientemente esses riscos para para uso geral. Continuaremos também a atualizar as funcionalidades que ostentam este rótulo ao longo do tempo, para melhor comunicar o risco aos utilizadores.


