A próxima evolução do Agents SDK
O Agents SDK atualizado ajuda os programadores a criar agentes que podem inspecionar ficheiros, executar comandos, editar código e trabalhar em tarefas de longo prazo em ambientes de sandbox controlados.
Estamos a introduzir novas capacidades no Agents SDK que dão aos programadores uma infraestrutura normalizada, fácil de começar a usar e construída corretamente para modelos da OpenAI: um harness nativo do modelo que permite aos agentes trabalhar com ficheiros e ferramentas num computador, bem como execução nativa em sandbox para executar esse trabalho em segurança.
Por exemplo, os programadores podem dar a um agente um espaço de trabalho controlado, instruções explícitas e as ferramentas de que precisa para inspecionar provas:
Os programadores precisam de mais do que os melhores modelos para criar agentes úteis — precisam de sistemas que suportem a forma como os agentes inspecionam ficheiros, executam comandos, escrevem código e continuam a trabalhar ao longo de muitas etapas.
Os sistemas que existem hoje implicam compromissos à medida que as equipas passam de protótipos para produção. Frameworks agnósticos em relação ao modelo são flexíveis, mas não tiram pleno partido das capacidades dos modelos de fronteira; SDKs do fornecedor do modelo podem estar mais próximos do modelo, mas muitas vezes não dão visibilidade suficiente do harness; e APIs geridas de agentes podem simplificar a implementação, mas restringem onde os agentes são executados e como acedem a dados sensíveis.
Eis o que alguns clientes que testaram o novo SDK connosco tiveram a dizer:
«O GPT-5.4 estabelece um novo padrão para trabalho jurídico com muitos documentos.» Na nossa avaliação BigLaw Bench, obteve 91%. Em comparação com outros modelos, o GPT-5.4 é atualmente melhor a estruturar análises transacionais complexas, a manter a precisão ao longo de contratos extensos e a fornecer o elevado nível de detalhe de que os profissionais do direito necessitam.»
Com o lançamento de hoje, o harness do Agents SDK torna-se mais capaz para agentes que trabalham com documentos, ficheiros e sistemas. Passa agora a incluir memória configurável, orquestração consciente de sandbox, ferramentas de sistema de ficheiros ao estilo do Codex e integrações normalizadas com primitivas que estão a tornar-se comuns em sistemas agênticos de fronteira.
Estas primitivas incluem utilização de ferramentas via MCP(abre numa nova janela), divulgação progressiva via skills(abre numa nova janela), instruções personalizadas via AGENTS.md(abre numa nova janela), execução de código usando a ferramenta shell(abre numa nova janela), edições de ficheiros usando a ferramenta apply patch(abre numa nova janela) e muito mais. O harness continuará a incorporar, ao longo do tempo, novos padrões agênticos e primitivas, para que os programadores possam passar menos tempo em atualizações da infraestrutura central e mais tempo na lógica específica do domínio que torna os seus agentes úteis.
O harness também ajuda os programadores a desbloquear mais das capacidades de um modelo de fronteira, ao alinhar a execução com a forma como esses modelos têm melhor desempenho. Isto mantém os agentes mais próximos do padrão natural de operação do modelo, melhorando a fiabilidade e o desempenho em tarefas complexas — sobretudo quando o trabalho é de longa duração ou coordenado entre um conjunto diverso de ferramentas e sistemas.
Além disso, sabemos que cada produto é único e raramente se encaixa perfeitamente num molde. Concebemos o Agents SDK para suportar esta diversidade. Os programadores têm acesso a um harness pronto a usar, mas flexível — o que facilita adaptá-lo à sua própria stack — incluindo utilização de ferramentas, memória e ambiente de sandbox.
O Agents SDK atualizado suporta nativamente a execução em sandbox, para que os agentes possam ser executados em ambientes de computação controlados com os ficheiros, as ferramentas e as dependências de que precisam para uma tarefa.
Muitos agentes úteis precisam de um espaço de trabalho onde possam ler e escrever ficheiros, instalar dependências, executar código e usar ferramentas em segurança. O suporte nativo de sandbox dá aos programadores essa camada de execução pronta a usar, em vez de os obrigar a montá-la por conta própria.
Os programadores podem usar a sua própria sandbox ou recorrer ao suporte integrado para Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop e Vercel.
Para tornar esses ambientes portáteis entre fornecedores, o SDK também introduz uma abstração Manifest para descrever o espaço de trabalho do agente. Os programadores podem montar ficheiros locais, definir diretórios de output e importar dados de fornecedores de armazenamento, incluindo AWS S3, Google Cloud Storage, Azure Blob Storage e Cloudflare R2.
Isto dá aos programadores uma forma consistente de moldar o ambiente do agente desde um protótipo local até à implementação em produção. Também dá ao modelo um espaço de trabalho previsível: onde encontrar inputs, onde escrever outputs e como manter o trabalho organizado ao longo de uma tarefa de longa duração.

Os sistemas de agentes devem ser concebidos partindo do princípio de que haverá tentativas de injeção de prompt e exfiltração. Separar o harness e a computação ajuda a manter as credenciais fora dos ambientes onde é executado código gerado pelo modelo.
Isto também permite uma execução durável. Quando o estado do agente é externalizado, perder um contentor de sandbox não significa perder a execução. Com snapshotting e rehydration integrados, o Agents SDK consegue restaurar o estado do agente num contentor novo e continuar a partir do último checkpoint se o ambiente original falhar ou expirar.
Por fim, torna os agentes mais escaláveis. As execuções de agentes podem usar uma sandbox ou várias, invocar sandboxes apenas quando necessário, encaminhar subagentes para ambientes isolados e paralelizar trabalho entre contentores para uma execução mais rápida.
Estas novas capacidades do Agents SDK estão disponíveis, de forma geral, para todos os clientes via API e usam os preços padrão da API, com base em tokens e utilização de ferramentas.
À medida que continuamos a desenvolver o Agents SDK, continuaremos a expandir o que os programadores podem criar com ele, tornando mais fácil levar agentes mais capazes para produção com menos infraestrutura personalizada, preservando a flexibilidade e o controlo de que os programadores precisam para integrar agentes nos seus próprios ambientes.
As novas capacidades de harness e sandbox são lançadas primeiro em Python, com suporte para TypeScript planeado para um lançamento futuro. Também estamos a trabalhar para levar capacidades adicionais de agentes, incluindo code mode e subagentes, tanto para Python como para TypeScript.
Além disso, queremos ajudar a unir, ao longo do tempo, o ecossistema mais amplo de agentes, com suporte para mais fornecedores de sandbox, mais integrações e mais formas de os programadores ligarem o SDK às ferramentas e aos sistemas que já usam.


