Saltar para o conteúdo principal
OpenAI

15 de abril de 2026

Produto

A próxima evolução do Agents SDK

O Agents SDK atualizado ajuda os programadores a criar agentes que podem inspecionar ficheiros, executar comandos, editar código e trabalhar em tarefas de longo prazo em ambientes de sandbox controlados.

A carregar…

Estamos a introduzir novas capacidades no Agents SDK que dão aos programadores uma infraestrutura normalizada, fácil de começar a usar e construída corretamente para modelos da OpenAI: um harness nativo do modelo que permite aos agentes trabalhar com ficheiros e ferramentas num computador, bem como execução nativa em sandbox para executar esse trabalho em segurança.

Por exemplo, os programadores podem dar a um agente um espaço de trabalho controlado, instruções explícitas e as ferramentas de que precisa para inspecionar provas:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

Os programadores precisam de mais do que os melhores modelos para criar agentes úteis — precisam de sistemas que suportem a forma como os agentes inspecionam ficheiros, executam comandos, escrevem código e continuam a trabalhar ao longo de muitas etapas.

Os sistemas que existem hoje implicam compromissos à medida que as equipas passam de protótipos para produção. Frameworks agnósticos em relação ao modelo são flexíveis, mas não tiram pleno partido das capacidades dos modelos de fronteira; SDKs do fornecedor do modelo podem estar mais próximos do modelo, mas muitas vezes não dão visibilidade suficiente do harness; e APIs geridas de agentes podem simplificar a implementação, mas restringem onde os agentes são executados e como acedem a dados sensíveis.

Eis o que alguns clientes que testaram o novo SDK connosco tiveram a dizer:

«O GPT-5.4 estabelece um novo padrão para trabalho jurídico com muitos documentos.» Na nossa avaliação BigLaw Bench, obteve 91%. Em comparação com outros modelos, o GPT-5.4 é atualmente melhor a estruturar análises transacionais complexas, a manter a precisão ao longo de contratos extensos e a fornecer o elevado nível de detalhe de que os profissionais do direito necessitam.»
— Niko Grupen, Diretor de Investigação Aplicada na Harvey

Um harness mais capaz para o loop do agente

Com o lançamento de hoje, o harness do Agents SDK torna-se mais capaz para agentes que trabalham com documentos, ficheiros e sistemas. Passa agora a incluir memória configurável, orquestração consciente de sandbox, ferramentas de sistema de ficheiros ao estilo do Codex e integrações normalizadas com primitivas que estão a tornar-se comuns em sistemas agênticos de fronteira.

Estas primitivas incluem utilização de ferramentas via MCP(abre numa nova janela), divulgação progressiva via skills(abre numa nova janela), instruções personalizadas via AGENTS.md(abre numa nova janela), execução de código usando a ferramenta shell(abre numa nova janela), edições de ficheiros usando a ferramenta apply patch(abre numa nova janela) e muito mais. O harness continuará a incorporar, ao longo do tempo, novos padrões agênticos e primitivas, para que os programadores possam passar menos tempo em atualizações da infraestrutura central e mais tempo na lógica específica do domínio que torna os seus agentes úteis.

Diagrama que mostra como o Agent SDK liga a entrada do utilizador, os modelos e as ferramentas para criar agentes de IA.
Diagrama que mostra como criar agentes de IA com o Agent SDK usando modelos, ferramentas e orquestração.

O harness também ajuda os programadores a desbloquear mais das capacidades de um modelo de fronteira, ao alinhar a execução com a forma como esses modelos têm melhor desempenho. Isto mantém os agentes mais próximos do padrão natural de operação do modelo, melhorando a fiabilidade e o desempenho em tarefas complexas — sobretudo quando o trabalho é de longa duração ou coordenado entre um conjunto diverso de ferramentas e sistemas.

Além disso, sabemos que cada produto é único e raramente se encaixa perfeitamente num molde. Concebemos o Agents SDK para suportar esta diversidade. Os programadores têm acesso a um harness pronto a usar, mas flexível — o que facilita adaptá-lo à sua própria stack — incluindo utilização de ferramentas, memória e ambiente de sandbox.

Execução nativa em sandbox

O Agents SDK atualizado suporta nativamente a execução em sandbox, para que os agentes possam ser executados em ambientes de computação controlados com os ficheiros, as ferramentas e as dependências de que precisam para uma tarefa.

Muitos agentes úteis precisam de um espaço de trabalho onde possam ler e escrever ficheiros, instalar dependências, executar código e usar ferramentas em segurança. O suporte nativo de sandbox dá aos programadores essa camada de execução pronta a usar, em vez de os obrigar a montá-la por conta própria.

Os programadores podem usar a sua própria sandbox ou recorrer ao suporte integrado para Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop e Vercel.

Para tornar esses ambientes portáteis entre fornecedores, o SDK também introduz uma abstração Manifest para descrever o espaço de trabalho do agente. Os programadores podem montar ficheiros locais, definir diretórios de output e importar dados de fornecedores de armazenamento, incluindo AWS S3, Google Cloud Storage, Azure Blob Storage e Cloudflare R2.

Isto dá aos programadores uma forma consistente de moldar o ambiente do agente desde um protótipo local até à implementação em produção. Também dá ao modelo um espaço de trabalho previsível: onde encontrar inputs, onde escrever outputs e como manter o trabalho organizado ao longo de uma tarefa de longa duração.

Logótipos de Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel e Runloop

Separar o harness da computação para segurança, durabilidade e escala

Os sistemas de agentes devem ser concebidos partindo do princípio de que haverá tentativas de injeção de prompt e exfiltração. Separar o harness e a computação ajuda a manter as credenciais fora dos ambientes onde é executado código gerado pelo modelo.

Isto também permite uma execução durável. Quando o estado do agente é externalizado, perder um contentor de sandbox não significa perder a execução. Com snapshotting e rehydration integrados, o Agents SDK consegue restaurar o estado do agente num contentor novo e continuar a partir do último checkpoint se o ambiente original falhar ou expirar.

Por fim, torna os agentes mais escaláveis. As execuções de agentes podem usar uma sandbox ou várias, invocar sandboxes apenas quando necessário, encaminhar subagentes para ambientes isolados e paralelizar trabalho entre contentores para uma execução mais rápida.

Diagrama de fluxo que ilustra como o Agent SDK permite que agentes de IA usem recursos de computação adicionais para tarefas mais complexas.
Diagrama que mostra como agentes de IA criados com o Agent SDK podem orquestrar sistemas de computação separados, permitindo que as cargas de trabalho sejam executadas de forma independente, ao mesmo tempo que suportam tarefas mais avançadas.

Preços e disponibilidade

Estas novas capacidades do Agents SDK estão disponíveis, de forma geral, para todos os clientes via API e usam os preços padrão da API, com base em tokens e utilização de ferramentas.

O que se segue

À medida que continuamos a desenvolver o Agents SDK, continuaremos a expandir o que os programadores podem criar com ele, tornando mais fácil levar agentes mais capazes para produção com menos infraestrutura personalizada, preservando a flexibilidade e o controlo de que os programadores precisam para integrar agentes nos seus próprios ambientes.

As novas capacidades de harness e sandbox são lançadas primeiro em Python, com suporte para TypeScript planeado para um lançamento futuro. Também estamos a trabalhar para levar capacidades adicionais de agentes, incluindo code mode e subagentes, tanto para Python como para TypeScript.

Além disso, queremos ajudar a unir, ao longo do tempo, o ecossistema mais amplo de agentes, com suporte para mais fornecedores de sandbox, mais integrações e mais formas de os programadores ligarem o SDK às ferramentas e aos sistemas que já usam.