21 de maio de 2025

Novas ferramentas e recursos da API Responses

Apresentamos o suporte a servidor MCP remoto, geração de imagens, intérprete de código e muito mais na API Responses para desenvolvedores e empresas.

Carregando…

Hoje, estamos acrescentando novas ferramentas integradas à API Responses, nossa API essencial para criação de aplicativos autônomos. Compatibilidade com todos os servidores remotos MCP (Protocolo de Contexto de Modelos)⁠(abre em uma nova janela), além de ferramentas como geração de imagens⁠(abre em uma nova janela) e intérprete de código⁠(abre em uma nova janela), bem como melhorias na busca de arquivos⁠(abre em uma nova janela). Essas ferramentas estão disponíveis em todos os modelos de raciocínio das séries GPT‑4o, GPT‑4.1 e OpenAI o. O o3 e o o4-mini já podem chamar ferramentas e funções dentro da própria linha de raciocínio na API Responses, produzindo respostas com mais contexto e relevância. Usar o o3 e o l4-mini com a API Responses preserva os tokens de reflexão entre diferentes solicitações e chamadas de ferramentas, melhorando a inteligência do modelo e reduzindo o custo e a latência para os desenvolvedores.

Também estamos introduzindo novos recursos na API Responses para melhorar a confiabilidade, visibilidade e privacidade para empresas e desenvolvedores. Esses recursos incluem trabalho em segundo plano⁠(abre em uma nova janela) para executar tarefas assíncronas de longa duração com mais confiabilidade, suporte a resumos de raciocínio⁠(abre em uma nova janela) e suporte a itens de raciocínio criptografados⁠(abre em uma nova janela).

Desde o lançamento da API Responses, em março de 2025, com ferramentas como pesquisa na web, busca de arquivos e uso de computadores, ela já foi usada por centenas de milhares de desenvolvedores para processar trilhões de tokens em nossos modelos. Os clientes usam a API para criar os mais diversos aplicativos autônomos, como o agente de programação da Zencoder⁠(abre em uma nova janela), o agente de inteligência de mercado da Revi⁠(abre em uma nova janela) para gestão de ativos e investimentos e o assistente de educação MagicSchool AI⁠(abre em uma nova janela). Todos usam busca online para obter dados relevantes e atualizados para o aplicativo. Agora os desenvolvedores podem criar agentes ainda mais úteis e confiáveis com acesso às novas ferramentas e recursos lançados hoje.

Novo suporte para servidores remotos MCP

Estamos acrescentando o suporte a servidores remotos MCP⁠(abre em uma nova janela) na API Responses, aproveitando o lançamento do suporte para MCP no SDK Agents⁠(abre em uma nova janela). MCP é um protocolo aberto que padroniza a forma como aplicativos fornecem contexto aos LLMs. Com o suporte a servidores MCP na API Responses, os desenvolvedores poderão conectar nossos modelos a ferramentas hospedadas em qualquer servidor MCP com poucas linhas de código. Veja alguns exemplos de como um desenvolvedor hoje pode usar servidores remotos MCP com a API Responses:

Python

1response = client.responses.create(
2  model="gpt-4.1",
3  tools=[{
4    "type": "mcp",
5    "server_label": "shopify",
6    "server_url": "https://pitchskin.com/api/mcp",
7  }],
8  input="Add the Blemish Toner Pads to my cart"
9)

The Blemish Toner Pads have been added to your cart! You can proceed to checkout here:

Pitch. Skin checkout page showing express options (Shop Pay, PayPal, G Pay), contact and delivery form fields, and an order summary for one ‘Blemish Toner Pads 200 mL (120 pads)’ priced at AUD $49.

Algumas versões populares de servidores MCP: Cloudflare⁠(abre em uma nova janela), HubSpot⁠(abre em uma nova janela), Intercom⁠(abre em uma nova janela), PayPal⁠(abre em uma nova janela), Plaid⁠(abre em uma nova janela), Shopify⁠(abre em uma nova janela), Stripe⁠(abre em uma nova janela), Square⁠(abre em uma nova janela), Twilio⁠(abre em uma nova janela), Zapier⁠(abre em uma nova janela) e outros. Acreditamos que o ecossistema de servidores remotos MCP deve crescer rapidamente nos próximos meses, facilitando a criação de agentes potentes conectados às ferramentas e fontes de dados que os usuários já adotam. Para oferecer o melhor suporte ao ecossistema e contribuir para esse padrão em evolução, a OpenAI também entrou para o comitê gestor do MCP.

Saiba como criar seu próprio servidor remoto MCP neste guia da Cloudflare⁠(abre em uma nova janela). Para aprender a usar a ferramenta MCP na API Responses, use este guia⁠(abre em uma nova janela) do nosso Manual de APIs.

Atualizações de geração de imagens, intérprete de códigos e busca de arquivos

Com ferramentas integradas à API Responses, os desenvolvedores conseguem criar agentes com mais capacidade a partir de uma única chamada de API. Invocando várias ferramentas durante o raciocínio, os modelos têm um desempenho muito melhor na invocação de ferramentas em referências padrão do setor, como o Humanity’s Last Exam (fonte). Hoje, acrescentamos novas ferramentas:

Geração de imagens: além de usar a API Images⁠(abre em uma nova janela), os desenvolvedores já pode acessar nosso último modelo de geração de imagens. o gpt-image-1, como ferramenta dentro da própria API Responses. A ferramenta permite transmissão em tempo real, de forma que os desenvolvedores recebem prévias da imagem durante a geração, além de várias etapas de edição, permitindo fazer prompts para que o modelo ajuste as imagens passo a passo. Saiba mais⁠(abre em uma nova janela).
Intérprete de código: agora, os desenvolvedores podem usar o Intérprete de código⁠(abre em uma nova janela) dentro da API Responses. É uma ferramenta útil para analisar dados, solucionar problemas complexos de matemática e programação e ajudar os modelos a entender e manipular imagens em detalhes (ex.: pensar com imagens). A possibilidade de modelos como o o3 e o o4-mini usarem o Intérprete de código dentro da linha de raciocínio melhorou o desempenho em várias áreas de referência, como o Humanity's Last Exam (fonte). Saiba mais⁠(abre em uma nova janela).
Busca de arquivos: agora, os desenvolvedores podem acessar a ferramenta de busca de arquivos⁠(abre em uma nova janela) em nossos modelos de raciocínio. A busca de arquivos permite inserir trechos úteis de documentos no contexto do modelo, conforme a consulta do usuário. Também atualizamos a ferramenta de busca em arquivos, permitindo que os desenvolvedores pesquisem em vários bancos de vetores, com filtragem de atributos com matrizes. Saiba mais⁠(abre em uma nova janela).

Novos recursos na API Responses

Além das novas ferramentas, também adicionamos suporte para novos recursos na API Responses, como:

Modo segundo plano: da mesma forma que produtos autônomos como Codex, Investigação e Operator, os modelos de raciocínio podem levar vários minutos para resolver problemas complexos. Agora, os desenvolvedores podem usar o modo segundo plano para criar um processo semelhante em modelos como o o3, sem problemas de limite de tempo ou conectividade: em segundo plano, as tarefas rodam de forma assíncrona. Os desenvolvedores podem consultar esses objetos para conferir se estão completos ou podem começar a transmitir eventos sempre que o aplicativo precisar saber o estado mais recente. Saiba mais⁠(abre em uma nova janela).

Python

1response = client.responses.create(
2  model="o3",
3  input="Write me an extremely long story.",
4  reasoning={ "effort": "high" },
5  background=True
6)

Resumos de raciocínio: A API Responses já pode gerar resumos concisos em linguagem natural da linha de raciocínio interna do modelo, assim como o ChatGPT. Para os desenvolvedores, isso facilita a depuração, auditoria e a criação de experiências melhores para o usuário. Os resumos de raciocínio estão disponíveis sem custo extra. Saiba mais⁠(abre em uma nova janela).

Python

1response = client.responses.create(
2    model="o4-mini",
3    tools=[
4        {
5            "type": "code_interpreter",
6            "container": {"type": "auto"}
7        }
8    ],
9    instructions=(
10        "You are a personal math tutor. "
11        "When asked a math question, run code to answer the question."
12    ),
13    input="I need to solve the equation `3x + 11 = 14`. Can you help me?",
14    reasoning={"summary": "auto"}
15)

Itens de reflexão criptografados: clientes qualificados para zero retenção de dados (ZDR)⁠(abre em uma nova janela) já podem reutilizar itens de raciocínio de todas as solicitações da API, sem que nenhum deles seja armazenado nos servidores da OpenAI. Em modelos como o o3 e o o4-mini, a reutilização de itens entre as chamadas de função aumenta a inteligência, reduz o uso de tokens e aumenta as taxas de resultados do cache, reduzindo custo e latência. Saiba mais⁠(abre em uma nova janela).

Python

1response = client.responses.create(
2  model="o3",
3  input="Implement a simple web server in Rust from scratch.",
4  store=False,
5  include=["reasoning.encrypted_content"]
6)

Preços e disponibilidade

Todas essas ferramentas e recursos já estão disponíveis na API Responses, compatível com os modelos de raciocínio das sérias GPT‑4o, GPT‑4.1 e OpenAI o (o1, o3, o3‑mini e o4-mini). A geração de imagens só tem suporte na série o3 de modelos de raciocínio.

Os preços das ferramentas atuais continua o mesmo. A geração de imagens custa US$ 5,00/1 milhão de tokens de entrada de texto, US$ 10,00/1 milhão de tokens de entrada de imagem e US$ 40,00/1 milhão de tokens de saída de imagem, com 75% de desconto para token de entrada em cache. O Intérprete de código custa US$ 0,03 por contêiner. A busca em arquivos custa US$ 0,10/GB de armazenamento vetorial por dia e US$ 2,50/mil chamadas de ferramenta. Não há custo adicional para chamar a ferramenta de servidor de MCP remoto. Você só paga pelos tokens de saída da API. Saiba mais sobre preços⁠(abre em uma nova janela) na documentação.

Queremos ver o que você vai desenvolver!

Autoria

OpenAI