Pular para o conteúdo principal
OpenAI

21 de maio de 2025

Produto

Novas ferramentas e recursos da API Responses

Apresentamos o suporte a servidor MCP remoto, geração de imagens, intérprete de código e muito mais na API Responses para desenvolvedores e empresas.

Carregando…

Hoje, estamos acrescentando novas ferramentas integradas à API Responses, nossa API essencial para criação de aplicativos autônomos. Compatibilidade com todos os servidores remotos MCP (Protocolo de Contexto de Modelos)(abre em uma nova janela), além de ferramentas como geração de imagens(abre em uma nova janela) e intérprete de código(abre em uma nova janela), bem como melhorias na busca de arquivos(abre em uma nova janela). Essas ferramentas estão disponíveis em todos os modelos de raciocínio das séries GPT‑4o, GPT‑4.1 e OpenAI o. O o3 e o o4-mini já podem chamar ferramentas e funções dentro da própria linha de raciocínio na API Responses, produzindo respostas com mais contexto e relevância. Usar o o3 e o l4-mini com a API Responses preserva os tokens de reflexão entre diferentes solicitações e chamadas de ferramentas, melhorando a inteligência do modelo e reduzindo o custo e a latência para os desenvolvedores.

Também estamos introduzindo novos recursos na API Responses para melhorar a confiabilidade, visibilidade e privacidade para empresas e desenvolvedores. Esses recursos incluem trabalho em segundo plano(abre em uma nova janela) para executar tarefas assíncronas de longa duração com mais confiabilidade, suporte a resumos de raciocínio(abre em uma nova janela) e suporte a itens de raciocínio criptografados(abre em uma nova janela)

Desde o lançamento da API Responses, em março de 2025, com ferramentas como pesquisa na web, busca de arquivos e uso de computadores, ela já foi usada por centenas de milhares de desenvolvedores para processar trilhões de tokens em nossos modelos. Os clientes usam a API para criar os mais diversos aplicativos autônomos, como o agente de programação da Zencoder(abre em uma nova janela), o agente de inteligência de mercado da Revi(abre em uma nova janela) para gestão de ativos e investimentos e o assistente de educação MagicSchool AI(abre em uma nova janela). Todos usam busca online para obter dados relevantes e atualizados para o aplicativo. Agora os desenvolvedores podem criar agentes ainda mais úteis e confiáveis com acesso às novas ferramentas e recursos lançados hoje.

Novo suporte para servidores remotos MCP

Estamos acrescentando o suporte a servidores remotos MCP(abre em uma nova janela) na API Responses, aproveitando o lançamento do suporte para MCP no SDK Agents(abre em uma nova janela). MCP é um protocolo aberto que padroniza a forma como aplicativos fornecem contexto aos LLMs. Com o suporte a servidores MCP na API Responses, os desenvolvedores poderão conectar nossos modelos a ferramentas hospedadas em qualquer servidor MCP com poucas linhas de código. Veja alguns exemplos de como um desenvolvedor hoje pode usar servidores remotos MCP com a API Responses:

Python

1
response = client.responses.create(
2
model="gpt-4.1",
3
tools=[{
4
"type": "mcp",
5
"server_label": "shopify",
6
"server_url": "https://pitchskin.com/api/mcp",
7
}],
8
input="Add the Blemish Toner Pads to my cart"
9
)

The Blemish Toner Pads have been added to your cart! You can proceed to checkout here:

Pitch. Skin checkout page showing express options (Shop Pay, PayPal, G Pay), contact and delivery form fields, and an order summary for one ‘Blemish Toner Pads 200 mL (120 pads)’ priced at AUD $49.

Algumas versões populares de servidores MCP: Cloudflare(abre em uma nova janela), HubSpot(abre em uma nova janela), Intercom(abre em uma nova janela), PayPal(abre em uma nova janela), Plaid(abre em uma nova janela), Shopify(abre em uma nova janela), Stripe(abre em uma nova janela), Square(abre em uma nova janela), Twilio(abre em uma nova janela), Zapier(abre em uma nova janela) e outros. Acreditamos que o ecossistema de servidores remotos MCP deve crescer rapidamente nos próximos meses, facilitando a criação de agentes potentes conectados às ferramentas e fontes de dados que os usuários já adotam. Para oferecer o melhor suporte ao ecossistema e contribuir para esse padrão em evolução, a OpenAI também entrou para o comitê gestor do MCP.

Saiba como criar seu próprio servidor remoto MCP neste guia da Cloudflare(abre em uma nova janela). Para aprender a usar a ferramenta MCP na API Responses, use este guia(abre em uma nova janela) do nosso Manual de APIs.

Atualizações de geração de imagens, intérprete de códigos e busca de arquivos

Com ferramentas integradas à API Responses, os desenvolvedores conseguem criar agentes com mais capacidade a partir de uma única chamada de API. Invocando várias ferramentas durante o raciocínio, os modelos têm um desempenho muito melhor na invocação de ferramentas em referências padrão do setor, como o Humanity’s Last Exam (fonte). Hoje, acrescentamos novas ferramentas:

  • Geração de imagens: além de usar a API Images(abre em uma nova janela), os desenvolvedores já pode acessar nosso último modelo de geração de imagens. o gpt-image-1, como ferramenta dentro da própria API Responses. A ferramenta permite transmissão em tempo real, de forma que os desenvolvedores recebem prévias da imagem durante a geração, além de várias etapas de edição, permitindo fazer prompts para que o modelo ajuste as imagens passo a passo. Saiba mais(abre em uma nova janela).
  • Intérprete de código: agora, os desenvolvedores podem usar o Intérprete de código(abre em uma nova janela) dentro da API Responses. É uma ferramenta útil para analisar dados, solucionar problemas complexos de matemática e programação e ajudar os modelos a entender e manipular imagens em detalhes (ex.: pensar com imagens). A possibilidade de modelos como o o3 e o o4-mini usarem o Intérprete de código dentro da linha de raciocínio melhorou o desempenho em várias áreas de referência, como o Humanity's Last Exam (fonte). Saiba mais(abre em uma nova janela).
  • Busca de arquivos: agora, os desenvolvedores podem acessar a ferramenta de busca de arquivos(abre em uma nova janela) em nossos modelos de raciocínio. A busca de arquivos permite inserir trechos úteis de documentos no contexto do modelo, conforme a consulta do usuário. Também atualizamos a ferramenta de busca em arquivos, permitindo que os desenvolvedores pesquisem em vários bancos de vetores, com filtragem de atributos com matrizes. Saiba mais(abre em uma nova janela).

Novos recursos na API Responses

Além das novas ferramentas, também adicionamos suporte para novos recursos na API Responses, como:

  • Modo segundo plano: da mesma forma que produtos autônomos como Codex, Investigação e Operator, os modelos de raciocínio podem levar vários minutos para resolver problemas complexos. Agora, os desenvolvedores podem usar o modo segundo plano para criar um processo semelhante em modelos como o o3, sem problemas de limite de tempo ou conectividade: em segundo plano, as tarefas rodam de forma assíncrona. Os desenvolvedores podem consultar esses objetos para conferir se estão completos ou podem começar a transmitir eventos sempre que o aplicativo precisar saber o estado mais recente. Saiba mais(abre em uma nova janela).

Python

1
response = client.responses.create(
2
model="o3",
3
input="Write me an extremely long story.",
4
reasoning={ "effort": "high" },
5
background=True
6
)
  • Resumos de raciocínio: A API Responses já pode gerar resumos concisos em linguagem natural da linha de raciocínio interna do modelo, assim como o ChatGPT. Para os desenvolvedores, isso facilita a depuração, auditoria e a criação de experiências melhores para o usuário. Os resumos de raciocínio estão disponíveis sem custo extra. Saiba mais(abre em uma nova janela).

Python

1
response = client.responses.create(
2
model="o4-mini",
3
tools=[
4
{
5
"type": "code_interpreter",
6
"container": {"type": "auto"}
7
}
8
],
9
instructions=(
10
"You are a personal math tutor. "
11
"When asked a math question, run code to answer the question."
12
),
13
input="I need to solve the equation `3x + 11 = 14`. Can you help me?",
14
reasoning={"summary": "auto"}
15
)
  • Itens de reflexão criptografados: clientes qualificados para zero retenção de dados (ZDR)(abre em uma nova janela) já podem reutilizar itens de raciocínio de todas as solicitações da API, sem que nenhum deles seja armazenado nos servidores da OpenAI. Em modelos como o o3 e o o4-mini, a reutilização de itens entre as chamadas de função aumenta a inteligência, reduz o uso de tokens e aumenta as taxas de resultados do cache, reduzindo custo e latência. Saiba mais(abre em uma nova janela).

Python

1
response = client.responses.create(
2
model="o3",
3
input="Implement a simple web server in Rust from scratch.",
4
store=False,
5
include=["reasoning.encrypted_content"]
6
)

Preços e disponibilidade

Todas essas ferramentas e recursos já estão disponíveis na API Responses, compatível com os modelos de raciocínio das sérias GPT‑4o, GPT‑4.1 e OpenAI o (o1, o3, o3‑mini e o4-mini). A geração de imagens só tem suporte na série o3 de modelos de raciocínio. 

Os preços das ferramentas atuais continua o mesmo. A geração de imagens custa US$ 5,00/1 milhão de tokens de entrada de texto, US$ 10,00/1 milhão de tokens de entrada de imagem e US$ 40,00/1 milhão de tokens de saída de imagem, com 75% de desconto para token de entrada em cache. O Intérprete de código custa US$ 0,03 por contêiner. A busca em arquivos custa US$ 0,10/GB de armazenamento vetorial por dia e US$ 2,50/mil chamadas de ferramenta. Não há custo adicional para chamar a ferramenta de servidor de MCP remoto. Você só paga pelos tokens de saída da API. Saiba mais sobre preços(abre em uma nova janela) na documentação. 

Queremos ver o que você vai desenvolver!