21 de maig del 2025

New tools and features in the Responses API

S'està carregant…

Avui afegim noves eines integrades a l’API Responses, la nostra primitiva bàsica d’API per crear aplicacions amb agents. Això inclou compatibilitat amb tots els servidors remots de Model Context Protocol (MCP)⁠(s'obre en una finestra nova), així com eines com la generació d'imatges⁠(s'obre en una finestra nova), l’Intèrpret de codi⁠(s'obre en una finestra nova) i millores a la cerca de fitxers⁠(s'obre en una finestra nova). Aquestes eines estan disponibles a tota la nostra sèrie GPT‑4o, la sèrie GPT‑4.1 i els models de raonament de la sèrie o d’OpenAI. o3 i o4-mini ara poden cridar eines i funcions directament dins de la seva cadena de pensament a l’API Responses, produint respostes més riques en context i més rellevants. L’ús d’o3 i o4-mini amb l’API Responses preserva els segments de raonament entre sol·licituds i crides d’eines, fet que millora la intel·ligència del model i redueix el cost i la latència per als desenvolupadors.

També presentem noves funcions a l’API Responses que milloren la fiabilitat, la visibilitat i la privadesa per a empreses i desenvolupadors. Entre aquestes hi ha el mode en segon pla⁠(s'obre en una finestra nova) per gestionar tasques de llarga durada de manera asíncrona i més fiable, compatibilitat amb resums de raonament⁠(s'obre en una finestra nova) i compatibilitat amb elements de raonament xifrats⁠(s'obre en una finestra nova).

Des que vam llançar l’API Responses el març de 2025 amb eines com la cerca web, la cerca de fitxers i l’ús de l’ordinador, centenars de milers de desenvolupadors han utilitzat l’API per processar bilions de segments als nostres models. Els clients han fet servir l’API per crear una varietat d’aplicacions amb agents, incloent-hi l’agent de programació de Zencoder⁠(s'obre en una finestra nova), l’agent d’intel·ligència de mercat de Revi⁠(s'obre en una finestra nova) per a capital privat i banca d’inversió, i l’assistent educatiu de MagicSchool AI⁠(s'obre en una finestra nova); tots ells fan servir la cerca web per incorporar a la seva aplicació informació rellevant i actualitzada. Ara els desenvolupadors poden crear agents encara més útils i fiables amb accés a les noves eines i funcions publicades avui.

Nova compatibilitat amb servidors MCP remots

Estem afegint compatibilitat amb servidors MCP remots⁠(s'obre en una finestra nova) a l’API Responses, basant-nos en el llançament de la compatibilitat amb MCP a l’SDK d’Agents⁠(s'obre en una finestra nova). MCP és un protocol obert que estandarditza com les aplicacions proporcionen context als LLM. En admetre servidors MCP a l’API Responses, els desenvolupadors podran connectar els nostres models a eines allotjades en qualsevol servidor MCP amb només unes poques línies de codi. Aquí teniu alguns exemples que mostren com els desenvolupadors poden fer servir avui servidors MCP remots amb l’API Responses:

Python

1response = client.responses.create(
2  model="gpt-4.1",
3  tools=[{
4    "type": "mcp",
5    "server_label": "shopify",
6    "server_url": "https://pitchskin.com/api/mcp",
7  }],
8  input="Add the Blemish Toner Pads to my cart"
9)

Els Blemish Toner Pads s’han afegit a la teva cistella! Pots continuar amb el pagament aquí:

Pitch. Skin checkout page showing express options (Shop Pay, PayPal, G Pay), contact and delivery form fields, and an order summary for one ‘Blemish Toner Pads 200 mL (120 pads)’ priced at AUD $49.

Entre els servidors MCP remots populars hi ha Cloudflare⁠(s'obre en una finestra nova), HubSpot⁠(s'obre en una finestra nova), Intercom⁠(s'obre en una finestra nova), PayPal⁠(s'obre en una finestra nova), Plaid⁠(s'obre en una finestra nova), Shopify⁠(s'obre en una finestra nova), Stripe⁠(s'obre en una finestra nova), Square⁠(s'obre en una finestra nova), Twilio⁠(s'obre en una finestra nova), Zapier⁠(s'obre en una finestra nova) i altres. Esperem que l’ecosistema de servidors MCP remots creixi ràpidament en els propers mesos, cosa que facilitarà als desenvolupadors crear agents potents que es puguin connectar a les eines i fonts de dades de què els seus usuaris ja depenen. Per donar el millor suport a l’ecosistema i contribuir a aquest estàndard en desenvolupament, OpenAI també s’ha unit al comitè directiu de MCP.

Per saber com posar en marxa el teu propi servidor MCP remot, consulta aquesta guia de Cloudflare⁠(s'obre en una finestra nova). Per saber com fer servir l’eina MCP a l’API Responses, consulta aquesta guia⁠(s'obre en una finestra nova) al nostre API Cookbook.

Actualitzacions de la generació d'imatges, l'Intèrpret de codi i la cerca de fitxers

Amb les eines integrades a l’API Responses, els desenvolupadors poden crear fàcilment agents més capaços amb una sola crida a l’API. En cridar diverses eines mentre raonen, els models ara aconsegueixen un rendiment significativament superior en crida d’eines en proves de referència estàndard del sector com Humanity’s Last Exam (font). Avui afegim noves eines, entre les quals hi ha:

Generació d'imatges: A més de fer servir l’API Images⁠(s'obre en una finestra nova), els desenvolupadors ara poden accedir al nostre model més recent de generació d'imatges —gpt-image-1— com a eina dins de l’API Responses. Aquesta eina admet transmissió en temps real, que permet als desenvolupadors veure previsualitzacions de la imatge mentre es genera, i edicions de diversos torns, que permeten indicar al model que refini aquestes imatges pas a pas amb granularitat. Més informació⁠(s'obre en una finestra nova).
Intèrpret de codi: Els desenvolupadors ara poden fer servir l’eina Code Interpreter⁠(s'obre en una finestra nova) dins de l’API Responses. Aquesta eina és útil per a l’anàlisi de dades, la resolució de problemes complexos de matemàtiques i programació, i per ajudar els models a entendre i manipular imatges en profunditat (p. ex., pensar amb imatges). La capacitat de models com o3 i o4-mini per fer servir l’eina Code Interpreter dins de la seva cadena de pensament ha donat lloc a una millora del rendiment en diverses proves de referència, incloent-hi Humanity’s Last Exam (font). Més informació⁠(s'obre en una finestra nova).
Cerca de fitxers: Els desenvolupadors ara poden accedir a l’eina de cerca de fitxers⁠(s'obre en una finestra nova) als nostres models de raonament. La cerca de fitxers permet als desenvolupadors incorporar fragments rellevants dels seus documents al context del model en funció de la consulta de l’usuari. També presentem actualitzacions a l’eina de cerca de fitxers que permeten als desenvolupadors fer cerques en diversos magatzems de vectors i admeten el filtratge d’atributs amb matrius. Més informació⁠(s'obre en una finestra nova).

Noves funcions a l'API Responses

A més de les noves eines, també afegim compatibilitat amb noves funcions a l’API Responses, entre les quals hi ha:

Mode en segon pla: Com es veu en productes amb agents com Codex, recerca profunda i Operator, els models de raonament poden trigar diversos minuts a resoldre problemes complexos. Ara els desenvolupadors poden fer servir el mode en segon pla per crear experiències semblants en models com o3 sense preocupar-se pels temps d’espera o altres problemes de connectivitat: el mode en segon pla inicia aquestes tasques de manera asíncrona. Els desenvolupadors poden consultar aquests objectes per comprovar si s’han completat o començar a transmetre esdeveniments sempre que la seva aplicació necessiti posar-se al dia amb l’estat més recent. Més informació⁠(s'obre en una finestra nova).

Python

1response = client.responses.create(
2  model="o3",
3  input="Write me an extremely long story.",
4  reasoning={ "effort": "high" },
5  background=True
6)

Resums de raonament: L’API Responses ara pot generar resums concisos i en llenguatge natural de la cadena de pensament interna del model, semblants als que veus a ChatGPT. Això facilita als desenvolupadors depurar, auditar i crear millors experiències per als usuaris finals. Els resums de raonament estan disponibles sense cost addicional. Més informació⁠(s'obre en una finestra nova).

Python

1response = client.responses.create(
2    model="o4-mini",
3    tools=[
4        {
5            "type": "code_interpreter",
6            "container": {"type": "auto"}
7        }
8    ],
9    instructions=(
10        "You are a personal math tutor. "
11        "When asked a math question, run code to answer the question."
12    ),
13    input="I need to solve the equation `3x + 11 = 14`. Can you help me?",
14    reasoning={"summary": "auto"}
15)

Elements de raonament xifrats: Els clients que compleixen els requisits per a la retenció de dades nul·la (ZDR)⁠(s'obre en una finestra nova) ara poden reutilitzar elements de raonament entre sol·licituds a l’API, sense que s’emmagatzemi cap element de raonament als servidors d’OpenAI. Per a models com o3 i o4-mini, reutilitzar elements de raonament entre crides de funció augmenta la intel·ligència, redueix l’ús de segments i incrementa les taxes d’encert de memòria cau, cosa que es tradueix en costos i latència més baixos. Més informació⁠(s'obre en una finestra nova).

Python

1response = client.responses.create(
2  model="o3",
3  input="Implement a simple web server in Rust from scratch.",
4  store=False,
5  include=["reasoning.encrypted_content"]
6)

Preus i disponibilitat

Totes aquestes eines i funcions ja estan disponibles a l’API Responses, amb compatibilitat a la nostra sèrie GPT‑4o, la sèrie GPT‑4.1 i els nostres models de raonament de la sèrie o d’OpenAI (o1, o3, o3‑mini i o4-mini). La generació d'imatges només és compatible amb o3 dins de la nostra sèrie de models de raonament.

Els preus de les eines existents es mantenen igual. La generació d'imatges costa 5,00 $/1 M de segments d’entrada de text, 10,00 $ / 1 M de segments d’entrada d’imatge i 40,00 $ / 1 M de segments de sortida d’imatge, amb un 75 % de descompte en segments d’entrada en memòria cau. L’Intèrpret de codi costa 0,03 $ per contenidor. La cerca de fitxers costa 0,10 $/GB d’emmagatzematge vectorial al dia i 2,50 $/1 k crides d’eines. No hi ha cap cost addicional per cridar l’eina de servidor MCP remot: simplement se us factura pels segments de sortida de l’API. Més informació sobre els preus⁠(s'obre en una finestra nova) a la nostra documentació.

Tenim moltes ganes de veure què creeu!

Autor

OpenAI