21. mai 2025

Nye verktøy og funksjoner i Responses API

Vi introduserer støtte for ekstern MCP-server, bildegenerering, kodetolker med mer i Responses API for utviklere og konsern.

Laster inn …

I dag legger vi til nye innebygde verktøy i Responses API – kjerne-API-primitiven vår for bygging av agentapplikasjoner. Dette inkluderer støtte for alle eksterne Model Context Protocol (MCP)-servere⁠(åpnes i et nytt vindu) samt verktøy som bildegenerering⁠(åpnes i et nytt vindu), kodetolker⁠(åpnes i et nytt vindu) og forbedringer av filsøk⁠(åpnes i et nytt vindu). Disse modellene er tilgjengelige i alle modellene våre i GPT‑4o‑serien, GPT‑4.1‑serien og OpenAI o-serien. Nå kan o3 og o4-mini kalle verktøy og funksjoner direkte i tankerekken sin i Responses API, noe som produserer svar som er kontekstuelt rike og relevante. Bruk av o3 og o4-mini med Responses API bevarer resonnementtokener fra forespørsler og verktøykall, forbedrer modellintelligens og reduserer kostnaden og forsinkelsen for utviklere.

Vi introduserer også nye funksjoner i Responses API som forbedrer pålitelighet, synlighet og personvern for konsern og utviklere. Disse inkluderer bakgrunnsmodus⁠(åpnes i et nytt vindu) for å håndtere oppgaver med lang kjøretid asynkront, og mer pålitelig støtte for oppsummeringer av resonnement⁠(åpnes i et nytt vindu) og støtte for krypterte resonnementelementer⁠(åpnes i et nytt vindu).

Siden lanseringen av Responses API i mars 2025 med verktøy som nettsøk, filsøk og datamaskinbruk, har hundretusener av utviklere brukt API-et til å behandle flere billioner tokener i alle modellene våre. Kunder har brukt API-et til å bygge en variasjon av agentapplikasjoner, inkludert Zencoder⁠(åpnes i et nytt vindu)s kodeagent, Revi⁠(åpnes i et nytt vindu)s agent for markedsintelligens for kapitalforvaltning og investeringsbanker, og MagicSchool AI⁠(åpnes i et nytt vindu)s utdanningsassistent – som alle bruker nettsøk til å hente relevant, oppdatert informasjon til appen sin. Nå kan utviklere bygge agenter som er enda nyttigere og mer pålitelige med tilgang til de nye verktøyene og funksjonene som lanseres i dag.

Ny støtte for ekstern MCP-server

Vi legger til støtte for eksterne MCP-servere⁠(åpnes i et nytt vindu) i Responses API, basert på utgivelsen av MCP-støtte i Agents SDK⁠(åpnes i et nytt vindu). MCP er en åpen protokoll som standardiserer hvordan applikasjoner gir kontekst til LLM-er. Ved å støtte MCP-servere i Responses API kan utviklere koble modellene våre til verktøy som er hostet på en hvilken som helst MCP-server, med bare noen få kodelinjer. Her er noen eksempler som viser hvordan utviklere kan bruke eksterne MCP-servere med Responses API i dag:

Python

1response = client.responses.create(
2  model="gpt-4.1",
3  tools=[{
4    "type": "mcp",
5    "server_label": "shopify",
6    "server_url": "https://pitchskin.com/api/mcp",
7  }],
8  input="Add the Blemish Toner Pads to my cart"
9)

The Blemish Toner Pads have been added to your cart! You can proceed to checkout here:

Pitch. Skin checkout page showing express options (Shop Pay, PayPal, G Pay), contact and delivery form fields, and an order summary for one ‘Blemish Toner Pads 200 mL (120 pads)’ priced at AUD $49.

Populære eksterne MCP-servere inkluderer Cloudflare⁠(åpnes i et nytt vindu), HubSpot⁠(åpnes i et nytt vindu), Intercom⁠(åpnes i et nytt vindu), PayPal⁠(åpnes i et nytt vindu), Plaid⁠(åpnes i et nytt vindu), Shopify⁠(åpnes i et nytt vindu), Stripe⁠(åpnes i et nytt vindu), Square⁠(åpnes i et nytt vindu), Twilio⁠(åpnes i et nytt vindu), Zapier⁠(åpnes i et nytt vindu) med mer. Vi forventer at økosystemet med eksterne MCP-servere vokser raskt i de kommende månedene, noe som gjør det enklere for utviklere å bygge kraftige agenter som kan koble til verktøyene og datakildene brukerne deres allerede bruker. For å gi best mulig støtte for økosystemet og bidra til denne utviklende standarden har OpenAI også blitt med i styringsutvalget for MCP.

For å lære hvordan du lager din egen eksterne MCP-server, kan du sjekke denne veiledningen fra Cloudflare⁠(åpnes i et nytt vindu). For å lære hvordan du bruker MCP-verktøyet i Responses API, kan du sjekke denne veiledningen⁠(åpnes i et nytt vindu) i API Cookbook.

Oppdateringer av bildegenerering, kodetolker og filsøk

Med innebygde verktøy i Responses API kan utviklere enkelt opprette dyktigere agenter med ett enkelt API-kall. Ved å kalle flere verktøy under resonnement kan modeller nå oppnå betydelig høyere ytelse fra verktøykall for referansemålinger i henhold til bransjestandard som Humanity’s Last Exam (kilde). I dag legger vi til nye verktøy inkludert:

Bildegenerering: I tillegg til å bruke Images API⁠(åpnes i et nytt vindu) kan utviklere nå bruke den siste modellen vår for bildegenerering, gpt-image-1, som et verktøy i Responses API. Dette verktøyet støtter strømming i sanntid, noe som lar utviklere se forhåndsvisninger av bildet mens det blir generert, og redigeringer i flere trinn, noe som lar utviklere be modellen finjustere disse bildene trinnvis. Finn ut mer⁠(åpnes i et nytt vindu).
Kodetolker: Nå kan utviklere bruke Kodetolker⁠(åpnes i et nytt vindu)-verktøyet i Responses API. Dette verktøyet er nyttig for dataanalyse, løsing av komplekse matte- og kodeproblemer, og for å hjelpe modellene med å få en dyp forståelse av og manipulere bilder (f.eks. tenke med bilder). Evnen modeller som o3 og o4-mini har til å bruke Kodetolker-verktøyet i tankerekken, har resultert i bedre ytelse i flere referansemålinger, inkludert Humanity’s Last Exam (kilde). Finn ut mer⁠(åpnes i et nytt vindu).
Filsøk: Nå kan utviklere bruke Filsøk⁠(åpnes i et nytt vindu)-verktøyet i resonneringsmodellene våre. Filsøk lar utviklere hente relevante biter av dokumentene sine til modellkonteksten basert på brukerens melding. Vi introduserer også oppdateringer av Filsøk-verktøyet, som lar utviklere utføre søk fra flere vektorbutikker og støtter filtrering av attributter med tabeller. Finn ut mer⁠(åpnes i et nytt vindu).

Nye funksjoner i Responses API

I tillegg til de nye verktøyene legger vi også til støtte for nye funksjoner i Responses API, inkludert:

Bakgrunnsmodus: Som sett i agentprodukter som Codex, grundig research og Operator, kan resonneringsmodeller bruke flere minutter på å løse komplekse problemer. Nå kan utviklere bruke bakgrunnsmodus til å bygge lignende opplevelser på modeller som o3 uten å bekymre seg over tidsavbrudd eller andre tilkoblingsproblemer. Bakgrunnsmodus starter disse oppgavene asynkront. Utviklere kan enten innføre disse objektene for å sjekke om de er fullførte eller starte strømming av hendelser når applikasjonen må hente opp den nyeste tilstanden. Finn ut mer⁠(åpnes i et nytt vindu).

Python

1response = client.responses.create(
2  model="o3",
3  input="Write me an extremely long story.",
4  reasoning={ "effort": "high" },
5  background=True
6)

Oppsummeringer av resonnement: Nå kan Responses API generere konsise oppsummeringer i naturlig språk av modellens interne tankerekke, som ligner på det du ser i ChatGPT. Dette gjør det enklere for utviklere å feilsøke, granske og bygge bedre opplevelser for sluttbrukere. Oppsummeringer av resonnement er tilgjengelig uten ekstra kostnad. Finn ut mer⁠(åpnes i et nytt vindu).

Python

1response = client.responses.create(
2    model="o4-mini",
3    tools=[
4        {
5            "type": "code_interpreter",
6            "container": {"type": "auto"}
7        }
8    ],
9    instructions=(
10        "You are a personal math tutor. "
11        "When asked a math question, run code to answer the question."
12    ),
13    input="I need to solve the equation `3x + 11 = 14`. Can you help me?",
14    reasoning={"summary": "auto"}
15)

Krypterte resonnementelementer: Kunder som er kvalifisert for Zero Data Retention (ZDR)⁠(åpnes i et nytt vindu), kan nå gjenbruke resonnementelementer fra API-forespørsler – uten at noen resonnementelementer blir lagret på OpenAI-servere. For modeller som o3 og o4-mini øker gjenbruk av resonnementelementer mellom funksjonskall intelligens, reduserer tokenbruk og øker treffrater, noe som reduserer i lavere kostnader og forsinkelser. Finn ut mer⁠(åpnes i et nytt vindu).

Python

1response = client.responses.create(
2  model="o3",
3  input="Implement a simple web server in Rust from scratch.",
4  store=False,
5  include=["reasoning.encrypted_content"]
6)

Pris og tilgjengelighet

Alle disse verktøyene og funksjonene er nå tilgjengelige på Responses API, støttet i resonneringsmodellene våre i GPT‑4o‑serien, GPT‑4.1‑serien og OpenAI o-serien (o1, o3, o3‑mini og o4-mini). Bildegenerering støttes bare på o3 av serien vår med resonneringsmodeller.

Priser for eksisterende verktøy forblir uendret. Bildegenerering koster USD 5,00 per 1 million tokener for tekstinndata, USD 10,00 per 1 million tokener for bildeinndata og USD 40,00 per 1 million tokener for bildeutdata, med 75 % rabatt for bufrede inndatatokener. Kodetolker koster USD 0,03 per container. Filsøk koster USD 0,10 per GB vektorlagring per dag og USD 2,50 per 1000 verktøykall. Det er ingen ekstra kostnader for å kalle det eksterne MCP-serververktøyet – du blir bare fakturert for utdatatokener fra API-et. Finn ut mer om priser⁠(åpnes i et nytt vindu) i dokumentene våre.

Vi gleder oss til å se hva du bygger!

Forfatter

OpenAI