મુખ્ય વિષય-સામગ્રી પર જાવો
OpenAI

New tools and features in the Responses API

લોડિંગ…

આજે, અમે Responses API માં નવા બિલ્ટ-ઇન ટૂલ્સ ઉમેરી રહ્યા છીએ. આ એજન્ટિક એપ્લિકેશન્સ બનાવવા માટેનું અમારું મુખ્ય API પ્રિમિટિવ છે. તેમાં બધા રિમોટ Model Context Protocol (MCP) સર્વરો(નવી વિન્ડોમાં ખૂલે છે) માટે સપોર્ટ, તેમજ ઇમેજ જનરેશન(નવી વિન્ડોમાં ખૂલે છે), કોડ ઇન્ટરપ્રિટર(નવી વિન્ડોમાં ખૂલે છે) જેવા ટૂલ્સ અને ફાઇલ સર્ચ(નવી વિન્ડોમાં ખૂલે છે) માં સુધારાઓનો સમાવેશ થાય છે. આ ટૂલ્સ અમારી GPT‑4o સિરીઝ, GPT‑4.1 સિરીઝ અને OpenAI o-series રિઝનિંગ મોડલ્સમાં ઉપલબ્ધ છે. o3 અને o4-mini હવે Responses API માં તેમના ચેન-ઓફ-થોટની અંદર સીધા ટૂલ્સ અને ફંક્શન્સ કોલ કરી શકે છે, જેના કારણે વધુ કન્ટેક્સ્ટથી સમૃદ્ધ અને સંબંધિત જવાબો મળે છે. Responses API સાથે o3 અને o4-mini નો ઉપયોગ કરવાથી રિક્વેસ્ટ્સ અને ટૂલ કોલ્સ દરમિયાન રિઝનિંગ ટોકન્સ જળવાઈ રહે છે, જે મોડલની બુદ્ધિમત્તા સુધારે છે અને ડેવલપર્સ માટે ખર્ચ અને લેટન્સી ઘટાડે છે.

અમે Responses API માં એવા નવા ફીચર્સ પણ રજૂ કરી રહ્યા છીએ જે એન્ટરપ્રાઇઝ અને ડેવલપર્સ માટે વિશ્વસનીયતા, દેખાવ અને ગોપનીયતા સુધારે છે. તેમાં લાંબા સમય સુધી ચાલતા કાર્યોને અસિંક્રોનસ રીતે અને વધુ વિશ્વસનીય રીતે સંભાળવા માટે background mode(નવી વિન્ડોમાં ખૂલે છે), reasoning summaries(નવી વિન્ડોમાં ખૂલે છે) માટે સપોર્ટ, અને encrypted reasoning items(નવી વિન્ડોમાં ખૂલે છે) માટે સપોર્ટનો સમાવેશ થાય છે. 

માર્ચ 2025 માં વેબ સર્ચ, ફાઇલ સર્ચ અને કમ્પ્યુટર યુઝ જેવા ટૂલ્સ સાથે Responses API રિલીઝ કર્યા પછીથી, લાખો ડેવલપર્સે અમારી મોડલ્સમાં ટ્રિલિયનો ટોકન્સ પ્રોસેસ કરવા માટે API નો ઉપયોગ કર્યો છે. ગ્રાહકોએ API નો ઉપયોગ વિવિધ એજન્ટિક એપ્લિકેશન્સ બનાવવા માટે કર્યો છે, જેમાં Zencoder(નવી વિન્ડોમાં ખૂલે છે) નો coding agent, Revi(નવી વિન્ડોમાં ખૂલે છે) નો private equity અને investment banking માટેનો market intelligence agent, અને MagicSchool AI(નવી વિન્ડોમાં ખૂલે છે)'s education assistant નો સમાવેશ થાય છે. આ બધું જ તેમની એપમાં સંબંધિત, તાજી માહિતી લાવવા માટે web search નો ઉપયોગ કરે છે. હવે ડેવલપર્સ આજે રિલીઝ થયેલા નવા ટૂલ્સ અને ફીચર્સની ઍક્સેસ સાથે વધુ ઉપયોગી અને વિશ્વસનીય એજન્ટ્સ બનાવી શકે છે.

નવો રિમોટ MCP સર્વર સપોર્ટ

અમે Responses API માં રિમોટ MCP સર્વરો(નવી વિન્ડોમાં ખૂલે છે) માટે સપોર્ટ ઉમેરી રહ્યા છીએ, જે Agents SDK માં MCP સપોર્ટ(નવી વિન્ડોમાં ખૂલે છે) ના રિલીઝ પર આધારિત છે. MCP એક ખુલ્લો પ્રોટોકોલ છે જે એપ્લિકેશનો LLMs ને કેવી રીતે કન્ટેક્સ્ટ આપે છે તેને માનકીકૃત કરે છે. Responses API માં MCP સર્વરોને સપોર્ટ આપવાથી, ડેવલપર્સ માત્ર થોડા કોડની લાઇનો સાથે અમારા મોડલ્સને કોઈપણ MCP સર્વર પર હોસ્ટ કરાયેલા ટૂલ્સ સાથે કનેક્ટ કરી શકશે. અહીં કેટલાક ઉદાહરણો છે જે બતાવે છે કે ડેવલપર્સ આજે Responses API સાથે રિમોટ MCP સર્વરોનો કેવી રીતે ઉપયોગ કરી શકે છે.

Python

1
response = client.responses.create(
2
model="gpt-4.1",
3
tools=[{
4
"type": "mcp",
5
"server_label": "shopify",
6
"server_url": "https://pitchskin.com/api/mcp",
7
}],
8
input="Add the Blemish Toner Pads to my cart"
9
)

Blemish Toner Pads તમારા કાર્ટમાં ઉમેરવામાં આવ્યા છે. તમે અહીંથી ચેકઆઉટ કરી શકો છો.

Pitch. Skin checkout page showing express options (Shop Pay, PayPal, G Pay), contact and delivery form fields, and an order summary for one ‘Blemish Toner Pads 200 mL (120 pads)’ priced at AUD $49.

લોકપ્રિય રિમોટ MCP સર્વરોમાં Cloudflare(નવી વિન્ડોમાં ખૂલે છે), HubSpot(નવી વિન્ડોમાં ખૂલે છે), Intercom(નવી વિન્ડોમાં ખૂલે છે), PayPal(નવી વિન્ડોમાં ખૂલે છે), Plaid(નવી વિન્ડોમાં ખૂલે છે), Shopify(નવી વિન્ડોમાં ખૂલે છે), Stripe(નવી વિન્ડોમાં ખૂલે છે), Square(નવી વિન્ડોમાં ખૂલે છે), Twilio(નવી વિન્ડોમાં ખૂલે છે), Zapier(નવી વિન્ડોમાં ખૂલે છે), અને અન્યનો સમાવેશ થાય છે. અમને અપેક્ષા છે કે આવતા મહિનાઓમાં રિમોટ MCP સર્વરોનું ઇકોસિસ્ટમ ઝડપથી વધશે, જેથી ડેવલપર્સ માટે એવા શક્તિશાળી એજન્ટ બનાવવા વધુ સરળ બનશે જે તેમના વપરાશકર્તાઓ પહેલેથી જ વિશ્વાસ રાખતા ટૂલ્સ અને ડેટા સોર્સિસ સાથે કનેક્ટ થઈ શકે. ઇકોસિસ્ટમને શ્રેષ્ઠ રીતે સપોર્ટ કરવા અને આ વિકસતા સ્ટાન્ડર્ડમાં યોગદાન આપવા માટે, OpenAI એ MCP માટેની સ્ટિયરિંગ કમિટીમાં પણ જોડાયું છે.

તમારો પોતાનો રિમોટ MCP સર્વર કેવી રીતે શરૂ કરવો તે જાણવા માટે, Cloudflare(નવી વિન્ડોમાં ખૂલે છે) ની આ માર્ગદર્શિકા જુઓ. Responses API માં MCP ટૂલ કેવી રીતે વાપરવું તે જાણવા માટે, અમારી API Cookbook માંની આ માર્ગદર્શિકા(નવી વિન્ડોમાં ખૂલે છે) જુઓ.

ઇમેજ જનરેશન, કોડ ઇન્ટરપ્રિટર અને ફાઇલ સર્ચ માટેના અપડેટ્સ

Responses API માં બિલ્ટ-ઇન ટૂલ્સ સાથે, ડેવલપર્સ માત્ર એક જ API કોલથી વધુ સક્ષમ એજન્ટ્સ સરળતાથી બનાવી શકે છે. reasoning કરતી વખતે અનેક ટૂલ્સ કોલ કરીને, મોડલ્સ હવે Humanity’s Last Exam જેવી ઉદ્યોગ-માનક બેન્ચમાર્ક્સ પર ટૂલ કોલિંગ પ્રદર્શન નોંધપાત્ર રીતે વધુ સારું હાંસલ કરે છે (સોર્સ). આજે, અમે નીચેના નવા ટૂલ્સ ઉમેરી રહ્યા છીએ.

  • Image generation: Images API(નવી વિન્ડોમાં ખૂલે છે) નો ઉપયોગ કરવા ઉપરાંત, ડેવલપર્સ હવે અમારા નવતર ઇમેજ જનરેશન મોડલ. gpt-image-1. ને Responses API ની અંદર ટૂલ તરીકે ઍક્સેસ કરી શકે છે. આ ટૂલ રિયલ-ટાઇમ સ્ટ્રીમિંગને સપોર્ટ કરે છે, જેથી ડેવલપર્સ ઇમેજ જનરેટ થતી હોય ત્યારે તેની પ્રિવ્યૂ જોઈ શકે, અને multi-turn edits ને પણ સપોર્ટ કરે છે, જેથી ડેવલપર્સ મોડલને આ ઇમેજિસને પગલું-દર-પગલું સૂક્ષ્મ રીતે સુધારવા માટે પ્રોમ્પ્ટ કરી શકે. વધુ જાણો(નવી વિન્ડોમાં ખૂલે છે).
  • Code Interpreter: ડેવલપર્સ હવે Responses API ની અંદર કોડ ઇન્ટરપ્રિટર(નવી વિન્ડોમાં ખૂલે છે) ટૂલનો ઉપયોગ કરી શકે છે. આ ટૂલ ડેટા વિશ્લેષણ, જટિલ ગણિત અને કોડિંગ સમસ્યાઓ હલ કરવા અને મોડલ્સને ઇમેજિસને ઊંડાણપૂર્વક સમજવા અને તેમાં ફેરફાર કરવામાં મદદ કરવા માટે ઉપયોગી છે (ઉદાહરણ તરીકે, ઇમેજિસ સાથે વિચારવું). o3 અને o4-mini જેવા મોડલ્સ તેમની ચેન-ઓફ-થોટમાં Code Interpreter ટૂલનો ઉપયોગ કરી શકે છે, જેના પરિણામે Humanity’s Last Exam સહિત અનેક બેન્ચમાર્ક્સ પર પ્રદર્શન સુધર્યું છે (સોર્સ). વધુ જાણો(નવી વિન્ડોમાં ખૂલે છે).
  • File search: ડેવલપર્સ હવે અમારા રિઝનિંગ મોડલ્સમાં ફાઇલ સર્ચ(નવી વિન્ડોમાં ખૂલે છે) ટૂલ ઍક્સેસ કરી શકે છે. ફાઇલ સર્ચ વપરાશકર્તાના ક્વેરીના આધારે ડેવલપર્સને તેમના દસ્તાવેજોના સંબંધિત ભાગોને મોડલના કન્ટેક્સ્ટમાં લાવવા સક્ષમ બનાવે છે. અમે ફાઇલ સર્ચ ટૂલમાં એવા અપડેટ્સ પણ રજૂ કરી રહ્યા છીએ જે ડેવલપર્સને અનેક vector stores માં શોધ કરવા અને arrays સાથે attribute filtering ને સપોર્ટ કરવાની મંજૂરી આપે છે. વધુ જાણો(નવી વિન્ડોમાં ખૂલે છે).

Responses API માં નવા ફીચર્સ

નવા ટૂલ્સ ઉપરાંત, અમે Responses API માં નવા ફીચર્સ માટે પણ સપોર્ટ ઉમેરી રહ્યા છીએ, જેમાં નીચેનું સામેલ છે.

  • Background mode: Codex, ડીપ રિસર્ચ, અને Operator જેવા એજન્ટિક પ્રોડક્ટ્સમાં જોવા મળે છે તેમ, રિઝનિંગ મોડલ્સને જટિલ સમસ્યાઓ ઉકેલવામાં અનેક મિનિટ લાગી શકે છે. ડેવલપર્સ હવે timeouts અથવા અન્ય connectivity સમસ્યાઓની ચિંતા કર્યા વિના o3 જેવા મોડલ્સ પર સમાન અનુભવો બનાવવા background mode નો ઉપયોગ કરી શકે છે. background mode આ કાર્યોને અસિંક્રોનસ રીતે શરૂ કરે છે. ડેવલપર્સ પૂર્ણતા ચકાસવા માટે આ ઓબ્જેક્ટ્સને poll કરી શકે છે, અથવા જ્યારે તેમની એપ્લિકેશનને નવીનતમ state સાથે સમકક્ષ થવાની જરૂર હોય ત્યારે streaming events શરૂ કરી શકે છે. વધુ જાણો(નવી વિન્ડોમાં ખૂલે છે).

Python

1
response = client.responses.create(
2
model="o3",
3
input="Write me an extremely long story.",
4
reasoning={ "effort": "high" },
5
background=True
6
)
  • Reasoning summaries: Responses API હવે ChatGPT માં તમે જુઓ છો તે જેવી, મોડલની આંતરિક ચેન-ઓફ-થોટની સંક્ષિપ્ત, કુદરતી ભાષાની સમરી જનરેટ કરી શકે છે. આથી ડેવલપર્સ માટે debug કરવું, audit કરવું અને વધુ સારાં end-user અનુભવો બનાવવું સરળ બને છે. Reasoning summaries કોઈ વધારાના ખર્ચ વિના ઉપલબ્ધ છે. વધુ જાણો(નવી વિન્ડોમાં ખૂલે છે).

Python

1
response = client.responses.create(
2
model="o4-mini",
3
tools=[
4
{
5
"type": "code_interpreter",
6
"container": {"type": "auto"}
7
}
8
],
9
instructions=(
10
"You are a personal math tutor. "
11
"When asked a math question, run code to answer the question."
12
),
13
input="I need to solve the equation `3x + 11 = 14`. Can you help me?",
14
reasoning={"summary": "auto"}
15
)

Python

1
response = client.responses.create(
2
model="o3",
3
input="Implement a simple web server in Rust from scratch.",
4
store=False,
5
include=["reasoning.encrypted_content"]
6
)

કિંમત અને ઉપલબ્ધતા

આ બધા ટૂલ્સ અને ફીચર્સ હવે Responses API માં ઉપલબ્ધ છે અને અમારી GPT‑4o સિરીઝ, GPT‑4.1 સિરીઝ અને અમારી OpenAI o-series રિઝનિંગ મોડલ્સ (o1, o3, o3‑mini, અને o4-mini) માં સપોર્ટેડ છે. ઇમેજ જનરેશન માત્ર અમારી રિઝનિંગ મોડલ સિરીઝના o3 પર જ સપોર્ટેડ છે. 

હાલના ટૂલ્સ માટેની કિંમતો સમાન રહે છે. ઇમેજ જનરેશનનો ખર્ચ $5.00/1M ટેક્સ્ટ ઇનપુટ ટોકન્સ, $10.00 / 1M ઇમેજ ઇનપુટ ટોકન્સ, અને $40.00 / 1M ઇમેજ આઉટપુટ ટોકન્સ છે, જેમાં cached input tokens પર 75% છૂટ છે. કોડ ઇન્ટરપ્રિટરનો ખર્ચ પ્રતિ container $0.03 છે. ફાઇલ સર્ચનો ખર્ચ પ્રતિ દિવસ vector storage માટે $0.10/GB અને 1k tool calls દીઠ $2.50 છે. રિમોટ MCP સર્વર ટૂલ કોલ કરવા માટે કોઈ વધારાનો ખર્ચ નથી. API ના આઉટપુટ ટોકન્સ માટે જ તમને બિલ કરવામાં આવે છે. અમારા docs માં કિંમત(નવી વિન્ડોમાં ખૂલે છે) વિશે વધુ જાણો. 

તમે શું બનાવો છો તે જોવા માટે અમે ઉત્સાહિત છીએ.