Dedejinta qulqulka shaqo ee wakiilada leh iyadoo la adeegsanayo WebSockets ee Responses API
Waxaa qoray Brian Yu iyo Ashwin Nathan, xubno ka tirsan Shaqaalaha Farsamada
Markaad Codex weydiisato inuu hagaajiyo cilad, wuxuu baaraa saldhiggaaga koodka si uu u helo faylasha khuseeya, wuu akhriyaa si uu macnaha u dhiso, wax ka beddel buu sameeyaa, dabadeedna wuxuu socodsiiyaa tijaabooyin si uu u xaqiijiyo in hagaajintu shaqeysay. Gudaha nidaamka, taasi waxay ka dhigan tahay daraasiin codsiyo Responses API ah oo is-daba-joog ah: go'aami tallaabada xigta ee nooca, ku socodsii qalab kombiyuutarkaaga, ku celi wax-soo-saarka qalabka API-ga, oo ku celi.
Dhammaan codsiyadan waxay isu geyn karaan daqiiqado ay isticmaalayaashu sugaan inta Codex uu dhammeystirayo hawlo adag. Marka laga eego daahitaanka, wareegga wakiilka Codex waqtigiisa intiisa badan wuxuu ku qaataa saddex marxaladood oo waaweyn: ka shaqeynta adeegyada API-ga (si loo ansixiyo loona farsameeyo codsiyada), inferens-ka nooca, iyo waqtiga dhinaca macmiilka (socodsiinta qalabka iyo dhisidda macnaha nooca). Inferens-ku waa marxaladda uu noocku ku shaqeeyo GPU-yada si uu u soo saaro token-yo cusub. Waagii hore, socodsiinta inferens-ka LLM (Qaabka Luuqadda Ballaaran) ee GPU-yada ayaa ahayd qaybta ugu gaabiska badan ee wareegga wakiilada leh, sidaas darteed culayska adeegga API-ga way sahlaneyd in la qariyo. Marka inferens-ku uu sii dedejiyo, culayska API-ga ee isu-geynta ah ee ka yimaadda hawlgal wakiil leh aad buu u muuqdaa.
Qoraalkan, waxaan ku sharxi doonaa sida aan uga dhignay wareegyada wakiilka ee isticmaalaya API-ga inay 40% uga dheereeyaan dhammaad-ilaa-dhammaad, taasoo u saamaxaysa isticmaalayaasha inay dareemaan boodada xawaaraha inferens-ka ee ka timid 65 una dhow 1,000 token ilbiriqsikii. Waxaan tan ugu wajahnnay kaydin, baabi'inta boodboodyada shabakadeed ee aan loo baahnayn, hagaajinta stack-gayaga badbaadada si si degdeg ah loogu calaamadiyo arrimaha, iyo—tan ugu muhiimsan—dhisidda hab lagu abuuro xiriir joogto ah oo lala yeesho Responses API, halkii laga samayn lahaa taxane wicitaanno API oo is-waafaqsan.

Gudaha Responses API, qaababkii ugu waaweynaa ee hore sida GPT‑5 iyo GPT‑5.2 waxay ku socdeen qiyaastii 65 token ilbiriqsikii (TPS). Soo saaristii GPT‑5.3‑Codex‑Spark, oo ah nooc kood-gareyn degdeg ah, yoolkeennu wuxuu ahaa xawaare toban-jibbaar ka badan: in ka badan 1,000 TPS, taas oo ay suuragelisay qalab khaas ah oo Cerebras ah oo loo habeeyey inferens-ka LLM (Qaabka Luuqadda Ballaaran). Si aan u hubinno in isticmaalayaashu ay dareemi karaan xawaaraha dhabta ah ee noocan cusub, waa inaan yaraynaa culayska API-ga.
Qiyaastii Noofambar 2025, waxaan billownay dadaal degdeg ah oo waxqabad ah oo ku saabsan Responses API, annagoo hirgelinay hagaajinno badan oo ku wajahan daahitaanka dariiqa muhiimka ah ee codsi keliya:
- Ku kaydinta token-yada la rendereeyay iyo habaynta nooca xusuusta gudaheeda si looga boodo yaryareynta token-ka ee qaali ah iyo wicitaannada shabakadda ee jawaabaha dhowr-wareeg ah
- Yaraynta daahitaanka boodboodka shabakadda annagoo meesha ka saarnay wicitaannada adeegyada dhexe (tusaale ahaan, xalinta habaynta sawirka) oo si toos ah ugu yeernay adeegga inferens-ka laftiisa
- Hagaajinta stack-gayaga badbaadada si aan si dhakhso leh ugu socodsiin karno qaar ka mid ah kala-soocayaasha si ay u calaamadiyaan wada sheekaysiyada
Hagaajinnadan, waxaan aragnay ku dhowaad 45% horumar ah waqtiga token-ka ugu horreeya (TTFT)—taas oo ka tarjumaysa sida API-gu uga jawaab-celin badan yahay—laakiin hagaajinnadani weli kuma filnayn GPT‑5.3‑Codex‑Spark. Xitaa iyadoo hagaajinnadan la sameeyay, culayska Responses API aad buu u weynaa marka loo eego xawaaraha nooca—taas oo ah, isticmaalayaashu waa inay sugaan CPU-yada wada API-gayaga ka hor intaysan isticmaalin GPU-yada u adeega nooca.
Dhibaatada qoto dheer waxay ahayd qaab-dhismeed: waxaan ula dhaqannay codsi kasta oo Codex ah inuu madax-bannaan yahay, annagoo farsamayna xaaladda wada sheekaysiga iyo macnaha kale ee dib loo adeegsan karo codsi kasta oo daba socda. Xitaa marka inta badan wada sheekaysigu aanu is beddelin, haddana waxaan bixinaynay shaqo ku xiran taariikhda oo dhan. Markii wada sheekaysiyadu dheeraadeen, farsamayntaas soo noqnoqota way sii qaaliyoobaysay.
Si aan u adkeynno naqshadda, waxaan dib uga fikirnay borotokoolka gudbinta: ma haysan karnaa xiriir joogto ah oo ma kaydin karnaa xaalad, halkii aan mar kasta ka samayn lahayn xiriir cusub oo HTTP ah oo aan u diri lahayn taariikhda wada sheekaysiga oo dhan codsi kasta oo daba socda? Fikradda waxay ahayd in la diro oo keliya xog kasta oo cusub oo u baahan ansixin iyo farsamayn, laguna kaydiyo xaaladda dib loo adeegsan karo xusuusta muddada uu xiriirku jiro. Tani waxay yarayn lahayd culayska ka imanaya shaqada soo noqnoqota.
Waxaan tixgelinnay dhowr hab oo kala duwan, oo ay ku jiraan WebSockets iyo qulqulka laba-geesoodka ah ee gRPC. Waxaan ku dambaynay WebSockets sababtoo ah maadaama uu yahay borotokool gudbin fariin oo fudud, isticmaalayaashu uma baahnaan lahaayeen inay beddelaan qaababka gelinta iyo soo saarista ee Responses API. Wuxuu ahaa mid saaxiibtinimo u leh horumariyeyaasha, wuxuuna si fiican ugu habboonaa naqshaddeenna jirta iyadoo qas yar la gelinayo.
Tijaabadii ugu horreysay ee WebSocket waxay beddeshay waxa aan u malaynaynay inuu suurtagal ka yahay daahitaanka Responses API. Injineer ka tirsan kooxda Codex oo aqoon qoto dheer u lahaa dhammaan stack-ga API-ga ayaa isu geeyay tijaabo isagoo habeen dhan socodsiinaya wakiil Codex ah.
Tijaabadaas, hawlgallada wakiilada leh waxaa loo qaabeeyey inay yihiin hal Response oo dheer oo socda. Iyadoo la adeegsanayo astaamaha asyncio, Responses API wuxuu si asynchronous ah ugu hakaday wareegga sampling-ka ka dib marka la sample gareeyo wicitaan qalab, kadibna Responses API wuxuu dib ugu diray dhacdo response.done macmiilka. Ka dib fulinta wicitaanka qalabka, macaamiishu waxay dib u diri jireen dhacdo response.append oo wata natiijada qalabka, taas oo ka saartay hakadka wareegga sampling-ka una saamaxday nooca inuu sii wado.
Tusaale ahaan halkan waa in wicitaanka qalabka maxalliga ah loola dhaqmo sida wicitaan qalab oo la martigeliyey. Marka noocku waco raadinta webka, wareegga inferens-ku wuu hakadaa, wuxuu wacaa adeeg raadinta web ah, wuxuuna jawaabta adeegga geliyaa macnaha nooca. Naqshaddeenna, sidaas oo kale ayaan sameynay; laakiin halkii aan ka wici lahayn adeeg fog, waxaan dib ugu dirnay wicitaanka qalabka ee nooca macmiilka anagoo adeegsanayna WebSocket. Marka macmiilku ka jawaabo, waxaan gelinay jawaabta wicitaanka qalabka ee macmiilka macnaha, dabadeedna sampling-kii ayaan sii wadnay.
Naqshaddani aad bay waxtar u lahayd sababtoo ah waxay meesha ka saartay shaqadii API-ga ee soo noqnoqotay inta lagu jiray hawlgalka wakiilka. Waxaan qaban karnay shaqada ka hor inferens-ka hal mar, waxaan u hakad gelin karnay fulinta qalabka, kadibna waxaan qaban karnay shaqada ka dib inferens-ka hal mar dhammaadka.
Nasiib darro, tani waxay ku timid kharash ah qaab API oo aan sidaas loo aqoon oo ka sii adag. Waxaan rabnay in horumariyeyaashu awoodaan inay si fudud ugu daraan taageerada WebSocket iyagoon dib u qorin isdhexgalka API-gooda ku dhisan hab isdhexgal cusub.
Nooca aan sii deynay, waxaan dib ugu laabannay qaab la yaqaan: sii wad isticmaalka response.create oo leh isla body-ga, oo isticmaal previous_response_id si loo sii wado macnaha wada sheekaysiga laga bilaabo xaaladda jawaabtii hore.
Xiriirka WebSocket, server-ku wuxuu hayaa kayd xusuuseed oo ku xaddidan xiriirka oo ka kooban xaaladdii jawaabihii hore. Marka response.create daba socda uu ku jiro previous_response_id, waxaan ka soo qaadannaa xaaladdaas kaydka halkii aan dib uga dhisi lahayn wada sheekaysiga oo dhan bilowga.
Xaaladdaas la kaydiyey waxaa ka mid ah:
- Sheyga
responseee hore - Waxyaabihii gelinta iyo soo saarista ee hore
- Qeexitaannada qalabka iyo namespaces
- Alaabta sampling-ka ee dib loo adeegsan karo, sida token-yadii hore loo rendereeyay

Iyadoo dib loo adeegsanayo xaaladdii jawaabtii hore ee xusuusta ku jirtay, waxaan awoodnay inaan hirgelinno dhowr hagaajin oo waaweyn:
- Ka dhigista qaar ka mid ah kala-soocayaashayada badbaadada iyo ansixiyeyaasha codsiyada inay farsameeyaan oo keliya gelinta cusub, halkii ay mar kasta ka farsamayn lahaayeen taariikhda oo dhan
- Haynta kayd xusuuseed oo token-yada la rendereeyay ah oo aan ku darno si aan uga boodno yaryareynta token-ka aan loo baahnayn
- Dib u adeegsiga habkeenna guuleysta ee xallinta/jiheynta nooca ee codsiyada oo dhan
- Is dulsaarka shaqada ka dib inferens-ka ee aan xannibnayn sida biil-gareynta iyo codsiyada xiga
Yoolku wuxuu ahaa inaan sida ugu dhow ee suurtogalka ah ugu dhowaanno tijaabadii culayska ugu yar lahayd balse leh qaab API ah oo horumariyeyaashu hore u fahmeen uguna dhiseen.
Ka dib dadaal laba bilood ah oo lagu dhisayay habka WebSocket, waxaan bilownay alpha aan la yeelannay shirkado bilow ah oo muhiim ah oo sameeya wakiillo kood-gareyn si ay ugu dhex daraan kaabayaashooda una kordhiyaan taraafikada si ammaan ah. Isticmaalayaashii alpha aad bay u jeclaadeen, iyagoo sheegay illaa 40% horumar(ku furmaa daaqad cusub) oo ku yimid qulqulka shaqadooda wakiilada leh. Marka la eego jawaab-celinta togan ee alpha, waxaan diyaar u ahayn inaan sii deyno.
Natiijooyinka sii dayntu waxay ahaayeen kuwo degdeg ah. Codex si dhakhso leh ayuu ugu wareejiyay inta badan taraafikadiisa Responses API habka WebSocket, isagoo arkay horumar weyn oo daahitaan ah. GPT‑5.3‑Codex‑Spark, waxaan gaarnay bartilmaameedkeennii 1,000 TPS, waxaanan aragnay qaraxyo gaaraya 4,000 TPS, taasoo muujinaysa in Responses API uu la jaanqaadi karo inferens aad uga dheereeya taraafikada wax-soo-saarka dhabta ah. Saameyntu si dhakhso leh ayay uga muuqatay bulshadii horumariyeyaasha sidoo kale:
- Codex si degdeg ah ayuu inta badan taraafikadiisa ugu wareejiyay WebSockets. Isticmaalayaasha Codex ee ku shaqeeya noocyadii ugu dambeeyay sida GPT‑5.3‑Codex(ku furmaa daaqad cusub), GPT‑5.4(ku furmaa daaqad cusub), iyo wixii ka dambeeya dhammaantood waxay ka faa'iidaystaan dedejinta habka WebSocket.
- Vercel waxay ku dartay habka WebSocket gudaha AI SDK waxayna aragtay daahitaanka oo hoos u dhacay illaa 40%(ku furmaa daaqad cusub).
- Qulqulka shaqo ee faylal badan ee Cline waa 39% ka dheereeya(ku furmaa daaqad cusub).
- Noocyada OpenAI ee Cursor waxay noqdeen illaa 30% ka dheereeya(ku furmaa daaqad cusub).
Habka WebSocket waa mid ka mid ah awoodaha cusub ee ugu muhiimsan ee Responses API tan iyo markii la bilaabay Maarso 2025. Waxaan ka tagnay fikrad una gudubnay socodsiin wax-soo-saar ah dhowr toddobaad gudahood iyadoo ay jirto iskaashi dhow oo u dhexeeya kooxaha API iyo Codex ee OpenAI. Kaliya ma wanaajiso si weyn daahitaanka hawlgalka wakiilka, balse waxay sidoo kale taageertaa baahi sii kordheysa oo ay leeyihiin dhiseyaashu: marka inferens-ka noocku sii dedejiyo, adeegyada iyo nidaamyada ku wareegsan inferens-ka sidoo kale waa inay dedejiyaan si faa'iidooyinkan loogu gudbiyo isticmaalayaasha.
Qorayaal
Brian Yu, Ashwin Nathan
Mahadcelin
Mahadcelin gaar ah ayaa leh kooxaha Responses API iyo Codex, kuwaas oo ka shaqeeyay abuurista habka WebSocket.


