મુખ્ય વિષય-સામગ્રી પર જાવો
OpenAI

12 ફેબ્રુઆરી, 2026

પ્રોડક્ટરિલીઝકંપની

GPT‑5.3‑Codex‑Spark પરિચય

Codexમાં રીઅલ-ટાઇમ કોડિંગ માટેનું અતિ-ઝડપી મોડલ.

લોડિંગ…

આજે, અમે GPT‑5.3‑Codex‑Sparkનું સંશોધન પ્રિવ્યૂ રજૂ કરી રહ્યા છીએ, જે GPT‑5.3‑Codexનું નાનું સંસ્કરણ છે અને રીઅલ-ટાઇમ કોડિંગ માટે ખાસ ડિઝાઇન કરાયેલું અમારું પ્રથમ મોડલ છે. Codex-Spark, Cerebras સાથેની અમારી ભાગીદારીનો પ્રથમ માઇલસ્ટોન છે, જેને અમે જાન્યુઆરીમાં જાહેર કરી હતી. Codex-Sparkને અતિ-ઓછી લેટન્સી ધરાવતા હાર્ડવેર પર સર્વ કરતી વખતે લગભગ તરત પ્રતિભાવ આપે તે રીતે ઓપ્ટિમાઇઝ કરવામાં આવ્યું છે—અને વાસ્તવિક કોડિંગ કાર્યો માટે ઊંચી ક્ષમતા જાળવી રાખતાં પ્રતિ સેકંડ 1000થી વધુ ટોકન આપે છે.

અમે ChatGPT Pro વપરાશકર્તાઓ માટે Cerebras પર Codex-Sparkને સંશોધન પ્રિવ્યૂ તરીકે શેર કરી રહ્યા છીએ, જેથી ડેવલપર્સ વહેલી તકે પ્રયોગ શરૂ કરી શકે, જ્યારે અમે Cerebras સાથે મળીને ડેટાસેન્ટર ક્ષમતા વધારવા, એન્ડ-ટુ-એન્ડ વપરાશકર્તા અનુભવ વધુ મજબૂત બનાવવા અને અમારા મોટા અત્યાધુનિક મોડલોને ડિપ્લોય કરવાની કામગીરી કરીએ છીએ.

અમારા તાજેતરના અત્યાધુનિક મોડલોએ લાંબા સમય સુધી ચાલતાં કાર્યો કરવાની તેમની ક્ષમતામાં ખાસ મજબૂતી દર્શાવી છે, જેમાં કલાકો, દિવસો અથવા અઠવાડિયાં સુધી કોઈ હસ્તક્ષેપ વિના સ્વાયત્ત રીતે કામ કરવું સામેલ છે. Codex-Spark એ Codex સાથે રીઅલ-ટાઇમમાં કામ કરવા માટે ખાસ ડિઝાઇન કરાયેલું અમારું પ્રથમ મોડલ છે—લક્ષિત સંપાદનો કરવું, લોજિકને ફરી ગોઠવવું, અથવા ઇન્ટરફેસને સુધારવું અને તરત પરિણામ જોવું. Codex-Spark સાથે, Codex હવે લાંબા ગાળાના, મહત્ત્વાકાંક્ષી કાર્યો અને ક્ષણમાં કામ પૂરું કરવાનું બન્ને સપોર્ટ કરે છે. ડેવલપર્સ તેને કેવી રીતે ઉપયોગ કરે છે તેમાંથી શીખવાની અને અમે ઍક્સેસ વિસ્તૃત કરતા રહીએ તેમ પ્રતિસાદ સામેલ કરવાની અમારી આશા છે.

લૉન્ચ સમયે, Codex-Spark પાસે 128k કન્ટેક્સ્ટ વિન્ડો છે અને તે માત્ર ટેક્સ્ટ-આધારિત છે. સંશોધન પ્રિવ્યૂ દરમિયાન, Codex-Sparkની પોતાની રેટ લિમિટ્સ હશે અને તેનો ઉપયોગ સ્ટાન્ડર્ડ રેટ લિમિટ્સમાં ગણાશે નહીં. પરંતુ, માંગ ઊંચી હોય ત્યારે, બધા વપરાશકર્તાઓમાં વિશ્વસનીયતા જાળવવા માટે તમને મર્યાદિત ઍક્સેસ અથવા અસ્થાયી કતાર જોવા મળી શકે છે.

ઝડપ અને બુદ્ધિમત્તા

Codex-Sparkને ઇન્ટરેક્ટિવ કામ માટે ઓપ્ટિમાઇઝ કરવામાં આવ્યું છે, જ્યાં લેટન્સી એટલી જ મહત્વની છે જેટલી બુદ્ધિમત્તા. તમે મોડલ સાથે રીઅલ-ટાઇમમાં સહકાર આપી શકો છો, તે કામ કરે ત્યારે તેને રોકી અથવા નવી દિશા આપી શકો છો, અને લગભગ તરત પ્રતિસાદ સાથે ઝડપી પુનરાવર્તન કરી શકો છો. કારણ કે તે ઝડપ માટે ટ્યૂન કરાયેલું છે, Codex-Spark તેની ડિફૉલ્ટ કાર્યશૈલી હલકી રાખે છે: તે ઓછામાં ઓછા, લક્ષિત સંપાદનો કરે છે અને તમે કહો નહીં ત્યાં સુધી આપમેળે ટેસ્ટ ચલાવતું નથી.

કોડિંગ

Codex-Spark ઝડપી ઇન્ફરન્સ માટે ઓપ્ટિમાઇઝ કરાયેલું અત્યંત સક્ષમ નાનું મોડલ છે. SWE-Bench Pro અને Terminal-Bench 2.0 પર, જે એજન્ટ આધારિત સોફ્ટવેર એન્જિનિયરિંગ ક્ષમતાનું મૂલ્યાંકન કરતા બે બેન્ચમાર્ક છે, GPT‑5.3‑Codex‑Spark GPT‑5.3‑Codexની સરખામણીએ સમયના એક નાનાં ભાગમાં કાર્યો પૂર્ણ કરતાં મજબૂત પ્રદર્શન દર્શાવે છે.

અવધિનો અંદાજ (1) આઉટપુટ જનરેશન સમય (output tokens ÷ sampling speed), (2) પ્રીફિલ સમય (prefill tokens ÷ prefill speed), (3) કુલ ટૂલ એક્ઝિક્યુશન સમય, અને (4) કુલ નેટવર્ક ઓવરહેડના સરવાળાથી કરવામાં આવે છે.

બધા મોડલો માટે લેટન્સીમાં સુધારા

જ્યારે અમે Codex-Sparkને ટ્રેન કરી રહ્યા હતા, ત્યારે સ્પષ્ટ થયું કે રીઅલ-ટાઇમ સહકાર માટે મોડલની ઝડપ તો સમીકરણનો માત્ર એક ભાગ હતો—અમને સંપૂર્ણ રિક્વેસ્ટ-રિસ્પોન્સ પાઇપલાઇનમાં પણ લેટન્સી ઘટાડવાની જરૂર હતી. અમે અમારા harnessમાં એન્ડ-ટુ-એન્ડ લેટન્સી સુધારા અમલમાં મૂક્યા છે, જે બધા મોડલોને લાભ આપશે. અંદરના સ્તરે, અમે ક્લાયન્ટથી સર્વર અને પાછા પ્રતિભાવો કેવી રીતે સ્ટ્રીમ થાય છે તે સરળ બનાવ્યું, અમારા ઇન્ફરન્સ સ્ટેકના મુખ્ય ભાગોને ફરી લખ્યા, અને સેશન્સ કેવી રીતે શરૂ થાય છે તેને ફરી કાર્યરત કર્યું જેથી પ્રથમ દેખાતો ટોકન વહેલો દેખાય અને તમે પુનરાવર્તન કરો ત્યારે Codex પ્રતિસાદી રહે. સ્થાયી WebSocket કનેક્શનની શરૂઆત અને Responses APIની અંદર લક્ષિત ઓપ્ટિમાઇઝેશન્સ દ્વારા, અમે પ્રતિ ક્લાયન્ટ/સર્વર રાઉન્ડટ્રિપ ઓવરહેડમાં 80%, પ્રતિ-ટોકન ઓવરહેડમાં 30%, અને time-to-first-tokenમાં 50% ઘટાડો કર્યો. WebSocket પાથ Codex-Spark માટે ડિફૉલ્ટરૂપે સક્રિય છે અને ટૂંક સમયમાં બધા મોડલો માટે પણ ડિફૉલ્ટ બનશે.

Cerebras દ્વારા સંચાલિત

Codex-Spark Cerebrasના Wafer Scale Engine 3(નવી વિન્ડોમાં ખૂલે છે) પર ચાલે છે—ઉચ્ચ-ઝડપના ઇન્ફરન્સ માટે બનાવાયેલું હેતુનિષ્ઠ AI એક્સેલરેટર, જે Codexને latency-first સર્વિંગ ટિયર આપે છે. અમે Cerebras સાથે ભાગીદારી કરીને આ ઓછી-લેટન્સી માર્ગને અમારી બાકી ફલિટ જેવી જ પ્રોડક્શન સર્વિંગ સ્ટેકમાં ઉમેર્યો છે, જેથી તે Codexમાં નિરવાધિ રીતે કાર્ય કરે અને ભવિષ્યના મોડલોને સપોર્ટ કરવા માટે અમને તૈયાર કરે.

“GPT-5.3-Codex-Spark વિશે અમને સૌથી વધુ ઉત્સાહિત કરતી બાબત એ છે કે OpenAI અને ડેવલપર સમુદાય સાથે ભાગીદારી કરીને ઝડપી ઇન્ફરન્સ શું શક્ય બનાવે છે તે શોધવું—નવી ઇન્ટરૅક્શન પેટર્ન, નવા ઉપયોગકિસ્સાઓ અને મૂળભૂત રીતે જુદો મોડલ અનુભવ. આ પ્રિવ્યૂ તો માત્ર શરૂઆત છે.”
— Sean Lie, Cerebrasના CTO અને સહ-સ્થાપક

GPUs અમારા ટ્રેનિંગ અને ઇન્ફરન્સ પાઇપલાઇનમાં હજી પણ પાયાની ભૂમિકા ભજવે છે અને વ્યાપક ઉપયોગ માટે સૌથી કિફાયતી ટોકન્સ આપે છે. Cerebras આ પાયાને એવી વર્કફ્લોઝમાં ઉત્કૃષ્ટતા દ્વારા પૂરક બને છે, જેઓ અત્યંત ઓછી લેટન્સીની માંગ કરે છે, અને એન્ડ-ટુ-એન્ડ લૂપને વધુ કસોટીભર્યો બનાવે છે જેથી તમે પુનરાવર્તન કરો ત્યારે Codex વધુ પ્રતિસાદી લાગે. શ્રેષ્ઠ પ્રદર્શન મેળવવા માટે એક જ વર્કલોડમાં GPUs અને Cerebrasને સાથે પણ વાપરી શકાય છે.

ઉપલબ્ધતા અને વિગતો

Codex-Spark આજથી Codex એપ, CLI, અને VS Code એક્સ્ટેન્શનના તાજેતરના વર્ઝનોમાં ChatGPT Pro વપરાશકર્તાઓ માટે સંશોધન પ્રિવ્યૂ તરીકે રોલ આઉટ થઈ રહ્યું છે. કારણ કે તે વિશિષ્ટ ઓછી-લેટન્સી હાર્ડવેર પર ચાલે છે, તેનો ઉપયોગ અલગ રેટ લિમિટ હેઠળ નિયંત્રિત થાય છે, જે સંશોધન પ્રિવ્યૂ દરમિયાન માંગને આધારે સમાયોજિત થઈ શકે છે. ઉપરાંત, અમે Codex-Sparkને APIમાં ડિઝાઇન ભાગીદારોના નાનાં સમૂહ માટે ઉપલબ્ધ બનાવી રહ્યા છીએ, જેથી ડેવલપર્સ Codex-Sparkને તેમના ઉત્પાદનોમાં કેવી રીતે એકીકૃત કરવા માંગે છે તે સમજી શકાય. વાસ્તવિક વર્કલોડ હેઠળ અમારી ઇન્ટિગ્રેશનને વધુ ટ્યૂન કરતા રહીએ તેમ, અમે આવતા અઠવાડિયાઓમાં ઍક્સેસ વિસ્તૃત કરીશું.

Codex-Spark હાલમાં 128k કન્ટેક્સ્ટ વિન્ડો સાથે માત્ર ટેક્સ્ટ-આધારિત છે અને અતિ-ઝડપી મોડલોના કુટુંબમાં પહેલું છે. ડેવલપર સમુદાય સાથે મળીને અમે વધુ શીખીશું કે કોડિંગ માટે ઝડપી મોડલો ક્યાં શ્રેષ્ઠ પ્રદર્શન કરે છે, અને પછી અમે વધુ ક્ષમતાઓ રજૂ કરીશું–જેમાં મોટા મોડલો, લાંબી કન્ટેક્સ્ટ લંબાઈઓ અને મલ્ટીમોડલ ઇનપુટનો સમાવેશ થાય છે.

Codex-Sparkમાં અમારી મુખ્ય શ્રેણીના મોડલો જેવી જ સલામતી તાલીમ શામેલ છે, જેમાં સાયબર-સંબંધિત તાલીમ પણ સામેલ છે. અમે Codex-Sparkનું મૂલ્યાંકન અમારી સ્ટાન્ડર્ડ ડિપ્લોયમેન્ટ પ્રક્રિયાના ભાગરૂપે કર્યું, જેમાં સાયબર અને અન્ય ક્ષમતાઓ માટેના બેઝલાઇન મૂલ્યાંકન સામેલ છે, અને નિર્ધારિત કર્યું કે તેમાં સાયબરસિક્યુરિટી અથવા બાયોલોજીમાં ઊંચી ક્ષમતા માટે અમારા પ્રિપેરડનેસ ફ્રેમવર્ક થ્રેશોલ્ડ સુધી પહોંચવાની વાજબી સંભાવના નથી.

આગળ શું

Codex-Spark એ બે પૂરક મોડ્સ ધરાવતા Codex તરફનું પ્રથમ પગલું છે: લાંબા ગાળાનું রিজনিং અને એક્ઝિક્યુશન, અને ઝડપી પુનરાવર્તન માટે રીઅલ-ટાઇમ સહકાર. સમય જતાં, આ મોડ્સ ભળી જશે—Codex તમને ઘનિષ્ઠ ઇન્ટરેક્ટિવ લૂપમાં રાખી શકે છે જ્યારે પૃષ્ઠભૂમિમાં લાંબા સમય ચાલતું કામ સબ-એજન્ટ્સને સોંપે, અથવા જ્યારે તમને વ્યાપકતા અને ઝડપ જોઈએ ત્યારે અનેક મોડલોને સમાંતર કાર્યો સોંપે, જેથી તમને શરૂઆતમાં જ કોઈ એક મોડ પસંદ કરવાની જરૂર ન પડે.

જેમ જેમ મોડલો વધુ સક્ષમ બનશે, તેમ ઇન્ટરૅક્શનની ઝડપ સ્પષ્ટ બોટલનેક બની જાય છે. અતિ-ઝડપી ઇન્ફરન્સ આ લૂપને વધુ કસોટીભર્યો બનાવે છે, Codexને ઉપયોગમાં વધુ સ્વાભાવિક બનાવે છે અને કોઈપણ વ્યક્તિ માટે વિચારને કાર્યરત સોફ્ટવેરમાં ફેરવવાની શક્યતાઓ વિસ્તારે છે.

લેખક

OpenAI