ഇന്ന്, ഞങ്ങൾ GPT‑5.3‑Codex‑Spark എന്ന GPT‑5.3‑Codex ന്റെ ചെറിയ പതിപ്പിന്റെയും, തത്സമയ കോഡിംഗിനായി രൂപകൽപ്പന ചെയ്ത ഞങ്ങളുടെ ആദ്യ മോഡലിന്റെയും ഒരു ഗവേഷണ പ്രിവ്യൂ പുറത്തിറക്കുന്നു. Codex-Spark വളരെ വേഗത്തിലുള്ള അനുഭവം നൽകുന്ന രീതിയിലാണ് ഒപ്റ്റിമൈസ് ചെയ്തിരിക്കുന്നത്—യഥാർത്ഥ കോഡിംഗ് ടാസ്കുകൾ കൃത്യമായി ചെയ്യാനുള്ള കഴിവ് നിലനിർത്തിക്കൊണ്ടുതന്നെ, പതിനഞ്ചിരട്ടിയോളം വേഗതയേറിയ ജനറേഷൻ വേഗത ഇത് നൽകുന്നു.
Codex-Spark ജനുവരിയിൽ ഞങ്ങൾ പ്രഖ്യാപിച്ച Cerebras-ഉം തമ്മിലുള്ള പങ്കാളിത്തത്തിലെ ആദ്യ നാഴികക്കല്ലാണ്. ഡെവലപ്പർമാർക്ക് നേരത്തെ തന്നെ പരീക്ഷണങ്ങൾ ആരംഭിക്കുന്നതിനായി ഞങ്ങൾ Codex-Spark-നെ ഒരു ഗവേഷണ പ്രിവ്യൂ ആയി ChatGPT Pro ഉപയോക്താക്കൾക്ക് ലഭ്യമാക്കുന്നു, അതേസമയം തന്നെ ഡാറ്റാസെന്റർ ശേഷി വർദ്ധിപ്പിക്കുന്നതിനും, എൻഡ്-ടു-എൻഡ് അനുഭവം കൂടുതൽ മികച്ചതാക്കുന്നതിനും, ഞങ്ങളുടെ വലിയ അത്യാധുനിക മോഡൽ വിന്യസിക്കുന്നതിനുമായി ഞങ്ങൾ Cerebras-മായി ചേർന്ന് പ്രവർത്തിച്ചു വരികയാണ്.
ഞങ്ങളുടെ ഏറ്റവും പുതിയ അത്യാധുനിക മോഡലുകൾ ദീർഘനേരം നീണ്ടുനിൽക്കുന്ന ജോലികൾ ചെയ്യുന്നതിൽ പ്രത്യേക മികവ് തെളിയിച്ചിട്ടുണ്ട്, മണിക്കൂറുകളോ ദിവസങ്ങളോ ആഴ്ചകളോ പോലും പുറത്തുനിന്നുള്ള ഇടപെടലുകൾ ഇല്ലാതെ പ്രവർത്തിക്കുന്നു. Codex-നൊപ്പം തത്സമയം പ്രവർത്തിക്കുന്നതിനായി രൂപകൽപ്പന ചെയ്ത ഞങ്ങളുടെ ആദ്യത്തെ മോഡലാണ് Codex-Spark—കൃത്യമായ മാറ്റങ്ങൾ വരുത്താനും, ലോജിക് പുനഃക്രമീകരിക്കാനും, ഇന്റർഫേസുകൾ പരിഷ്കരിക്കാനും അതിന്റെ ഫലങ്ങൾ ഉടനടി കാണാനും ഇത് നിങ്ങളെ സഹായിക്കുന്നു. Codex-Spark ഉപയോഗിച്ച്, ദീർഘകാലം നീണ്ടുനിൽക്കുന്ന വലിയ ടാസ്കുകളും അതേസമയം ഉടൻ തന്നെ ജോലികൾ പൂർത്തിയാക്കുന്നതും Codex ഫാമിലി ഇപ്പോൾ പിന്തുണ നൽകുന്നു. ഡെവലപ്പർമാർ ഇത് എങ്ങനെ ഉപയോഗിക്കുന്നുവെന്ന് പഠിക്കുകയും, ആക്സസ് വിപുലീകരിക്കുമ്പോൾ ഫീഡ്ബാക്ക് ഉൾപ്പെടുത്തുകയും ചെയ്യുമെന്ന് ഞങ്ങൾ പ്രതീക്ഷിക്കുന്നു.
ലോഞ്ച് സമയത്ത്, Codex-Spark-ന് 128k കോൺടെക്സ്റ്റ് വിൻഡോ ഉണ്ട്, കൂടാതെ ഇത് ടെക്സ്റ്റ്-മാത്രമാണ്. ഗവേഷണ പ്രിവ്യൂ സമയത്ത്, Codex-Spark-ന് അതിന്റേതായ നിരക്ക് പരിധികൾ ഉണ്ടായിരിക്കും, കൂടാതെ ഉപയോഗം സ്റ്റാൻഡേർഡ് നിരക്ക് പരിധികളിൽ ഉൾപ്പെടില്ല. എന്നിരുന്നാലും, ആവശ്യകത ഉയർന്നിരിക്കുമ്പോൾ, ഉപയോക്താക്കളിൽ വിശ്വാസ്യത നിലനിർത്തുന്നതിനായി, നിങ്ങൾക്ക് മന്ദഗതിയിലുള്ള ആക്സസ് അല്ലെങ്കിൽ താൽക്കാലിക ക്യൂയിംഗ് അനുഭവപ്പെടാം.
ബുദ്ധിശക്തിയോടൊപ്പം തന്നെ പ്രവർത്തന വേഗതയ്ക്കും പ്രാധാന്യമുള്ള ഇന്ററാക്ടീവ് ജോലികൾക്കായി Codex-Spark ഒപ്റ്റിമൈസ് ചെയ്തിരിക്കുന്നു. നിങ്ങൾക്ക് ഒരു തത്സമയ സഹപ്രവർത്തകനോടെന്നപോലെ ഈ മോഡലുമായി ചേർന്ന് പ്രവർത്തിക്കാം—അത് പ്രവർത്തിക്കുന്നതിനിടെ തന്നെ തടസ്സപ്പെടുത്താനോ ദിശ മാറ്റാനോ സാധിക്കും, കൂടാതെ, ഓരോ ഘട്ടവും പൂർത്തിയാകാൻ കാത്തുനിൽക്കാതെ തന്നെ വളരെ വേഗത്തിൽ മാറ്റങ്ങൾ വരുത്തി പരീക്ഷിക്കാനും കഴിയും. വേഗതയ്ക്കായി ട്യൂൺ ചെയ്തതിനാൽ, Codex-Spark അതിന്റെ ഡിഫോൾട്ട് പ്രവർത്തന ശൈലി ലഘുവായി നിലനിർത്തുന്നു: ഇത് കുറഞ്ഞതും ലക്ഷ്യബദ്ധവുമായ തിരുത്തലുകൾ മാത്രമേ ചെയ്യൂ, കൂടാതെ നിങ്ങൾ ആവശ്യപ്പെടുന്നില്ലെങ്കിൽ സ്വയം ടെസ്റ്റുകൾ പ്രവർത്തിപ്പിക്കില്ല.
Codex-Spark വേഗത്തിലുള്ള ഇൻഫറൻസിനായി ഒപ്റ്റിമൈസ് ചെയ്ത, വളരെ കഴിവുള്ള ചെറിയ മോഡലാണ്. SWE-Bench Pro-ലും Terminal-Bench 2.0-ലും, ഏജന്റിക് സോഫ്റ്റ്വെയർ എഞ്ചിനീയറിംഗ് ശേഷി വിലയിരുത്തുന്ന രണ്ട് ബെഞ്ച്മാർക്കുകളിൽ, GPT‑5.3‑Codex‑Spark GPT‑5.3‑Codex‑നെക്കാൾ മോശം പ്രകടനം കാഴ്ചവെക്കുന്നു, പക്ഷേ ടാസ്ക് വളരെ കുറച്ച് സമയത്തിനുള്ളിൽ പൂർത്തിയാക്കാൻ കഴിയും.
ദൈർഘ്യം (1) ഔട്ട്പുട്ട് സൃഷ്ടിക്കൽ സമയം (ടോക്കണുകൾ ÷ സാമ്പ്ലിംഗ് വേഗം), (2) പ്രീഫിൽ സമയം (ടോക്കണുകൾ ÷ പ്രീഫിൽ വേഗം), (3) മൊത്തം ടൂൾ നിർവഹണ സമയം, (4) മൊത്തം നെറ്റ്വർക്ക് ഓവർഹെഡ് എന്നിവയുടെ ആകെ തുകയായി കണക്കാക്കുന്നു.
Codex-Spark-നെ പരിശീലിപ്പിക്കുമ്പോൾ, തത്സമയ സഹകരണത്തിന് മോഡലിന്റെ വേഗത മാത്രം പോരാ എന്ന് വ്യക്തമായി—പൂർണ്ണ അഭ്യർത്ഥന-പ്രതികരണ പൈപ്പ്ലൈനിലും ലേറ്റൻസി കുറയ്ക്കേണ്ടതുണ്ടെന്ന് ഞങ്ങൾ തിരിച്ചറിഞ്ഞു. ഞങ്ങൾ എല്ലാ മോഡലുകൾക്കും പ്രയോജനം ചെയ്യുന്ന എൻഡ്-ടു-എൻഡ് ലേറ്റൻസി മെച്ചപ്പെടുത്തലുകൾ ഞങ്ങളുടെ ഹാർനെസിൽ നടപ്പിലാക്കി. അകത്ത്, ഞങ്ങൾ ക്ലയന്റിൽ നിന്ന് സെർവറിലേക്കും തിരിച്ചും പ്രതികരണങ്ങൾ സ്ട്രീം ചെയ്യുന്നത് ലളിതമാക്കി, ഇൻഫറൻസ് സ്റ്റാക്കിലെ പ്രധാന ഘടകങ്ങൾ പുനഃരചിച്ചു, സെഷനുകൾ ആരംഭിക്കുന്ന രീതി പുനഃക്രമീകരിച്ചു; ഇതുവഴി ആദ്യ ദൃശ്യമാകുന്ന ടോക്കൺ വേഗത്തിൽ പ്രത്യക്ഷപ്പെടുകയും, നിങ്ങൾ ആവർത്തിച്ച് പ്രവർത്തിക്കുമ്പോൾ Codex പ്രതികരണക്ഷമമായി തുടരുകയും ചെയ്യുന്നു. സ്ഥിരമായ WebSocket കണക്ഷൻ അവതരിപ്പിക്കുകയും Responses API-യുടെ ഉള്ളിലെ ലക്ഷ്യബദ്ധമായ ഒപ്റ്റിമൈസേഷനുകൾ നടപ്പാക്കുകയും ചെയ്തതിലൂടെ, ഓരോ ക്ലയന്റ്/സെർവർ റൗണ്ട്ട്രിപ്പിനുള്ള ഓവർഹെഡ് 80% കുറച്ചു, ഓരോ ടോക്കണിനുള്ള ഓവർഹെഡ് 30% കുറച്ചു, കൂടാതെ ആദ്യ ടോക്കണിലെത്താനുള്ള സമയം 50% കുറച്ചു. നിങ്ങൾ ഏത് മോഡൽ തിരഞ്ഞെടുക്കുകയാണെങ്കിലും, മുഴുവൻ Codex അനുഭവത്തിലുടനീളം നിങ്ങൾക്ക് കൂടുതൽ കെട്ടുറപ്പുള്ള ഒരു ലൂപ്പ് അനുഭവപ്പെടും.
Cerebras-ന്റെ വേഫർ സ്കെയിൽ എഞ്ചിൻ 3(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു)-ലാണ് Codex-Spark പ്രവർത്തിക്കുന്നത്—ഉയർന്ന വേഗതയുള്ള ഇൻഫറൻസിനായി പ്രത്യേകമായി നിർമ്മിച്ച AI ആക്സിലറേറ്റർ, Codex-ന് വേഗതയ്ക്ക് മുൻഗണന നൽകുന്ന ഒരു സർവിംഗ് ടയർ നൽകുന്നു. ഞങ്ങൾ Cerebras-യുമായി സഹകരിച്ച്, ഞങ്ങളുടെ ഫ്ലീറ്റിലെ ബാക്കിയുള്ളവയുടേതുപോലെ അതേ പ്രൊഡക്ഷൻ സർവിംഗ് സ്റ്റാക്കിലേക്ക് ഈ കുറഞ്ഞ-ലേറ്റൻസി പാത ചേർത്തു, അതിനാൽ ഇത് Codex-ലുടനീളം തടസ്സമില്ലാതെ പ്രവർത്തിക്കുകയും ഭാവിയിലെ മോഡലുകൾക്ക് പിന്തുണ നൽകാൻ ഞങ്ങളെ സജ്ജമാക്കുകയും ചെയ്യുന്നു.
“GPT-5.3-Codex-Spark എന്നതിനെക്കുറിച്ച് ഞങ്ങളെ ഏറ്റവും ആവേശപ്പെടുത്തുന്നത് OpenAIയുമായും ഡെവലപ്പർ കമ്മ്യൂണിറ്റിയുമായും ചേർന്ന് വേഗത്തിലുള്ള ഇൻഫറൻസ് എന്തെല്ലാം സാധ്യമാക്കുമെന്ന് കണ്ടെത്തുന്നതാണ്—പുതിയ ഇടപെടൽ മാതൃകകൾ, പുതിയ ഉപയോഗ കേസുകൾ, കൂടാതെ അടിസ്ഥാനപരമായി വ്യത്യസ്തമായ ഒരു മോഡൽ അനുഭവം.” ഈ പ്രിവ്യൂ വെറും തുടക്കം മാത്രമാണ്.
GPU-കൾ ഞങ്ങളുടെ ട്രെയിനിംഗ്, ഇൻഫറൻസ് പൈപ്പ്ലൈനുകളിൽ അടിസ്ഥാനപരമായി തുടരുന്നു, വ്യാപകമായ ഉപയോഗത്തിനായി ഏറ്റവും ചെലവ്-കാര്യക്ഷമമായ ടോക്കണുകൾ നൽകുന്നു. വളരെ കുറഞ്ഞ ലാറ്റൻസി ആവശ്യമുള്ള വർക്ക്ഫ്ലോകളിൽ മികവ് പുലർത്തിക്കൊണ്ട് Cerebras ആ അടിത്തറയെ കൂടുതൽ പൂർണ്ണമാക്കുന്നു; ഇത് എൻഡ്-ടു-എൻഡ് പ്രക്രിയയെ വേഗത്തിലാക്കുകയും, നിങ്ങൾ ഓരോ മാറ്റങ്ങൾ വരുത്തുമ്പോഴും Codex കൂടുതൽ പ്രതികരണക്ഷമമായി തോന്നുന്നു.
Codex-Spark ഇന്ന് ഏറ്റവും പുതിയ Codex ആപ്പ്, CLI, VS Code എക്സ്റ്റൻഷൻ പതിപ്പുകളിൽ എല്ലാ ChatGPT Pro ഉപയോക്താക്കൾക്കായി ഒരു ഗവേഷണ പ്രിവ്യൂ ആയി ലോഞ്ച് ചെയ്യുന്നു. ഇത് പ്രത്യേക കുറഞ്ഞ ലേറ്റൻസി ഹാർഡ്വെയറിൽ പ്രവർത്തിക്കുന്നതിനാൽ, ഉപയോഗം ഒരു വേറിട്ട നിരക്ക് പരിധിയാൽ നിയന്ത്രിക്കപ്പെടുന്നു, ഗവേഷണ പ്രിവ്യൂ സമയത്ത് ആവശ്യകതയെ അടിസ്ഥാനമാക്കി അത് ക്രമീകരിക്കപ്പെടാം. കൂടാതെ, ഡെവലപ്പർമാർ Codex-Spark-നെ അവരുടെ ഉൽപ്പന്നങ്ങളിലേക്ക് എങ്ങനെ ഉൾപ്പെടുത്താൻ ആഗ്രഹിക്കുന്നു എന്ന് മനസ്സിലാക്കുന്നതിനായി, കുറച്ച് ഡിസൈൻ പങ്കാളികൾക്കായി API-ൽ Codex-Spark-നെ ഞങ്ങൾ ലഭ്യമാക്കുന്നു. ഞങ്ങൾ യഥാർത്ഥ പ്രവർത്തനഭാരങ്ങൾക്കു കീഴിൽ ഞങ്ങളുടെ ഇന്റഗ്രേഷൻ തുടർന്നും ട്യൂൺ ചെയ്യുന്നതിനാൽ, വരും ആഴ്ചകളിൽ ആക്സസ് വിപുലീകരിക്കും.
Codex-Spark നിലവിൽ 128k കോൺടെക്സ്റ്റ് വിൻഡോയുള്ള ടെക്സ്റ്റ്-മാത്രം മോഡലാണ്, അതിവേഗ മോഡലുകളുടെ ശ്രേണിയിലെ ആദ്യത്തേതാണിത്. ഡെവലപ്പർ കമ്മ്യൂണിറ്റിയുമായി ചേർന്ന് കോഡിംഗിനായി വേഗത്തിലുള്ള മോഡലുകൾ എവിടെയാണ് മികച്ചതായി പ്രവർത്തിക്കുന്നത് എന്നതിനെക്കുറിച്ച് ഞങ്ങൾ കൂടുതൽ പഠിക്കുമ്പോൾ, വലിയ മോഡലുകൾ, ദൈർഘ്യമേറിയ കോൺടെക്സ്റ്റ് ദൈർഘ്യങ്ങൾ, മൾട്ടിമോഡൽ ഇൻപുട്ട് എന്നിവ ഉൾപ്പെടെ കൂടുതൽ കഴിവുകൾ ഞങ്ങൾ അവതരിപ്പിക്കും.
Codex-Spark ഞങ്ങളുടെ പ്രധാന മോഡലുകളിലെ പോലെ, സൈബർ-പ്രസക്തമായ പരിശീലനം ഉൾപ്പെടെ, അതേ സുരക്ഷാ പരിശീലനം ഉൾക്കൊള്ളുന്നു. ഞങ്ങളുടെ സ്റ്റാൻഡേർഡ് വിന്യാസ പ്രക്രിയയുടെ ഭാഗമായി ഞങ്ങൾ Codex-Spark-നെ വിലയിരുത്തി, അതിൽ സൈബർസുരക്ഷയും മറ്റ് കഴിവുകളും സംബന്ധിച്ച അടിസ്ഥാന വിലയിരുത്തലുകൾ ഉൾപ്പെടുന്നു. സൈബർസുരക്ഷയിൽ ഉയർന്ന ശേഷിക്കായി ഞങ്ങളുടെ പ്രിപെയർഡ്നസ് ഫ്രെയിംവർക്ക് പരിധി കൈവരിക്കാൻ ഇതിന് യുക്തിസഹമായ സാധ്യതയില്ലെന്ന് ഞങ്ങൾ നിർണയിച്ചു.
Codex-Spark രണ്ട് പരസ്പരം പൂരകമായ മോഡുകളുള്ള ഒരു Codex-ലേക്കുള്ള ആദ്യ പടിയാണ്: ദീർഘകാല ദൂരദൃഷ്ടിയുള്ള റീസണിംഗ്വും നിർവഹണവും, കൂടാതെ വേഗത്തിലുള്ള ആവർത്തനത്തിനായി തത്സമയ സഹകരണവും. കാലക്രമേണ, മോഡുകൾ ലയിക്കും—Codex നിങ്ങളെ ഒരു കർശനമായ ഇന്ററാക്ടീവ് ലൂപ്പിൽ നിലനിർത്തും, കൂടുതൽ സമയം എടുക്കുന്ന ജോലികൾ പശ്ചാത്തലത്തിലെ ഉപ-ഏജന്റുകൾക്ക് ഏൽപ്പിക്കാനും, അല്ലെങ്കിൽ വ്യാപ്തിയും വേഗവും വേണമെങ്കിൽ നിരവധി മോഡലുകളിലേക്ക് സമാന്തരമായി ടാസ്കുകൾ വിതരണം ചെയ്യാനും കഴിയും, അതിനാൽ തുടക്കത്തിൽ തന്നെ ഒരു ഒറ്റ മോഡ് തിരഞ്ഞെടുക്കേണ്ടതില്ല.
മോഡലുകൾ കൂടുതൽ കഴിവുള്ളവയാകുമ്പോൾ, ഇടപെടൽ വേഗത ഒരു വ്യക്തമായ തടസ്സമാകുന്നു. അൾട്രാ-ഫാസ്റ്റ് ഇൻഫറൻസ് ആ ലൂപ്പ് കൂടുതൽ കെട്ടിപ്പടുക്കുന്നു, Codex ഉപയോഗിക്കുന്നത് കൂടുതൽ സ്വാഭാവികമാക്കുകയും ഒരു ആശയം പ്രവർത്തനക്ഷമമായ സോഫ്റ്റ്വെയറാക്കി മാറ്റാൻ കഴിയുന്ന സാധ്യതകൾ വിപുലീകരിക്കുകയും ചെയ്യുന്നു.


