ఈరోజు, GPT‑5.3‑Codex‑Spark యొక్క రీసెర్చ్ ప్రివ్యూని విడుదల చేస్తున్నాం — ఇది GPT‑5.3‑Codex యొక్క చిన్న వెర్షన్ మరియు రియల్-టైం కోడింగ్ కోసం రూపొందించిన మా తొలి మోడల్. Codex-Spark అనేది Cerebras తో మా భాగస్వామ్యంలో తొలి ముఖ్యమైన మైలురాయి, దీనిని మేము జనవరిలో ప్రకటించాము. Codex-Spark ను అతి తక్కువ లాటెన్సీ హార్డ్వేర్పై సర్వ్ చేసినప్పుడు వెంటనే స్పందించేలా ఆప్టిమైజ్ చేయబడింది — ఇది ప్రతి సెకన్కు 1000 కన్న ఎక్కువ టోకెన్స్ను విడుదల చేస్తూ, నిజ-జీవిత కోడింగ్ పనులకు ఇంకా అత్యంత సామర్థ్యవంతంగా పనిచేస్తుంది.
డెవలపర్లు ముందుగానే ఎక్స్పెరిమెంట్ చేయడం ప్రారంభించేందుకు, అలాగే మేము Cerebras తో కలిసి డేటాసెంటర్ కెపాసిటీని పెంచడం, ఎండ్-టు-ఎండ్ యూజర్ ఎక్స్పీరియెన్స్ను మరింత స్థిరంగా చేయడం, మరియు మా పెద్ద ఫ్రంటియర్ మోడల్స్ను డిప్లాయ్ చేయడం వంటి పనులు చేస్తుండగా, Codex-Spark ను Cerebras పై రీసెర్చ్ ప్రివ్యూగా ChatGPT Pro యూజర్లతో పంచుకుంటున్నాం.
మా తాజా ఫ్రంటియర్ మోడల్స్ దీర్ఘకాలిక టాస్క్స్ను నిర్వహించే సామర్థ్యంలో ప్రత్యేక బలాలను చూపించాయి, అవి ఎలాంటి ఇంటర్వెన్షన్ లేకుండా గంటలు, రోజులు లేదా వారాల పాటు ఆటోనమస్గా పనిచేయగలవు. Codex-Spark అనేది Codexతో రియల్-టైమ్లో పని చేయడానికి ప్రత్యేకంగా రూపొందించిన మా తొలి మోడల్ — ఇది లక్ష్యిత ఎడిట్లు చేయడం, లాజిక్ను పునర్రూపకల్పన చేయడం, ఇంటర్ఫేస్లను మెరుగుపరచడం వంటి పనులను చేసి వెంటనే ఫలితాలను అందిస్తుంది. Codex-Spark తో, Codex ఇప్పుడు దీర్ఘకాలిక, ఆసక్తికరమైన పనులు మరియు తక్షణంలో పనిని పూర్తిచేసే రెండు విధాలకూ మద్దతు ఇస్తుంది. డెవలపర్లు దీనిని ఎలా ఉపయోగిస్తున్నారో నేర్చుకుని, యాక్సెస్ను విస్తరించుతూ ఉండగా వారి ఫీడ్బ్యాక్ను చేర్చాలని మేము ఆశిస్తున్నాం.
ప్రారంభంలో, Codex-Spark కి 128k కాంటెక్స్ట్ విండో ఉంటుంది మరియు ఇది టెక్స్ట్ మాత్రమే ఉంటుంది. రీసెర్చ్ ప్రివ్యూ సమయంలో, Codex-Spark కు దాని స్వంత రేట్ లిమిట్స్ ఉంటాయి మరియు వినియోగం సాధారణ రేట్ లిమిట్స్లో లెక్కించబడదు. అయితే, డిమాండ్ ఎక్కువగా ఉన్నప్పుడు, యూజర్ల మధ్య విశ్వసనీయతను సమతుల్యం చేయడానికి మేము చర్యలు తీసుకుంటుండగా, మీకు పరిమిత యాక్సెస్ లేదా తాత్కాలిక క్యూ కనిపించవచ్చు.
Codex-Spark ను ఇంటరాక్టివ్ పనుల కోసం ఆప్టిమైజ్ చేయబడింది, ఇక్కడ వేగవంతమైన ప్రతిస్పందన (లాటెన్సీ) కూడా తెలివితేట పైగా అలాగే ముఖ్యమై ఉంటుంది. మీరు మోడల్తో రియల్-టైమ్లో సహకరించవచ్చు, అది పనిచేస్తున్నప్పుడు దాన్ని మధ్యలో ఆపడం లేదా దిశ మార్చడం చేయవచ్చు, అలాగే దాదాపు తక్షణ ప్రతిస్పందనలతో వేగంగా ఇటరేట్ చేయవచ్చు. వేగానికి అనుకూలంగా ట్యూన్ చేసినందున, Codex-Spark దాని డిఫాల్ట్ పనితీరును తేలికగా ఉంచుతుంది: అది కనిష్ట, లక్ష్యంగా ఎడిట్లను చేస్తుంది మరియు మీరు అడగకుండా ఆటోమేట్గా టెస్టులు నిర్వహించదు.
Codex-Spark ఒక అత్యంత సామర్థ్యవంతమైన చిన్న మోడల్, ఇది వేగవంతమైన ఇన్ఫరెన్స్ కోసం ఆప్టిమైజ్ చేయబడింది. SWE-Bench Pro మరియు Terminal-Bench 2.0 వంటి ఏజెంటిక్ సాఫ్ట్వేర్ ఇంజనీరింగ్ సామర్ధ్యాన్ని మూల్యాంకన చేసే రెండు బెంచ్మార్క్లలో, GPT‑5.3‑Codex‑Spark GPT‑5.3‑Codex‑Spark GPT‑5.3‑Codex తో పోల్చినప్పుడు పనులను చాలా తక్కువ సమయంలో పూర్తిచేసి బలమైన పనితీరు చూపుతుంది.
వ్యవధిని ఈ భాగాల మొత్తంగా అంచనా వేస్తారు: (1) అవుట్పుట్ జనరేషన్ టైమ్ (అవుట్పుట్ టోకెన్లు ÷ స్యాంప్లింగ్ స్పీడ్), (2) ప్రీఫిల్ టైమ్ (ప్రీఫిల్ టోకెన్లు ÷ ప్రీఫిల్ స్పీడ్), (3) మొత్తం టూల్ ఎగ్జిక్యూషన్ టైమ్, మరియు (4) మొత్తం నెట్వర్క్ ఓవర్హెడ్.
మేము Codex-Sparkను శిక్షణ ఇస్తున్నప్పుడు, రియల్-టైమ్ సహకారానికి మోడల్ వేగం మాత్రమె కాదు, పూర్తి రిక్వెస్ట్-రీస్పాన్స్ పైప్లైన్ అంతటా లాటెన్సీని తగ్గించాల్సిన అవసరం కూడా ఉందని స్పష్టమయ్యింది. అన్ని మోడల్స్కు ప్రయోజనం కలిగే విధంగా, మా హార్నెస్లో ఎండ్-టు-ఎండ్ లాటెన్సీ మెరుగుదలలను అమలు చేశాము. అంతర్గతంగా, క్లయింట్ నుంచి సర్వర్కు మరియు తిరిగి వచ్చే రెస్పాన్స్ స్ట్రీమింగ్ విధానాన్ని సరళీకరించాము, మా ఇన్ఫరెన్స్ స్టాక్లో ముఖ్యమైన భాగాలను మళ్లీ రాసాము, అలాగే సెషన్లు ఎలా ప్రారంభమవుతాయో పునర్వ్యవస్థీకరించాము, తద్వారా మొదటి కనిపించే టోకెన్ త్వరగా కనిపిస్తుంది మరియు మీరు ఇటరేట్ చేస్తూ ఉండగా Codex స్పందనశీలంగా ఉంటుంది. స్థిరమైన WebSocket కనెక్షన్ను ప్రవేశపెట్టి, అలాగే Responses API లో లక్ష్యిత ఆప్టిమైజేషన్లు అమలు చేయడం ద్వారా, ప్రతి క్లయింట్/సర్వర్ రౌండ్ట్రిప్కు సంబంధించిన ఓవర్హెడ్ను 80% తగ్గించాము, ప్రతి టోకెన్కు సంబంధించిన ఓవర్హెడ్ను 30% తగ్గించాము, మరియు ఫస్ట్ టోకెన్ కనిపించే సమయాన్ని 50% తగ్గించాము. Codex-Spark కోసం WebSocket మార్గం మూలంగా (డిఫాల్ట్గా) సక్రియమైనది మరియు త్వరలో ఇది అన్ని మోడల్స్కు కూడా డిఫాల్ట్గా మారుతుంది.
Codex-Spark, Cerebras యొక్క Wafer Scale Engine 3(కొత్త విండోలో తెరుచుకుంటుంది) పై నడుస్తుంది — వారు ప్రత్యేకంగా అధిక-వేగ ఇన్ఫరెన్స్ కోసం రూపొందించిన AI యాక్సిలరేటర్, ఇది Codex కు లేటెన్సీ-ఫస్ట్ సర్వింగ్ టియర్ను అందిస్తుంది. మా ఫ్లీట్లోని మిగతా మోడల్స్ ఉపయోగించే అదే ప్రొడక్షన్ సర్వింగ్ స్టాక్లో ఈ లో-లేటెన్సీ పాత్ను చేర్చేందుకు Cerebrasతో భాగస్వామ్యం చేశాం, దీంతో ఇది Codex అంతటా సీమ్లెస్గా పనిచేసి, భవిష్యత్ మోడల్స్కు మద్దతు ఇవ్వడానికి మమ్మల్ని సిద్ధం చేస్తుంది.
“GPT-5.3-Codex-Spark గురించి మాకు అత్యంత ఉత్సాహం కలిగించేది OpenAIతో, అలాగే డెవలపర్ కమ్యూనిటీతో కలిసి పని చేసి, ఫాస్ట్ ఇన్ఫరెన్స్ వల్ల ఏం సాధ్యమవుతుందో కనుగొనడమే—కొత్త ఇంటరాక్షన్ ప్యాటర్న్స్, కొత్త యూజ్ కేసెస్, ఇంకా మూలంగా భిన్నమైన మోడల్ అనుభవం. ఈ ప్రివ్యూ కేవలం ఆరంభం మాత్రమే.”
మా ట్రైనింగ్ మరియు ఇన్ఫరెన్స్ పైప్లైన్స్ అంతటా GPUs ప్రాథమికంగా కొనసాగుతున్నాయి మరియు విస్తృత వినియోగానికి అత్యంత ఖర్చు-ప్రభావవంతమైన టోకెన్స్ను అందిస్తున్నాయి. అత్యంత తక్కువ లేటెన్సీ అవసరమైన వర్క్ఫ్లోలలో అధిక పనితీరు చూపుతూ, ఎండ్-టు-ఎండ్ లూప్ను మరింత కుదించి, మీరు ఇటరేట్ చేస్తూ ఉండగా Codex మరింత వేగంగా స్పందించేలా Cerebras ఆ ప్రాతిపదికను మరింత మెరుగుపరుస్తుంది. అత్యుత్తమ పనితీరును సాధించేందుకు, ఒకే వర్క్లోడ్ కోసం GPUs మరియు Cerebras ను కలిపి ఉపయోగించవచ్చు.
Codex-Spark ప్రస్తుతం రీసెర్చ్ ప్రివ్యూ రూపంలో ChatGPT Pro యూజర్ల కోసం Codex యాప్, CLI మరియు VS Code ఎక్స్టెన్షన్ యొక్క తాజా వెర్షన్లలో ఈరోజు విడుదల అవుతోందని ప్రకటించారు ప్రత్యేకంగా తక్కువ లాటెన్సీ కోసం రూపొందించిన హార్డ్వేర్పై ఇది పనిచేస్తుండటంతో, రీసెర్చ్ ప్రివ్యూ సమయంలో డిమాండ్ ఆధారంగా మారవచ్చు అయిన ఒక ప్రత్యేక రేట్ లిమిట్ ద్వారా వినియోగం నియంత్రించబడుతుంది. అదనంగా, డెవలపర్లు తమ ప్రోడక్ట్స్లో Codex-Spark ని ఎలా ఇంటిగ్రేట్ చేయాలనుకుంటున్నారు అనేదాన్ని అర్థం చేసుకోవడానికి, చిన్న సంఖ్యలో డిజైన్ పార్ట్నర్ల కోసం Codex-Spark ని API ద్వారా అందుబాటులోకి తీసుకొస్తున్నాం. రాబోయే వారాల్లో, వాస్తవ వర్క్లోడ్స్లో మా ఇంటిగ్రేషన్ను మరింత ట్యూన్ చేస్తూ ఉండగా, యాక్సెస్ను విస్తరించనున్నాము.
Codex-Spark ప్రస్తుతం 128k కాంటెక్స్ట్ విండోతో టెక్స్ట్-ఓన్లీగా ఉంది మరియు అల్ట్రా-ఫాస్ట్ మోడల్స్ ఫ్యామిలీలో మొదటిది. కోడింగ్లో ఫాస్ట్ మోడల్స్ ఎక్కడ మెరుగ్గా పనిచేస్తాయో డెవలపర్ కమ్యూనిటీతో కలిసి నేర్చుకుంటూ, పెద్ద మోడల్స్, ఎక్కువ కాంటెక్స్ట్ లెంగ్త్స్, మరియు మల్టీమోడల్ ఇన్పుట్ వంటి మరిన్ని సామర్థ్యాలను పరిచయం చేస్తాం.
Codex-Spark లో మా ప్రధాన మోడల్స్లోని అలాగే సైబర్-సంబంధిత సేఫ్టి శిక్షణ కూడా ఉన్నాయి. మా ప్రామాణిక డిప్లాయ్మెంట్ ప్రక్రియలో భాగంగా, సైబర్ మరియు ఇతర సామర్థ్యాల కోసం బేస్లైన్ ఈవాల్యుయేషన్స్ను కలిగి ఉండే విధంగా Codex-Spark ను మేము మూల్యాంకనం చేశాము, మరియు సైబర్సెక్యూరిటీ లేదా బయాలజీ లో ఉన్న అధిక సామర్థ్యానికి సంబంధించిన మా Preparedness Framework థ్రెషోల్డ్ను ఇది సాధించే యథార్థ అవకాశం లేదని నిర్ధారించాము.
Codex-Spark, పొడుగు-కాల రీజనింగ్ మరియు ఎగ్జిక్యూషన్ మరియు వేగవంతమైన ఇటరేషన్ కోసం రియల్-టైమ్ కోలాబొరేషన్ అనే రెండు పరస్పర పూరక మోడ్లను కలిగిన Codex వైపు చేసిన తొలి అడుగు. కాలక్రమేణా ఈ మోడ్స్ కలిసిపోతాయి—మీరు ఒక టైట్ ఇంటరాక్టివ్ లూప్లో ఉండగా, Codex పొడవుగా నడిచే పనులను బ్యాక్గ్రౌండ్లోని సబ్-ఏజెంట్స్కు అప్పగించగలదు, లేదా విస్తృతత మరియు స్పీడ్ కావాలంటే పనులను అనేక మోడల్స్కు ప్యారలల్గా పంపగలదు, దీంతో ముందుగానే ఒకే మోడ్ను ఎంచుకోవాల్సిన అవసరం ఉండదు.
మోడల్స్ మరింత సామర్థ్యవంతంగా మారుతున్న కొద్దీ, ఇంటరాక్షన్ స్పీడ్ ఒక స్పష్టమైన బాటిల్నెక్గా మారుతుంది. అల్ట్రా-ఫాస్ట్ ఇన్ఫరెన్స్ ఆ లూప్ను మరింత కట్టుదిట్టం చేసి, Codexను ఉపయోగించడం మరింత సహజంగా అనిపించేలా చేసి, ఒక ఐడియాను వర్కింగ్ సాఫ్ట్వేర్గా మార్చే ప్రతి ఒక్కరికీ సాధ్యాలను విస్తరిస్తుంది.


