ప్రధాన కంటెంట్‌కి దాటండి
OpenAI

GPT‑5.3‑Codex‑Spark ను పరిచయం చేస్తున్నాం

Codex‌లో రియల్-టైమ్ కోడింగ్ కోసం రూపొందించిన అల్ట్రా-ఫాస్ట్ మోడల్.

లోడ్ అవుతోంది…

ఈరోజు, GPT‑5.3‑Codex‑Spark యొక్క రీసెర్చ్ ప్రివ్యూని విడుదల చేస్తున్నాం — ఇది GPT‑5.3‑Codex యొక్క చిన్న వెర్షన్ మరియు రియల్-టైం కోడింగ్ కోసం రూపొందించిన మా తొలి మోడల్. Codex-Spark అనేది Cerebras తో మా భాగస్వామ్యంలో తొలి ముఖ్యమైన మైలురాయి, దీనిని మేము జనవరిలో ప్రకటించాము. Codex-Spark ను అతి తక్కువ లాటెన్సీ హార్డ్‌వేర్‌పై సర్వ్ చేసినప్పుడు వెంటనే స్పందించేలా ఆప్టిమైజ్ చేయబడింది — ఇది ప్రతి సెకన్‌కు 1000 కన్న ఎక్కువ టోకెన్స్‌ను విడుదల చేస్తూ, నిజ-జీవిత కోడింగ్ పనులకు ఇంకా అత్యంత సామర్థ్యవంతంగా పనిచేస్తుంది.

డెవలపర్లు ముందుగానే ఎక్స్‌పెరిమెంట్ చేయడం ప్రారంభించేందుకు, అలాగే మేము Cerebras తో కలిసి డేటాసెంటర్ కెపాసిటీని పెంచడం, ఎండ్-టు-ఎండ్ యూజర్ ఎక్స్‌పీరియెన్స్‌ను మరింత స్థిరంగా చేయడం, మరియు మా పెద్ద ఫ్రంటియర్ మోడల్స్‌ను డిప్లాయ్ చేయడం వంటి పనులు చేస్తుండగా, Codex-Spark ను Cerebras పై రీసెర్చ్ ప్రివ్యూ‌గా ChatGPT Pro యూజర్లతో పంచుకుంటున్నాం.

మా తాజా ఫ్రంటియర్ మోడల్స్ దీర్ఘకాలిక టాస్క్స్‌ను నిర్వహించే సామర్థ్యంలో ప్రత్యేక బలాలను చూపించాయి, అవి ఎలాంటి ఇంటర్వెన్షన్ లేకుండా గంటలు, రోజులు లేదా వారాల పాటు ఆటోనమస్‌గా పనిచేయగలవు. Codex-Spark అనేది Codex‌తో రియల్-టైమ్‌లో పని చేయడానికి ప్రత్యేకంగా రూపొందించిన మా తొలి మోడల్ — ఇది లక్ష్యిత ఎడిట్లు చేయడం, లాజిక్‌ను పునర్‌రూపకల్పన చేయడం, ఇంటర్‌ఫేస్‌లను మెరుగుపరచడం వంటి పనులను చేసి వెంటనే ఫలితాలను అందిస్తుంది. Codex-Spark తో, Codex ఇప్పుడు దీర్ఘకాలిక, ఆసక్తికరమైన పనులు మరియు తక్షణంలో పనిని పూర్తిచేసే రెండు విధాలకూ మద్దతు ఇస్తుంది. డెవలపర్లు దీనిని ఎలా ఉపయోగిస్తున్నారో నేర్చుకుని, యాక్సెస్‌ను విస్తరించుతూ ఉండగా వారి ఫీడ్‌బ్యాక్‌ను చేర్చాలని మేము ఆశిస్తున్నాం.

ప్రారంభంలో, Codex-Spark కి 128k కాంటెక్స్ట్ విండో ఉంటుంది మరియు ఇది టెక్స్ట్ మాత్రమే ఉంటుంది. రీసెర్చ్ ప్రివ్యూ సమయంలో, Codex-Spark కు దాని స్వంత రేట్ లిమిట్స్ ఉంటాయి మరియు వినియోగం సాధారణ రేట్ లిమిట్స్‌లో లెక్కించబడదు. అయితే, డిమాండ్ ఎక్కువగా ఉన్నప్పుడు, యూజర్ల మధ్య విశ్వసనీయతను సమతుల్యం చేయడానికి మేము చర్యలు తీసుకుంటుండగా, మీకు పరిమిత యాక్సెస్ లేదా తాత్కాలిక క్యూ కనిపించవచ్చు.

స్పీడ్ మరియు ఇంటెలిజెన్స్

Codex-Spark ను ఇంటరాక్టివ్ పనుల కోసం ఆప్టిమైజ్ చేయబడింది, ఇక్కడ వేగవంతమైన ప్రతిస్పందన (లాటెన్సీ) కూడా తెలివితేట పైగా అలాగే ముఖ్యమై ఉంటుంది. మీరు మోడల్‌తో రియల్-టైమ్‌లో సహకరించవచ్చు, అది పనిచేస్తున్నప్పుడు దాన్ని మధ్యలో ఆపడం లేదా దిశ మార్చడం చేయవచ్చు, అలాగే దాదాపు తక్షణ ప్రతిస్పందనలతో వేగంగా ఇటరేట్ చేయవచ్చు. వేగానికి అనుకూలంగా ట్యూన్ చేసినందున, Codex-Spark దాని డిఫాల్ట్ పనితీరును తేలికగా ఉంచుతుంది: అది కనిష్ట, లక్ష్యంగా ఎడిట్లను చేస్తుంది మరియు మీరు అడగకుండా ఆటోమేట్‌గా టెస్టులు నిర్వహించదు.

కోడింగ్

Codex-Spark ఒక అత్యంత సామర్థ్యవంతమైన చిన్న మోడల్, ఇది వేగవంతమైన ఇన్‌ఫరెన్స్ కోసం ఆప్టిమైజ్ చేయబడింది. SWE-Bench Pro మరియు Terminal-Bench 2.0 వంటి ఏజెంటిక్ సాఫ్ట్‌వేర్ ఇంజనీరింగ్ సామర్ధ్యాన్ని మూల్యాంకన చేసే రెండు బెంచ్‌మార్క్‌లలో, GPT‑5.3‑Codex‑Spark GPT‑5.3‑Codex‑Spark GPT‑5.3‑Codex తో పోల్చినప్పుడు పనులను చాలా తక్కువ సమయంలో పూర్తిచేసి బలమైన పనితీరు చూపుతుంది.

వ్యవధిని ఈ భాగాల మొత్తంగా అంచనా వేస్తారు: (1) అవుట్‌పుట్ జనరేషన్ టైమ్ (అవుట్‌పుట్ టోకెన్లు ÷ స్యాంప్లింగ్ స్పీడ్), (2) ప్రీఫిల్ టైమ్ (ప్రీఫిల్ టోకెన్లు ÷ ప్రీఫిల్ స్పీడ్), (3) మొత్తం టూల్ ఎగ్జిక్యూషన్ టైమ్, మరియు (4) మొత్తం నెట్‌వర్క్ ఓవర్‌హెడ్.

అన్ని మోడల్స్ కోసం లేటెన్సీ మెరుగుదలలు

మేము Codex-Sparkను శిక్షణ ఇస్తున్నప్పుడు, రియల్-టైమ్ సహకారానికి మోడల్ వేగం మాత్రమె కాదు, పూర్తి రిక్వెస్ట్-రీస్పాన్స్ పైప్‌లైన్ అంతటా లాటెన్సీని తగ్గించాల్సిన అవసరం కూడా ఉందని స్పష్టమయ్యింది. అన్ని మోడల్స్‌కు ప్రయోజనం కలిగే విధంగా, మా హార్నెస్‌లో ఎండ్-టు-ఎండ్ లాటెన్సీ మెరుగుదలలను అమలు చేశాము. అంతర్గతంగా, క్లయింట్ నుంచి సర్వర్‌కు మరియు తిరిగి వచ్చే రెస్పాన్స్ స్ట్రీమింగ్ విధానాన్ని సరళీకరించాము, మా ఇన్‌ఫరెన్స్ స్టాక్‌లో ముఖ్యమైన భాగాలను మళ్లీ రాసాము, అలాగే సెషన్లు ఎలా ప్రారంభమవుతాయో పునర్‌వ్యవస్థీకరించాము, తద్వారా మొదటి కనిపించే టోకెన్ త్వరగా కనిపిస్తుంది మరియు మీరు ఇటరేట్ చేస్తూ ఉండగా Codex స్పందనశీలంగా ఉంటుంది. స్థిరమైన WebSocket కనెక్షన్‌ను ప్రవేశపెట్టి, అలాగే Responses API లో లక్ష్యిత ఆప్టిమైజేషన్లు అమలు చేయడం ద్వారా, ప్రతి క్లయింట్/సర్వర్ రౌండ్‌ట్రిప్‌కు సంబంధించిన ఓవర్‌హెడ్‌ను 80% తగ్గించాము, ప్రతి టోకెన్‌కు సంబంధించిన ఓవర్‌హెడ్‌ను 30% తగ్గించాము, మరియు ఫస్ట్ టోకెన్ కనిపించే సమయాన్ని 50% తగ్గించాము. Codex-Spark కోసం WebSocket మార్గం మూలంగా (డిఫాల్ట్‌గా) సక్రియమైనది మరియు త్వరలో ఇది అన్ని మోడల్స్‌కు కూడా డిఫాల్ట్‌గా మారుతుంది.

Cerebras ద్వారా శక్తి పొందింది

Codex-Spark, Cerebras యొక్క Wafer Scale Engine 3(కొత్త విండోలో తెరుచుకుంటుంది) పై నడుస్తుంది — వారు ప్రత్యేకంగా అధిక-వేగ ఇన్‌ఫరెన్స్ కోసం రూపొందించిన AI యాక్సిలరేటర్, ఇది Codex కు లేటెన్సీ-ఫస్ట్ సర్వింగ్ టియర్‌ను అందిస్తుంది. మా ఫ్లీట్‌లోని మిగతా మోడల్స్ ఉపయోగించే అదే ప్రొడక్షన్ సర్వింగ్ స్టాక్‌లో ఈ లో-లేటెన్సీ పాత్‌ను చేర్చేందుకు Cerebras‌తో భాగస్వామ్యం చేశాం, దీంతో ఇది Codex అంతటా సీమ్లెస్‌గా పనిచేసి, భవిష్యత్ మోడల్స్‌కు మద్దతు ఇవ్వడానికి మమ్మల్ని సిద్ధం చేస్తుంది.

“GPT-5.3-Codex-Spark గురించి మాకు అత్యంత ఉత్సాహం కలిగించేది OpenAIతో, అలాగే డెవలపర్ కమ్యూనిటీతో కలిసి పని చేసి, ఫాస్ట్ ఇన్‌ఫరెన్స్ వల్ల ఏం సాధ్యమవుతుందో కనుగొనడమే—కొత్త ఇంటరాక్షన్ ప్యాటర్న్స్, కొత్త యూజ్ కేసెస్, ఇంకా మూలంగా భిన్నమైన మోడల్ అనుభవం. ఈ ప్రివ్యూ కేవలం ఆరంభం మాత్రమే.”
— షాన్ లీ, CTO మరియు Cerebras యొక్క కో-ఫౌండర్

మా ట్రైనింగ్ మరియు ఇన్‌ఫరెన్స్ పైప్‌లైన్స్ అంతటా GPUs ప్రాథమికంగా కొనసాగుతున్నాయి మరియు విస్తృత వినియోగానికి అత్యంత ఖర్చు-ప్రభావవంతమైన టోకెన్స్‌ను అందిస్తున్నాయి. అత్యంత తక్కువ లేటెన్సీ అవసరమైన వర్క్‌ఫ్లోలలో అధిక పనితీరు చూపుతూ, ఎండ్-టు-ఎండ్ లూప్‌ను మరింత కుదించి, మీరు ఇటరేట్ చేస్తూ ఉండగా Codex మరింత వేగంగా స్పందించేలా Cerebras ఆ ప్రాతిపదికను మరింత మెరుగుపరుస్తుంది. అత్యుత్తమ పనితీరును సాధించేందుకు, ఒకే వర్క్‌లోడ్ కోసం GPUs మరియు Cerebras ను కలిపి ఉపయోగించవచ్చు.

అందుబాటు & వివరాలు

Codex-Spark ప్రస్తుతం రీసెర్చ్ ప్రివ్యూ రూపంలో ChatGPT Pro యూజర్ల కోసం Codex యాప్, CLI మరియు VS Code ఎక్స్‌టెన్షన్ యొక్క తాజా వెర్షన్‌లలో ఈరోజు విడుదల అవుతోందని ప్రకటించారు ప్రత్యేకంగా తక్కువ లాటెన్సీ కోసం రూపొందించిన హార్డ్‌వేర్‌పై ఇది పనిచేస్తుండటంతో, రీసెర్చ్ ప్రివ్యూ సమయంలో డిమాండ్ ఆధారంగా మారవచ్చు అయిన ఒక ప్రత్యేక రేట్ లిమిట్ ద్వారా వినియోగం నియంత్రించబడుతుంది. అదనంగా, డెవలపర్లు తమ ప్రోడక్ట్స్‌లో Codex-Spark ని ఎలా ఇంటిగ్రేట్ చేయాలనుకుంటున్నారు అనేదాన్ని అర్థం చేసుకోవడానికి, చిన్న సంఖ్యలో డిజైన్ పార్ట్‌నర్ల కోసం Codex-Spark ని API ద్వారా అందుబాటులోకి తీసుకొస్తున్నాం. రాబోయే వారాల్లో, వాస్తవ వర్క్‌లోడ్స్‌లో మా ఇంటిగ్రేషన్‌ను మరింత ట్యూన్ చేస్తూ ఉండగా, యాక్సెస్‌ను విస్తరించనున్నాము.

Codex-Spark ప్రస్తుతం 128k కాంటెక్స్ట్ విండోతో టెక్స్ట్-ఓన్లీగా ఉంది మరియు అల్ట్రా-ఫాస్ట్ మోడల్స్ ఫ్యామిలీలో మొదటిది. కోడింగ్‌లో ఫాస్ట్ మోడల్స్ ఎక్కడ మెరుగ్గా పనిచేస్తాయో డెవలపర్ కమ్యూనిటీతో కలిసి నేర్చుకుంటూ, పెద్ద మోడల్స్, ఎక్కువ కాంటెక్స్ట్ లెంగ్త్స్, మరియు మల్టీమోడల్ ఇన్‌పుట్ వంటి మరిన్ని సామర్థ్యాలను పరిచయం చేస్తాం.

Codex-Spark లో మా ప్రధాన మోడల్స్‌లోని అలాగే సైబర్-సంబంధిత సేఫ్‌టి శిక్షణ కూడా ఉన్నాయి. మా ప్రామాణిక డిప్లాయ్‌మెంట్ ప్రక్రియలో భాగంగా, సైబర్ మరియు ఇతర సామర్థ్యాల కోసం బేస్‌లైన్ ఈవాల్యుయేషన్స్‌ను కలిగి ఉండే విధంగా Codex-Spark ను మేము మూల్యాంకనం చేశాము, మరియు సైబర్‌సెక్యూరిటీ లేదా బయాలజీ లో ఉన్న అధిక సామర్థ్యానికి సంబంధించిన మా Preparedness Framework థ్రెషోల్డ్‌ను ఇది సాధించే యథార్థ అవకాశం లేదని నిర్ధారించాము.

తదుపరి ఏమిటి

Codex-Spark, పొడుగు-కాల రీజనింగ్ మరియు ఎగ్జిక్యూషన్ మరియు వేగవంతమైన ఇటరేషన్ కోసం రియల్-టైమ్ కోలాబొరేషన్ అనే రెండు పరస్పర పూరక మోడ్‌లను కలిగిన Codex వైపు చేసిన తొలి అడుగు. కాలక్రమేణా ఈ మోడ్స్ కలిసిపోతాయి—మీరు ఒక టైట్ ఇంటరాక్టివ్ లూప్‌లో ఉండగా, Codex పొడవుగా నడిచే పనులను బ్యాక్‌గ్రౌండ్‌లోని సబ్-ఏజెంట్స్‌కు అప్పగించగలదు, లేదా విస్తృతత మరియు స్పీడ్ కావాలంటే పనులను అనేక మోడల్స్‌కు ప్యారలల్‌గా పంపగలదు, దీంతో ముందుగానే ఒకే మోడ్‌ను ఎంచుకోవాల్సిన అవసరం ఉండదు.

మోడల్స్ మరింత సామర్థ్యవంతంగా మారుతున్న కొద్దీ, ఇంటరాక్షన్ స్పీడ్ ఒక స్పష్టమైన బాటిల్‌నెక్‌గా మారుతుంది. అల్ట్రా-ఫాస్ట్ ఇన్‌ఫరెన్స్ ఆ లూప్‌ను మరింత కట్టుదిట్టం చేసి, Codex‌ను ఉపయోగించడం మరింత సహజంగా అనిపించేలా చేసి, ఒక ఐడియాను వర్కింగ్ సాఫ్ట్‌వేర్‌గా మార్చే ప్రతి ఒక్కరికీ సాధ్యాలను విస్తరిస్తుంది.

రచయిత

OpenAI