Codex ሊያደርገው የሚችለውን የበለጠ የሚከፍት አዲስ ሞዴል እያስተዋወቅን ነው፦ GPT‑5.3‑Codex፣ እስካሁን ድረስ በጣም ብቃት ያለው ወኪል የኮድ ሞዴል። ሞዴሉ የGPT‑5.2‑Codexን የድንበር ኮድ አፈፃፀም እና የGPT‑5.2ን የማመዛዘን እና የሙያ እውቀት ችሎታዎች በአንድ ሞዴል ውስጥ ያሻሽላል፣ ይህም በ25% ፈጣን ነው። ይህም ምርምርን፣ የመሣሪያ አጠቃቀምን እና ውስብስብ አፈፃፀምን የሚያካትቱ ረጅም ጊዜ የሚወስዱ ተግባራትን እንዲወስድ ያስችለዋል። ልክ እንደ ባልደረባ፣ የGPT‑5.3‑Codexን እየሠራ እያለ አውዱን ሳያጡ መምራት እና መስተጋብር መፍጠር ይችላሉ።
GPT‑5.3‑Codexንራሱን ለመፍጠር ወሳኝ ሚና የተጫወተ የመጀመሪያው ሞዴላችን ነው። የCodex ቡድን የራሱን ስልጠና ለማረም፣ የራሱን ማሰማራት ለማስተዳደር እና የፈተና ውጤቶችን እና ግምገማዎችን ለመመርመር ቀደምት ስሪቶችን ተጠቅሟል—ቡድናችን Codex የራሱን እድገት ምን ያህል ማፋጠን እንደቻለ በጣም ተገርሟል።
GPT‑5.3‑Codex ጋር፣ Codex ኮድ መጻፍና መገምገም ከሚችል ወኪል ወደ ገንቢዎችና ባለሙያዎች በኮምፒውተር ላይ ማድረግ የሚችሉትን ማንኛውንም ነገር ማድረግ ወደሚችል ወኪልነት ይቀየራል።
GPT‑5.3‑Codex በSWE-Bench Pro እና Terminal-Bench ላይ አዲስ ኢንዱስትሪን ከፍ አድርጎታል፣ እና በOSWorld እና GDPval ላይ ጠንካራ አፈጻጸም ያሳያል፣ እነዚህም ኮድ፣ ወኪል እና እውነተኛ ዓለም ችሎታዎችን ለመለካት የምንጠቀምባቸው አራት መለኪያዎች ናቸው።
GPT‑5.3‑Codex በSWE-Bench Pro ላይ እጅግ ዘመናዊ አፈፃፀም አስመዝግቧል፣ ይህም የእውነተኛ ዓለም የሶፍትዌር ምህንድስናን ጥብቅ ግምገማ ነው። Pythonን ብቻ ከሚፈትነው SWE‑bench የተረጋገጠ በተለየ፣ SWE‑Bench Pro አራት ቋንቋዎችን ይፈትሻል እና የበለጠ ብክለትን የሚቋቋም፣ ፈታኝ፣ የተለያየ እና ከኢንዱስትሪ ጋር ተዛማጅነት ያለው ነው። እንዲሁም እንደ Codex ያለ የኮድ ኤጀንት የሚያስፈልገውን የተርሚናል ክህሎቶች የሚለካው በTerminal-Bench 2.0 ላይ ከነበረው ዘመናዊ አፈፃፀም እጅግ የላቀ ነው። የሚገርመው ነገር፣ GPT‑5.3‑Codex ከማንኛውም ቀዳሚ ሞዴል ባነሱ tokenዎች ይህን ያደርጋል፣ ይህም ተጠቃሚዎች የበለጠ እንዲገነቡ ያስችላቸዋል።
የድንበር ኮድ አወጣጥ ችሎታዎችን፣ የውበት ማሻሻያዎችን እና ኮምፓክትን ማጣመር አስደናቂ ሥራ የሚሠራ ሞዴል ያስገኛል፣ ይህም በቀናት ውስጥ በጣም ተግባራዊ የሆኑ ውስብስብ ጨዋታዎችን እና መተግበሪያዎችን ከባዶ መገንባት ይችላል። የሞዴሉን የድር ልማት እና የረጅም ጊዜ የወኪልነት ችሎታዎችን ለመፈተሽ፣ GPT‑5.3‑Codex ሁለት ጨዋታዎችን እንዲገነባልን ጠይቀን ነበር፦ የCodex መተግበሪያ ጅማሬ የእሽቅድምድም ጨዋታ ሁለተኛ ስሪት እና የዳይቪንግ ጨዋታ። የድር ጨዋታ ክህሎትን እና አስቀድሞ የተመረጡትን በመጠቀም፣ እንደ «ስህተቱን አስተካክል» ወይም «ጨዋታውን ማሻሻል»፣ GPT‑5.3‑Codex ያሉ አጠቃላይ የክትትል እርምጃዎች በሚሊዮን የሚቆጠሩ tokenዎችን በራስ-ሰር በጨዋታዎች ላይ ተደግሟል። Codex ምን ማድረግ እንደሚችል ለማየት የፊልም ማስታወቂያዎቹን ይመልከቱ እና ጨዋታዎቹን ለራስዎ ይጫወቱ።
የተለያዩ እሽቅድምድም ተወዳዳሪዎችን፣ ስምንት ካርታዎችን እና ከቦታ አሞሌው ጋር ለመጠቀም የሚያስችሉ እቃዎችን ጨምሮ የእሽቅድምድም ጨዋታ። እዚህ ለራስዎ ይጫወቱት(በአዲስ መስኮት ውስጥ ይክፈታል)!
የተለያዩ ሪፎችን የሚያሰሱበት የዳይቪንግ ጨዋታ፣ የዓሳ codexዎን ለማጠናቀቅ ሁሉንም ይሰብስቡ፣ ኦክስጅንን፣ ግፊትን እና አደጋዎችን ሁሉ ይቆጣጠሩ። እዚህ ለራስዎ ይጫወቱት(በአዲስ መስኮት ውስጥ ይክፈታል)!
GPT‑5.3‑Codex ከGPT‑5.2‑Codex ጋር ሲነጻጸር የዕለት ተዕለት ድር ጣቢያዎችን እንዲያዘጋጅ ሲጠይቁት ፍላጎትዎን በተሻለ ሁኔታ ይረዳል። ቀላል ወይም ያልተገለጹ እርምጃዎች አሁን የበለጠ ተግባራዊነት እና ምክንያታዊ ነባሪዎች ላሏቸው ጣቢያዎች ነባሪ ይሆናሉ፣ ይህም ሀሳቦችዎን ወደ ህይወት ለማምጣት ጠንካራ የመነሻ ሸራ ይሰጥዎታል።
ለምሳሌ፣ ከዚህ በታች ሁለት የማረፊያ ገጾችን እንዲገነቡ GPT‑5.3‑Codex እና GPT‑5.2‑Codexን ጠይቀናል። GPT‑5.3‑Codex ዓመታዊ ዕቅዱን እንደ ወርሃዊ ቅናሽ ዋጋ በራስ-ሰር አሳይቷል፣ ይህም ቅናሹን ግልፅ እና ሆን ተብሎ እንዲሰማ አድርጎታል፣ ይህም ዓመታዊውን ጠቅላላ ቁጥር ከማባዛት ይልቅ። እንዲሁም አንድ ሳይሆን ሦስት የተለያዩ የተጠቃሚ ጥቅሶችን የያዘ በራስ-ሰር የሚሸጋገር የምስክርነት መሸጋገሪያ ሰርቷል፣ ይህም በነባሪነት የበለጠ የተሟላ እና ለምርት ዝግጁ የሆነ ገጽ አስገኝቷል።
እርምጃ፦ ለQuiet KPI የማረፊያ ገጽ ይገንቡ እና ለጀማሪዎች ተስማሚ የሆነ ሳምንታዊ ሜትሪክ ማጠቃለያ ይፍጠሩ። ውበት ለስላሳ SaaS፣ የመስታወት ካርዶች፣ ከላቬንደር እስከ ሰማያዊ ቅልመት፣ ስውር ብዥታ ነው። ክፍሎች፣ በኢሜይል ቀረጻ ያለው ጀግና፣ የናሙና ሪፖርት ካርዶች ፍርግርግ፣ የውህደት ረድፍ፣ የምስክርነት መዘውር፣ በየወሩ የዋጋ መቀያየር፣ FAQ፣ ግርጌ።
- የፊደል አጻጻፍ ሳቶሺ ወይም ተመሳሳይ የጂኦሜትሪክ ሳንስ።
- አዝራሮች ለስላሳ ማዕዘኖች፣ 14px ራዲየስ፣ ጠንካራ የትኩረት ሁኔታዎች።
- አንድ ጣፋጭ የሆነ የማሸብለል መገለጥ ያክሉ።
የሶፍትዌር መሐንዲሶች፣ ዲዛይነሮች፣ የምርት አስተዳዳሪዎች እና የውሂብ ሳይንቲስቶች ኮድ ከማመንጨት የበለጠ ነገር ያደርጋሉ። GPT‑5.3‑Codex በሶፍትዌር የህይወት ዑደት ውስጥ ያለውን ሁሉንም ሥራ—ማረም፣ ማሰማራት፣ ክትትል ማድረግ፣ PRDዎችን መጻፍ፣ ጽሑፍን ማረም፣ የተጠቃሚ ምርምር፣ ሙከራዎች፣ መለኪያዎች እና ሌሎችም—ለመደገፍ የተገነባ ነው። የእሱ ወኪል ችሎታዎች ከሶፍትዌር በላይ ናቸው፣ ለመገንባት የሚፈልጉትን ሁሉ እንዲገነቡ ያግዝዎታል—የተንሸራታች ወለሎችን ወይም በሉሆች ውስጥ ያለውን ውሂብ መተንተን።
ቀደም ሲል ለነበረው የGDPval ውጤቶቻችን ጥቅም ላይ ከዋሉ ብጁ ክህሎቶች ጋር፣ GPT‑5.3‑Codex በGPT —val በተለካው መሰረት በሙያዊ የእውቀት ሥራ ላይ ጠንካራ አፈጻጸም ያሳያል፣ ይህም ከGPT‑5.2 ጋር ይጣጣማል። GDPval እ.ኤ.አ በ2025 የተለቀቀው OpenAI ግምገማ ሲሆን ይህም በ44 የሥራ ዘርፎች ውስጥ በሚገባ‑በተገለጹ የእውቀት‑ሥራዎች ላይ የአንድ ሞዴል አፈጻጸምን ይለካል። እነዚህ ተግባራት እንደ አቀራረቦች፣ የተመን ሉሆች እና ሌሎች የሥራ ምርቶችን መሥራት ያሉ ነገሮችን ያካትታሉ።
ወኪሉ ያዘጋጀውን ሥራ ጥቂት ምሳሌዎች ከዚህ በታች ቀርበዋል።
እርምጃ + ተግባር አውድ
GPT-5.3-Codex output

OSWorld ወኪል በምስል ዴስክቶፕ ኮምፒውተር አካባቢ ውስጥ የምርታማነት ተግባራትን ማጠናቀቅ ያለበት ወኪል የኮምፒውተር አጠቃቀም መለኪያ ነው። GPT‑5.3‑Codex ከቀደሙት የGPT ሞዴሎች የበለጠ ጠንካራ የኮምፒውተር አጠቃቀም ችሎታዎችን ያሳያል።
በOSWorld-የተረጋገጠ ውስጥ፣ ሞዴሎች የተለያዩ የኮምፒውተር ሥራዎችን ለማጠናቀቅ ራዕይን ይጠቀማሉ። የሰው ልጅ ውጤት ~72% ነው።
እነዚህ ውጤቶች በኮዲንግ፣ በፍሮንትኢንድ እና በኮምፒውተር አጠቃቀም እና በእውነተኛ ዓለም ተግባራት ላይ አንድ ላይ ሲጣመሩ GPT‑5.3‑Codexን ያሳያሉ። በግለሰብ ተግባራት ላይ ብቻ ሳይሆን፣ በእውነተኛው ዓለም የቴክኒክ ሥራ ላይ ማመዛዘን፣ መገንባት እና ተግባራዊ ማድረግ የሚችል አንድ፣ አጠቃላይ ዓላማ ያለው ወኪል ወደሆነ ደረጃ የሚሸጋገር እርምጃን ያመለክታል።
የሞዴል ችሎታዎች የበለጠ ኃይለኛ እየሆኑ ሲሄዱ፣ ክፍተቱ ወኪሎች ምን ማድረግ እንደሚችሉ ከመሆን ወደ ሰዎች ከብዙዎቹ ጋር እንዴት በቀላሉ መገናኘት፣ መምራት እና መቆጣጠር እንደሚችሉ ይቀየራል። የCodex መተግበሪያ ወኪሎችን ማስተዳደር እና ማስተዳደር በጣም ቀላል ያደርገዋል፣ እና አሁን በGPT‑5.3‑Codex የበለጠ በይነተገናኝ ነው። በአዲሱ ሞዴል፣ Codex በተደጋጋሚ ዝማኔዎችን ያቀርባል፣ ስለዚህ ቁልፍ ውሳኔዎችን እና እድገቶችን ሲሠሩ እንዲያውቁ ያስችልዎታል። የመጨረሻውን ውጤት ከመጠበቅ ይልቅ፣ በእውነተኛ ጊዜ መስተጋብር መፍጠር ይችላሉ—ጥያቄዎችን መጠየቅ፣ አቀራረቦችን መወያየት እና ወደ መፍትሄው መምራት ትችላላህ። GPT‑5.3‑Codex ምን እየሠራ እንደሆነ ያብራራል፣ ለአስተያየቶች ምላሽ ይሰጣል፣ እና ከጅምሩ እስከ መጨረሻው ድረስ በዝግታ ውስጥ ያቆይዎታል።
ሞዴሉ በመተግበሪያው ውስጥ በቅንብሮች > አጠቃላይ > የክትትል ባህሪ ውስጥ ሲሠራ መሪውን ያንቁ።
በቅርብ ጊዜ የተደረጉት ፈጣን የCodex ማሻሻያዎች በመላው OpenAI ውስጥ ለወራት ወይም ለዓመታት የዘለቁ የምርምር ፕሮጀክቶች ውጤት ላይ የተመሰረቱ ናቸው። እነዚህ የምርምር ፕሮጀክቶች በCodex እየተፋጠኑ ሲሆን፣ በOpenAI ውስጥ ያሉ ብዙ ተመራማሪዎችና መሐንዲሶች ዛሬ ሥራቸውን ከሁለት ወራት በፊት ከነበረው በእጅጉ የተለየ አድርገው ገልጸውታል። የGPT‑5.3‑Codex የመጀመሪያ ሥሪቶች እንኳን ልዩ ችሎታዎችን አሳይተናል፣ ይህም ቡድናችን ስልጠናውን ለማሻሻል እና የኋለኞቹን ሥሪቶች ለማሰማራት ከቀደሙት ሥሪቶች ጋር እንዲሠራ አስችሏል።
Codex ለተለያዩ ተግባራት ጠቃሚ ነው፣ ይህም ቡድኖቻችንን የሚረዳባቸውን መንገዶች ሙሉ በሙሉ ለመዘርዘር አስቸጋሪ ያደርገዋል። እንደ አንዳንድ ምሳሌዎች፣ የምርምር ቡድኑ ለዚህ ልቀት የሚደረገውን የስልጠና ሂደት ለመከታተል እና ለማረም Codexን ተጠቅሟል። የመሠረተ ልማት ችግሮችን ከማረም ባለፈ ምርምርን አፋጥኗል፦ በስልጠናው ሂደት ውስጥ ቅጦችን ለመከታተል፣ ስለ መስተጋብር ጥራት ጥልቅ ትንተና፣ የታቀዱ ጥገናዎችን ለማቅረብ እና የሰው ተመራማሪዎች የሞዴሉ ባህሪ ከቀደምት ሞዴሎች ጋር ሲነጻጸር እንዴት እንደሚለያይ በትክክል ለመረዳት የበለፀጉ አፕሊኬሽኖችን ገንብቷል።
የምህንድስና ቡድኑ ለGPT‑5.3‑Codex ማሰሪያውን ለማመቻቸት እና ለማላመድ Codexን ተጠቅሟል። በተጠቃሚዎች ላይ ተጽዕኖ የሚያሳድሩ እንግዳ የሆኑ የጠርዝ ጉዳዮችን ማየት ስንጀምር፣ የቡድን አባላት የCodexን አውድ የማሳየት ስህተቶችን ለመለየት እና ዝቅተኛ የመሸጎጫ መምታት መጠኖችን ለመለየት ተጠቅመዋል። GPT‑5.3‑Codex ቡድኑ በጅምር ጊዜ ሁሉ የGPU ክላስተሮችን ከትራፊክ መጨናነቅ ጋር እንዲላመዱ እና የዘገየነትን ሁኔታ እንዲረጋጉ በማድረግ መርዳት ቀጥሏል።
በአልፋ ሙከራ ወቅት፣ አንድ ተመራማሪ GPT‑5.3‑Codex በእያንዳንዱ ዙር ምን ያህል ተጨማሪ ሥራ እየተሠራ እንደሆነ እና በምርታማነት ላይ ያለውን ልዩነት ለመረዳት ፈልጎ ነበር። GPT‑5.3‑Codex የማብራሪያዎችን ድግግሞሽ፣ አዎንታዊ እና አሉታዊ የተጠቃሚ ምላሾችን፣ በተግባሩ ላይ ያለውን እድገት ለመገመት በርካታ ቀላል የሬጅክስ ክላሲፋየሮችን አዘጋጅቶ በሁሉም የክፍለ ጊዜ ምዝግብ ማስታወሻዎች ላይ በስፋት አስኬዳቸው እና መደምደሚያውን የያዘ ሪፖርት አዘጋጅቷል። Codexን በመጠቀም የሚገነቡ ሰዎች ይበልጥ ደስተኛ ነበሩ፤ ምክንያቱም ወኪሉ ዓላማቸውን በተሻለ ሁኔታ በመረዳቱ እና በእያንዳንዱ ዙር የበለጠ እድገት በማሳየቱ፣ ግልፅ ጥያቄዎች ጥቂት ነበሩ።
GPT‑5.3‑Codex ከቀደምት ዲዛይኖቹ በጣም የተለየ በመሆኑ፣ ከአልፋ ሙከራ የተገኘው መረጃ በርካታ ያልተለመዱ እና ተቃራኒ የሆኑ ውጤቶችን አሳይቷል። በቡድኑ ውስጥ ያለ አንድ የውሂብ ሳይንቲስት ከGPT‑5.3‑Codex ጋር በመተባበር አዳዲስ የውሂብ መስመሮችን ለመገንባት እና ውጤቶቹን ከመደበኛ የዳሽቦርድ መሣሪያዎቻችን በበለጠ በብልጽግና ለማየት ችለዋል። ውጤቶቹ ከCodex ጋር በጋራ ተተነተኑ፣ ይህም በሺዎች የሚቆጠሩ የውሂብ ነጥቦችን በሦስት ደቂቃዎች ውስጥ በአጭሩ ጠቅለል አድርጎ አቅርቧል።
በተናጠል፣ እነዚህ ሁሉ ተግባራት Codex ተመራማሪዎችን እና የምርት ገንቢዎችን እንዴት ሊረዳ እንደሚችል የሚያሳዩ አስደሳች ምሳሌዎች ናቸው። በአጠቃላይ እነዚህ አዳዲስ ችሎታዎች የምርምር፣ የምህንድስና እና የምርት ቡድኖቻችንን በከፍተኛ ፍጥነት እንዲያሳድጉ እንዳደረጉ ደርሰንበታል።
በቅርብ ወራት ውስጥ፣ በሳይበር ደኅንነት ተግባራት ላይ የሞዴል አፈጻጸም ትርጉም ያለው ጭማሪ አይተናል፣ ይህም ገንቢዎችንም ሆነ የደኅንነት ባለሙያዎችን ይጠቅማል። በተመሳሳይ መልኩ፣ የመከላከያ አጠቃቀምን እና ሰፊ የስነ-ምህዳር መቋቋምን ለመደገፍ የተጠናከሩ የሳይበር መከላከያዎችን እያዘጋጀን ነው።
GPT‑5.3‑Codex ሞዴል ከሳይበር ደኅንነት ጋር ለተያያዙ ተግባራት ከፍተኛ አቅም ብለን የምንመድበው የመጀመሪያው ሞዴል ነው፣ የዝግጁነት ማዕቀፍ እና የሶፍትዌር ተጋላጭነቶችን ለመለየት በቀጥታ ያሰለጠንነው የመጀመሪያው ነው። የሳይበር ጥቃቶችን ከጫፍ እስከ ጫፍ በራስ-ሰር እንደሚያደርግ የሚያሳይ ግልፅ ማስረጃ ባይኖረንም፣ እስካሁን ድረስ እጅግ በጣም ሁሉን አቀፍ የሆነውን የሳይበር ደኅንነት ቁልላችንን በጥንቃቄ እየተገበርን ነው። የእኛ ማስተካከያዎች የደኅንነት ስልጠና፣ አውቶማቲክ ክትትል፣ ለላቁ ችሎታዎች የታመነ መዳረሻ እና የአደጋ መረጃን ጨምሮ የማስፈጸሚያ መስመሮችን ያካትታሉ።
የሳይበር ደኅንነት በተፈጥሮው ሁለትዮሽ ጥቅም ላይ የሚውል ስለሆነ፣ ተከላካዮች ተጋላጭነቶችን የማግኘት እና የማስተካከል ችሎታቸውን የሚያፋጥን በማስረጃ ላይ የተመሰረተ፣ ተደጋጋሚ አቀራረብን እየወሰድን ነው፣ ይህም አላግባብ መጠቀምን እያዘገየ ነው። በዚህ አካል፣ የሳይበር መከላከያ ምርምርን ለማፋጠን የሙከራ ፕሮግራም የሆነውን የታመነ መዳረሻ ለሳይበር እያስጀመርን ነው።
የደኅንነት ምርምር ወኪላችን የሆነውን የAardvark የግል ቤታ በCodex ደኅንነት ምርቶች እና መሣሪያዎች ስብስብ ውስጥ እንደ የመጀመሪያው አቅርቦት በማስፋፋት እና እንደ Next.js ያሉ በስፋት ጥቅም ላይ የዋሉ ፕሮጀክቶችን ነፃ የኮድቤዝ ቅኝት ለማቅረብ ከክፍት ምንጭ ጠባቂዎች ጋር በመተባበር ኢንቨስት እያደረግን ነው—የደኅንነት ተመራማሪ ባለፈው ሳምንት የተገለጹትን(በአዲስ መስኮት ውስጥ ይክፈታል) ተጋላጭነቶች ለማግኘት Codexን ተጠቅሟል።
እ.ኤ.አ. በ2023 የተጀመረውን የ$1M የሳይበር ደኅንነት የገንዘብ ድጋፍ ፕሮግራማችንን መሰረት በማድረግ፣ በተለይም ለክፍት ምንጭ ሶፍትዌሮች እና ወሳኝ የመሠረተ ልማት ሥርዓቶች በጣም አቅም ያላቸውን ሞዴሎቻችንን በመጠቀም የሳይበር መከላከያን ለማፋጠን $10M የAPI ክሬዲቶችን እየሰጠን ነው። በታማኝነት የደኅንነት ምርምር ላይ የተሰማሩ ድርጅቶች በሳይበር ደኅንነት የገንዘብ ድጋፍ ፕሮግራማችን በኩል የAPI ክሬዲቶችን እና ድጋፍን ማመልከት ይችላሉ።
GPT‑5.3‑Codex በሚከፈልባቸው የChatGPT ዕቅዶች ይገኛል፣ Codexን መጠቀም በሚችሉበት ቦታ ሁሉ፦ መተግበሪያውን፣ CLI፣ IDE ቅጥያ እና ድርን መጠቀም ይችላሉ። በቅርቡ የAPI መዳረሻን ደኅንነቱ በተጠበቀ ሁኔታ ለማንቃት እየሠራን ነው።
በዚህ ዝማኔ፣ አሁን GPT‑5.3‑Codex እያሄድን ነው በመሠረተ ልማታችን እና በመረጃ ቋታችን ላይ በተደረጉ ማሻሻያዎች ምክንያት ለCodex ተጠቃሚዎች 25% ፈጣን እና ፈጣን ውጤቶችን አስገኝቷል።
GPT‑5.3‑Codex ለNVIDIA GB200 NVL72 ሥርዓቶች በጋራ የተነደፈ፣ ከስልጠና ጋር የሰለጠነ እና አገልግሏል። ለNVIDIA አጋርነታቸው አመስጋኞች ነን።
GPT‑5.3‑Codex ጋር፣ Codex ኮድ ከመጻፍ ባለፈ ኮምፒውተርን ለማንቀሳቀስ እና ሥራውን ከጫፍ እስከ ጫፍ ለማጠናቀቅ እንደ መሣሪያ አድርጎ መጠቀምን እየተሻገረ ነው። የኮድ ወኪል ሊያደርገው የሚችለውን ነገር በመግፋት፣ ሶፍትዌር ከመገንባትና ከማሰማራት ጀምሮ ውስብስብ ተግባራትን እስከ መመርመር፣ መተንተንና ማከናወን ድረስ—ሰፊ የእውቀት ክፍል እየከፈትን ነው። ምርጡ የኮድ ወኪል ለመሆን ትኩረት በመስጠት የተጀመረው ነገር በኮምፒዩተር ላይ የበለጠ አጠቃላይ ተባባሪ ለመሆን መሰረት ሆኗል፣ ይህም በCodex ማን መገንባት እንደሚችል እና ምን ማድረግ እንደሚቻል እያሰፋ ነው።
GPT‑5.3‑Codex (xhigh) | GPT‑5.2‑Codex (xhigh) | GPT‑5.2 (xhigh) | |
SWE-Bench Pro (የህዝብ) | 56.8% | 56.4% | 55.6% |
Terminal-Bench 2.0 | 77.3% | 64.0% | 62.2% |
OSWorld የተረጋገጠ | 64.7% | 38.2% | 37.9% |
GDPval (አሸናፊዎች ወይም ማሻሻያዎች) | 70.9% | - | 70.9% (ከፍተኛ) |
የሳይበር ደኅንነት ባንዲራ የመያዝ ተግዳሮቶች | 77.6% | 67.4% | 67.7% |
SWE-lancer IC Diamond | 81.4% | 76.0% | 74.6% |


