19 ኖቬምበር 2025

በGPT‑5.1‑Codex‑Max የበለጠ መገንባት

በመጫን ላይ…

መግቢያ

GPT‑5.1‑Codex‑Maxን እያስተዋወቅን ነው፣ አዲሱ የድንበር ላይ ወኪልነት ኮድ ሞዴል፣ ዛሬ በCodex ላይ ይገኛል። GPT‑5.1‑Codex‑Max የተገነባው በመሠረታዊ የማመዛዘን ሞዴላችን ላይ በተደረገ ዝመና ላይ ነው፣ ይህም በሶፍትዌር ምህንድስና፣ በሒሳብ፣ በምርምር እና በሌሎችም ላይ በወኪል ተግባራት ላይ የሰለጠነ ነው። GPT‑5.1‑Codex‑Max በእያንዳንዱ የእድገት ዑደት እርምጃ ላይ ፈጣን፣ የበለጠ የማሰብ ችሎታ ያለው እና የበለጠ የtoken-ውጤታማነት ያለው ነው–እና አስተማማኝ የኮድ አጋር ለመሆን አዲስ እርምጃ ነው።

GPT‑5.1‑Codex‑Max የተገነባው ለረጅም ጊዜ፣ ዝርዝር ሥራ ለማከናወን ነው። መጭመቅ ተብሎ በሚጠራው ሂደት አማካኝነት በበርካታ የአውድ መስኮቶች ላይ ለመሥራት በዋናነት የሰለጠነ የመጀመሪያው ሞዴላችን ነው፣ ይህም በአንድ ተግባር በሚሊዮኖች የሚቆጠሩ tokenዎችን በአንድላይ ይሠራል። ይህ የፕሮጀክት መጠን እድሳቶችን፣ ጥልቅ የማረም ክፍለ ጊዜዎችን እና የባለብዙ ሰዓታት ወኪል ክብ ዑደት ይከፍታል።

GPT‑5.1‑Codex‑Max ዛሬ በCodex ውስጥ ለCLI፣ ለIDE ቅጥያ፣ ለክላውድ እና ለኮድ ግምገማ ጥቅም ላይ ለመዋል ይገኛል፣ እና የAPI መዳረሻ በቅርቡ ይገኛል።

የድንበር ኮዲንግ አቅሞች

GPT‑5.1‑Codex‑Max በእውነተኛ ዓለም የሶፍትዌር ምህንድስና እንደ PR ፈጠራ፣ የኮድ ግምገማ፣ የፊት መጨረሻ ኮዲንግ እና ጥያቄ እና መልስ ባሉ ተግባራት ላይ የሰለጠነ ሲሆን፣ በብዙ የድንበር ኮድ ግምገማዎች ላይ የቀደሙ ሞዴሎቻችን ይበልጣል። ሞዴሉ በመመዘኛዎች ላይ ያገኘው ጥቅም በእውነተኛው ዓለም አጠቃቀም ላይ ከሚያመጣው መሻሻል ጋርም ይመጣል፦ GPT‑5.1‑Codex‑Max በWindows አካባቢዎች እንዲሠራ ያሰለጠነው የመጀመሪያው ሞዴል ነው፣ እናም የሞዴሉ ስልጠና አሁን በCodex CLI ውስጥ የተሻለ ተባባሪ ለማድረግ የተነደፉ ተግባራትን ያካትታል።

* ሁሉም ግምገማዎች በተጨማሪ ከፍተኛ የማመዛዘን ጥረት በመጭመቅ አማካኝነት ተካሂደዋል
* Terminal-Bench2.0 በCodex CLI አማካኝነት በLaude Institute Harbor ማሰሪያ⁠(በአዲስ መስኮት ውስጥ ይክፈታል) ውስጥ ተካሂዷል

ፍጥነት እና ወጪ

GPT‑5.1‑Codex‑Max የበለጠ ውጤታማ በሆነ ማመዛዘን ምክንያት በtoken ውጤታማነት ዙሪያ ከፍተኛ መሻሻል ያሳያል። በSWE-bench የተረጋገጠ ላይ፣ «መካከለኛ» የአስተሳሰብ ጥረት ያለው GPT‑5.1‑Codex‑Max ተመሳሳይ የማመዛዘን ጥረት ካለው ከGPT‑5.1‑Codex የተሻለ አፈጻጸም ያሳካል፣ ይህም 30% ጥቂት የማሰብ tokenዎችን በመጠቀም ነው። መዘግየት-የሚችሉ ተግባራትን በተመለከተ የተሻለ መልስ ለማግኘት ረዘም ላለ ጊዜ የሚያስብ አዲስ ተጨማሪ ከፍተኛ («xhigh») የማመዛዘን ጥረትን እያስተዋወቅን ነው። ለአብዛኛዎቹ ተግባራት አሁንም መካከለኛውን እንደ ዕለታዊ መሪ እንመክራለን።

የtoken ውጤታማነት ማሻሻያዎች ወደ ለአበልፃጊዎች የእውነተኛ ዓለም ቁጠባ ይመራሉ ብለን እንጠብቃለን።

ለምሳሌ፣ GPT‑5.1‑Codex‑Max በተመሳሳይ ተግባራዊነት እና ውበት ከፍተኛ ጥራት ያላቸውን የፊት መጨረሻ ንድፎች ማምረት ይችላል፣ ነገር ግን ከGPT‑5.1‑Codex በጣም በዝቅተኛ ዋጋ ነው።

ጥያቄ፦ ከcanvas ግራፊክስ፣ ከትንሽ የፖሊሲ ቅልመት ተቆጣጣሪ፣ ከመለኪያ እና ከSVG አውታረ መረብ ማሳያ ጋር መስተጋብራዊ የCartPole RL ሳንድቦክስ የሚያቀርብ አንድ ራሱን የቻለ የአሳሽ መተግበሪያ አመንጭ።

ባህሪያት

ሞዴል በካርት ፖል የተሻለ ለማድረግ ፖሊሲን በትክክል ማሰልጠን መቻል አለበት
ሞዴሉ በሚሰለጥንበት ወይም በማረጋገጫ ላይ በተመሰረተ ትንበያ ጊዜ ማንቃቶች/ክብደቶችን በምስል የሚያሳይ
በዚህ ክፍል ውስጥ ያሉ እርምጃዎች፣ በዚህ ክፍል ውስጥ ያሉ ሽልማቶች
የመጨረሻው የህልውና ጊዜ እና ምርጥ የህልውና ጊዜ በእርምጃዎች

ወደ index.html አስቀምጥ

ረጅም ጊዜ የሚሠሩ ተግባራት

መጭመቅ GPT‑5.1‑Codex‑Max እንደ ውስብስብ እድሳቶች እና ረጅም ጊዜ የሚሠራ ወኪል ክብ ዑደቶች ያሉ ቀደም ሲል ላይሳኩ ይችሉ የነበሩ ተግባራትን በአውድ መስኮት ገደቦች ምክንያት ታሪካቸውን በማጥበብ በጣም አስፈላጊውን አውድ ለረጅም ጊዜ በማቆየት እንዲያጠናቅቅ ያስችለዋል። በCodex መተግበሪያዎች ውስጥ፣ GPT‑5.1‑Codex‑Max የአውዱ የመስኮቱ ገደብ ላይ ሲቃረብ ክፍለ ጊዜውን በራስ-ሰር ያጥባል፣ ይህም አዲስ የአውድ መስኮት ይሰጠዋል። ተግባሩ እስኪጠናቀቅ ድረስ ይህን ሂደት ይደጋግማል።

በረጅም ጊዜ ላይ ወጥነት ያለው ሥራን የማቆየት ችሎታ ወደ ይበልጥ አጠቃላይ እና አስተማማኝ የሰው ሠራሽ አስተውሎት (AI) ሥርዓቶች በሚወስደው መንገድ ላይ መሰረታዊ አቅም ነው። GPT‑5.1‑Codex‑Max በአንድ ጊዜ ለሰዓታት በተናጥል መሥራት ይችላል። በውስጥ ግምገማችን ውስጥ፣ GPT‑5.1‑Codex‑Max ከ24 ሰዓታት በላይ ተግባራትን እንደሚሠራ ተመልክተናል። በአተገባበሩ ላይ ተደጋጋሚ ጥረቶችን በማካሄድ የሙከራ አለመሳካቶችን በማስተካከል በመጨረሻም ስኬታማ ውጤታማ ይሰጣል።

በዚህ ምሳሌ ውስጥ፣ GPT‑5.1‑Codex‑Max በራሱ የCodex CLI ክፍት ምንጭ የሆነ ማከማቻን በማደስ ላይ ነው።

የክፍለ ጊዜው ርዝመት ወደ ሞዴሉ አውድ-መስኮት ሲቃረብ፣ ያለማቋረጥ የሂደት እድገቱን ሳያጣ ተግባሩን ለመቀጠል እንዲረዳው ቦታን ለማስለቀቅ ክፍለ ጊዜውን በራስ-ሰር ይጨምቀዋል።

ቪዲዮው ለግልፅነት ተቆርጧል እና ተፋጥኗል።

ደኅንነታቸው የተጠበቀ እና ታማኝነት ያላቸው የሰው ሠራሽ አስተውሎት (AI) ወኪሎችን መገንባት

GPT‑5.1‑Codex‑Max ዘላቂ፣ የረጅም ጊዜ ማመዛዘንን በሚጠይቁ ግምገማዎች ላይ በከፍተኛ ደረጃ የተሻለ አፈጻጸም አለው። መጭመቅን በመጠቀም በበርካታ የአውድ መስኮቶች ላይ በወጥነት ሊሠራ ስለሚችል፣ ሞዴሉ እንደ ረጅም ጊዜ የሚወስድ ኮዲንግ እና የሳይበር ደኅንነት ባሉ አካባቢዎች ያሉ ተግዳሮቶችን በተመለከተ የተሻሉ ውጤቶችን ይሰጣል። የዚህን ሞዴል የአፈጻጸም ውጤቶች በGPT‑5.1‑Codex‑Max ውስጥ በመጀመሪያ እና በሦስተኛ ወገን ግምገማዎች ላይ ተንትነናል። የሥርዓት ካርድ⁠።

GPT‑5.1‑Codex‑Max በእኛ የዝግጁነት ማዕቀፍ ⁠መሰረት በሳይበር ደኅንነት ላይ ከፍተኛ አቅም ላይ አይደርስም ነገር ግን እስከዛሬ ድረስ ካሰማራነው በጣም አቅም ያለው የሳይበር ደኅንነት ሞዴል ሲሆን ወኪላዊ የሳይበር ደኅንነት አቅሞች በፍጥነት እየተሻሻሉ ናቸው። በዚህም ምክንያት፣ በሳይበር ደኅንነት ላይ ከፍተኛ አቅም ለማግኘት ለመዘጋጀት እርምጃዎችን እየወሰድን ሲሆን በሳይበር ጎራ ውስጥ ያሉትን ጥበቃዎች እያጠናከርን ነው እና እንደ Aardvark⁠ ባሉ ፕሮግራሞች አማካኝነት ተከላካዮች ከእነዚህ የተሻሻሉ አቅሞች ተጠቃሚ እንዲሆኑ ለማድረግ እየሠራን ነው።

GPT‑5‑Codexን ስንጀምር፣ ተንኮል አዘል እንቅስቃሴን ለመለየት እና ለማቋረጥ የሳይበር ደኅንነት ላይ ያተኮረ ክትትል ተግባራዊ አድርገናል። መጠነ ሰፊ የሆኑ አላግባብ መጠቀሞች ላይ ትርጉም ያለው ጭማሪ ባናስተውልም፣ ለላቁ አቅሞች ተጨማሪ ቅነሳዎችን እያዘጋጀን ነው። ቡድኖቻችን ሞዴሎቻችንን አለአግባብ ለመጠቀም የሚሞክሩ የሳይበር ኦፕሬሽኖችን አስቀድመው አቋርጠዋል⁠፣ እና አጠራጣሪ እንቅስቃሴዎችም በፖሊሲ ክትትል ሥርዓታችን አማካኝነት እንዲገመገሙ ተደርገዋል።

Codex በነባሪነት ደኅንነቱ በተጠበቀ ሳንድቦክስ ውስጥ እንዲሰራ የተነደፈ ነው፦ የፋይል ጽሑፎች በስራ ቦታው ላይ የተወሰኑ ናቸው፣ እናም አበልፃጊ ካላበራው በስተቀር የአውታረ መረብ መዳረሻ ተሰናክሏል። Codexን በዚህ የተገደበ የመዳረሻ ሁነታ ውስጥ እንዲቆይ እንመክራለን፣ ምክንያቱም የበይነመረብ ወይም ድር ፍለጋን ማንቃት ከማይታመን ይዘት የእርምጃ ግቤት⁠ ስጋቶችን ሊያስተዋውቅ ይችላል።

Codex የረጅም ጊዜ ተግባራትን ለመሥራት የበለጠ አቅም እያገኘ ሲሆን ለአበልፃጊዎች ለውጦችን ከማድረጋቸው ወይም ወደ ምርት ከማሰማራታቸው በፊት የወኪሉን ሥራ መገምገም በጣም አስፈላጊ ነው። በዚህ ረገድ ለመርዳት፣ Codex ተርሚናል መዝገቦችን ያዘጋጃል እንዲሁም የመሣሪያ ጥሪዎቹን እና የፈተና ውጤቶቹን ይጠቅሳል። የኮድ ግምገማዎቹ የሞዴል ወይም በሰው የተፈጠሩ ስህተቶችን ወደ ምርት የማሰማራት ስጋትን የሚቀንሱ ቢሆንም፣ Codex እንደ ተጨማሪ ገምጋሚ መታየት አለበት እንጂ የሰው ግምገማዎችን መተካት የለበትም።

የሳይበር ደኅንነት አቅሞች ለሁለቱም ለመከላከያ እና ለጥቃት ጥቅም ላይ ሊውሉ ይችላሉ፣ ስለዚህ እኛ ተደጋጋሚ የማሰማራት አካሄድ እንወስዳለን፦ ከእውነተኛ ዓለም አጠቃቀም መማር፣ መከላከያዎችን ማዘመን እና አስፈላጊ የመከላከያ መሣሪያዎችን እንደ ራስ-ሰር የተጋላጭነት ቅኝት እና የማስተካከል እርዳታን መጠበቅ።

ተገኝነት

GPT‑5.1‑Codex‑Max በCodex ውስጥ በChatGPT Plus፣ Pro፣ Business፣ Edu እና Enterprise እቅዶች ይገኛል። የአጠቃቀም ገደቦች ለእቅድዎ እንዴት እንደሚሠሩ ዝርዝር መረጃ ለማግኘት፣ እባክዎ የእኛን ሰነዶች⁠(በአዲስ መስኮት ውስጥ ይክፈታል) ይመልከቱ።

በAPI ቁልፍ በኩል Codex CLIን ለሚጠቀሙ አበልፃጊዎች፣ GPT‑5.1‑Codex‑Maxን ለማዘጋጀት አቅደናል ይህም በቅርቡ በAPI ውስጥ ይገኛል።

ከዛሬ ጀምሮ፣ GPT‑5.1‑Codex‑Max ላይ እንደ ነባሪ ሞዴል በCodex ገጽታዎች ላይ GPT‑5.1‑Codexን ይተካል። የአጠቃላይ ዓላማ ሞዴል ከሆነው ከGPT‑5.1 በተለየ መልኩ GPT‑5.1‑Codex‑Max እና የሞዴሎችን የCodex ቤተሰብ በCodex ወይም በCodex መሰል አካባቢዎች ውስጥ ለወኪላዊ የኮድ ተግባራት ብቻ እንዲጠቀሙ እንመክራለን።

መደምደሚያ

GPT‑5.1‑Codex‑Max ሞዴሎች የረጅም ጊዜ የኮድ ተግባራትን በዘላቂነት በማቆየት፣ ውስብስብ የሥራ ፍሰቶችን በማስተዳደር እና ከፍተኛ ጥራት ያላቸውን ትግበራዎች በጥቂት tokenዎች በማምረት ምን ያህል እንደመጡ ያሳያል። ሞዴሉ ከቋሚ ማሻሻያዎች ጋር ከCLI፣ ከIDE ቅጥያ፣ ከክላውድ ውህደት እና ከኮድ ግምገማ መሣሪያዎቻችን ጋር በመዋሃድ እጅግ የላቀ የምህንድስና ምርታማነት ሲያስገኝ ተመልክተናል፦ በውስጣዊ ሁኔታ 95% የሚሆኑት የOpenAI መሀንዲሶች Codexን በየሳምንቱ ይጠቀማሉ፣ እና እነዚህ መሀንዲሶች ኮዴክስን ከተቀበሉበት ጊዜ አንስቶ ወደ 70% የሚጠጉ ተጨማሪ የማዋሃድ ጥያቄዎችን ይልካሉ። ወኪሎች ማድረግ የሚችሉትን ድንበር በማስፋት ስንገፋ፣ እርስዎ ከእነሱ ጋር ምን እንደሚገነቡ ለማየት ጓጉተናል።

አባሪ፦ ሞዴል ግምገማዎች

	GPT‑5.1‑Codex (ከፍተኛ)	GPT‑5.1‑Codex‑Max (xhigh)
SWE-bench የተረጋገጠ (n=500)	73.7%	77.9%
SWE-Lancer IC SWE	66.3%	79.9%
Terminal-Bench 2.0	52.8%	58.1%

ደራሲ

OpenAI

ማንበብዎን ይቀጥሉ

ሁሉንም ይመልከቱ

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 አሁን በMicrosoft 365 Copilot ተመራጭ ሞዴል ሆኗል

ምርትጁላይ 9 2026

GPT-5.6፦ ከፍላጎትዎ ጋር የሚዛመድ ግንባር ቀደም አስተውሎት

ምርትጁላይ 9 2026

ChatGPT አሁን በጣም ትልቅ ተስፋ ላለው ሥራዎ አጋር ነው

ምርትጁላይ 9 2026