പ്രധാന ഉള്ളടക്കത്തിലേക്ക് നീങ്ങുക
OpenAI

2025 നവംബർ 19

Productവിടുതൽ

GPT‑5.1‑Codex‑Max ഉപയോഗിച്ച് കൂടുതൽ നിർമ്മാണം

$ npm i -g @openai/codex
ലോഡിംഗ്…

ആമുഖം

ഞങ്ങൾ GPT‑5.1‑Codex‑Max അവതരിപ്പിക്കുന്നു, ഞങ്ങളുടെ പുതിയ ഫ്രോണ്ടിയർ ഏജന്റിക് കോഡിംഗ് മോഡൽ, ഇന്ന് Codex-ൽ ലഭ്യമാണ്.  സോഫ്റ്റ്വെയർ എഞ്ചിനീയറിംഗ്, ഗണിതം, ഗവേഷണം എന്നിവയിലും അതിലേറെയും ഏജന്റിക് ടാസ്കുകളിൽ പരിശീലനം നേടിയ ഞങ്ങളുടെ അടിസ്ഥാന യുക്തി മോഡലിലേക്കുള്ള ഒരു അപ്ഡേറ്റിലാണ് GPT‑5.1‑Codex‑Max നിർമ്മിച്ചിരിക്കുന്നത്. വികസന ചക്രത്തിന്റെ ഓരോ ഘട്ടത്തിലും GPT‑5.1‑Codex‑Max വേഗതയേറിയതും കൂടുതൽ ബുദ്ധിപരവുമായും കൂടുതൽ token കാര്യക്ഷമവുമായും ആണ് - കൂടാതെ വിശ്വസനീയമായ കോഡിംഗ് പങ്കാളിയാകുന്നതിനുള്ള ഒരു പുതിയ ചുവടുവയ്പ്പാണ്.

GPT‑5.1‑Codex‑Max ദീർഘകാലം നീണ്ടുനിൽക്കുന്ന, വിശദമായ ജോലികൾക്കായി രൂപകൽപ്പന ചെയ്തിരിക്കുന്നു. കോംപാക്ഷൻ എന്ന പ്രക്രിയയിലൂടെ ഒന്നിലധികം സന്ദർഭ വിൻഡോകളിൽ പ്രവർത്തിക്കാൻ തദ്ദേശീയമായി പരിശീലനം ലഭിച്ച ഞങ്ങളുടെ ആദ്യത്തെ മോഡലാണിത്, ഒരൊറ്റ ടാസ്കിൽ ദശലക്ഷക്കണക്കിന് tokenകളിൽ സ്ഥിരതയോടെ പ്രവർത്തിക്കുന്നു. ഇത് പദ്ധതി-തലത്തിലുള്ള റിഫാക്ടറുകൾ, ആഴത്തിലുള്ള ഡീബഗ്ഗിംഗ് സെഷനുകൾ, മൾട്ടി-മണിക്കൂർ ഏജൻ്റ് ലൂപ്പുകൾ എന്നിവ തുറക്കുന്നു.

GPT‑5.1‑Codex‑Max ഇന്ന് CLI, IDE വിപുലീകരണം, ക്ലൗഡ്, കോഡ് അവലോകനം എന്നിവയിൽ ഉപയോഗിക്കുന്നതിന് കോഡെക്സിൽ ലഭ്യമാണ്, കൂടാതെ API ആക്സസ് ഉടൻ ലഭ്യമാകും.

ഫ്രോണ്ടിയർ കോഡിംഗ് കഴിവുകൾ

GPT‑5.1‑Codex‑Max യഥാർത്ഥ ലോക സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയറിംഗ് ടാസ്കുകളിൽ, ഉദാഹരണത്തിന് PR സൃഷ്ടിക്കൽ, കോഡ് അവലോകനം, ഫ്രണ്ട്‌എൻഡ് കോഡിംഗ്, ചോദ്യോത്തരങ്ങൾ എന്നിവയിൽ പരിശീലനം നേടിയിട്ടുണ്ട്, കൂടാതെ നിരവധി ഫ്രണ്ടിയർ കോഡിംഗ് വിലയിരുത്തലുകളിൽ ഞങ്ങളുടെ മുൻ മോഡലുകളെ മറികടക്കുന്നു. ബെഞ്ച്മാർക്കുകളിൽ മോഡലിന്റെ നേട്ടങ്ങൾ യഥാർത്ഥ ലോക ഉപയോഗത്തിൽ മെച്ചപ്പെടുത്തലുകളുമായി കൂടിയിരിക്കുന്നു: വിൻഡോസ് പരിതസ്ഥിതികളിൽ പ്രവർത്തിക്കാൻ ഞങ്ങൾ പരിശീലിപ്പിച്ച ആദ്യത്തെ മോഡലാണ് GPT‑5.1‑Codex‑Max, കോഡെക്സ് CLI-യിൽ മികച്ച സഹകരണം നൽകാൻ രൂപകൽപ്പന ചെയ്ത ടാസ്കുകൾ ഇപ്പോൾ മോഡലിന്റെ പരിശീലനത്തിൽ ഉൾപ്പെടുന്നു.

* എല്ലാ മൂല്യനിർണ്ണയങ്ങളും എക്സ്ട്രാ ഹൈ റീസണിംഗ് ശ്രമത്തിൽ കോംപാക്ഷൻ പ്രവർത്തന സജ്ജമാക്കിയ നിലയിൽ പ്രവർത്തിപ്പിച്ചു
* ടെർമിനൽ-ബെഞ്ച് 2.0
ലോഡ് ഇൻസ്റ്റിറ്റ്യൂട്ട് ഹാർബർ ഹാർനെസിൽ(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു)കോഡെക്സ് CLI ഉപയോഗിച്ച് പ്രവർത്തിച്ചു

വേഗതയും ചെലവും

GPT‑5.1‑Codex‑Max കൂടുതൽ ഫലപ്രദമായ യുക്തി കാരണം token കാര്യക്ഷമതയിൽ ഗണ്യമായ പുരോഗതി കാണിക്കുന്നു. SWE-ബെഞ്ച് സ്ഥിരീകരിച്ച, GPT‑5.1‑കോഡെക്സ്‑മാക്സ് 'മീഡിയം' റീസണിംഗ് ശ്രമത്തിൽ GPT‑5.1‑കോഡെക്സിനേക്കാൾ മികച്ച പ്രകടനം കാഴ്ചവെക്കുന്നു അതേ യുക്തിസഹമായ ശ്രമം ഉപയോഗിച്ച്, 30% കുറവ് ചിന്താ token-കൾ ഉപയോഗിക്കുമ്പോൾ. ലേറ്റൻസി-സെൻസിറ്റീവ് അല്ലാത്ത ടാസ്കുകൾക്കായി, ഞങ്ങൾ ഒരു പുതിയ എക്സ്ട്രാ ഹൈ ('xhigh') യുക്തിവാദ ശ്രമം അവതരിപ്പിക്കുന്നു, ഇത് മികച്ച ഉത്തരത്തിനായി കൂടുതൽ സമയത്തേക്ക് ചിന്തിക്കുന്നു. മിക്ക ടാസ്കുകൾക്കും ദൈനംദിന ഡ്രൈവറായി ഞങ്ങൾ ഇപ്പോഴും മധ്യനിര ശുപാർശ ചെയ്യുന്നു.

token കാര്യക്ഷമത മെച്ചപ്പെടുത്തലുകൾ ഡെവലപ്പർമാർക്ക് യഥാർത്ഥ ലോകത്തിൽ സമ്പാദ്യങ്ങൾ ഉണ്ടാക്കുമെന്ന് ഞങ്ങൾ പ്രതീക്ഷിക്കുന്നു.

ഉദാഹരണത്തിന്, GPT‑5.1‑Codex‑Max‑ന് സമാനമായ പ്രവർത്തനക്ഷമതയും സൗന്ദര്യശാസ്ത്രവുമുള്ള ഉയർന്ന നിലവാരമുള്ള ഫ്രണ്ട് എൻഡ് ഡിസൈനുകൾ നിർമ്മിക്കാൻ കഴിയും, പക്ഷേ GPT‑5.1‑Codex‑നേക്കാൾ വളരെ കുറഞ്ഞ ചെലവിൽ.

പ്രോംപ്റ്റ്: canvas ഗ്രാഫിക്‌സ്, ഒരു ചെറിയ പോളിസി-ഗ്രേഡിയൻ്റ് കൺട്രോളർ, മെട്രിക്‌സ്, ഒരു SVG നെറ്റ്‌വർക്ക് വിഷ്വലൈസർ എന്നിവയ്‌ക്കൊപ്പം ഒരു ഇൻ്ററാക്റ്റീവ് CartPole RL സാൻഡ്‌ബോക്‌സ് റെൻഡർ ചെയ്യുന്ന ഒരു സ്വയം ഉൾക്കൊള്ളുന്ന ബ്രൗസർ ആപ്പ് സൃഷ്‌ടിക്കുക.

സവിശേഷതകൾ

  • കാർട്ട് പോളിൽ മോഡൽ മെച്ചപ്പെടുത്താൻ ഒരു നയം യഥാർത്ഥത്തിൽ ട്രെയിൻ ചെയ്യാൻ കഴിയണം
  • മോഡൽ പരിശീലനം നടത്തുമ്പോഴോ അനുമാനത്തിലായിരിക്കുമ്പോഴോ ആക്റ്റിവേഷനുകൾ/ഭാരങ്ങൾക്കായുള്ള ദൃശ്യവൽക്കരണ ഉപകരണം
  • എപ്പിസോഡിലെ ഘട്ടങ്ങൾ, ഈ എപ്പിസോഡിലെ പ്രതിഫലങ്ങൾ
  • അവസാനത്തെ അതിജീവന സമയവും ഘട്ടങ്ങളിലെ ഏറ്റവും മികച്ച അതിജീവന സമയവും

index.html എന്നതിലേക്ക് സംരക്ഷിക്കുക

ദീർഘകാലം പ്രവർത്തിക്കുന്ന ടാസ്കുകൾ

സങ്കീർണ്ണമായ റിഫാക്ടറുകൾ, ദീർഘകാലമായി പ്രവർത്തിക്കുന്ന ഏജൻ്റ് ലൂപ്പുകൾ എന്നിവ പോലുള്ള സന്ദർഭ-വിൻഡോ പരിധികൾ കാരണം മുമ്പ് പരാജയപ്പെട്ട ടാസ്കുകൾ പൂർത്തിയാക്കാൻ പ്രവർത്തന സജ്ജമാക്കുക GPT‑5.1‑Codex‑Max നെ പ്രാപ്തമാക്കുന്നു, അതിന്റെ ചരിത്രം ചുരുക്കിക്കൊണ്ട് ദീർഘകാല സന്ദർഭം സംരക്ഷിക്കുന്നു. കോഡെക്സ് ആപ്ലിക്കേഷനുകളിൽ, GPT‑5.1‑Codex‑Max അത് അതിന്റെ സന്ദർഭ വിൻഡോ പരിധിയെ സമീപിക്കുമ്പോൾ, അതിന്റെ സെഷൻ യാന്ത്രികമായി കോംപാക്റ്റ് ചെയ്യുന്നു, അതിനാൽ അത് ഒരു പുതിയ സന്ദർഭ വിൻഡോ നൽകുന്നു. ടാസ്ക് പൂർത്തിയാകുന്നതുവരെ ഈ പ്രക്രിയ ആവർത്തിക്കപ്പെടുന്നു.

കൂടുതൽ പൊതുവായതും വിശ്വസനീയവുമായ AI സിസ്റ്റങ്ങളിലേക്കുള്ള പാതയിലെ ഒരു അടിസ്ഥാന കഴിവാണ് ദീർഘകാലങ്ങളിൽ സുസ്ഥിരമായ പ്രവർത്തനം നിലനിർത്താനുള്ള കഴിവ്. GPT‑5.1‑Codex‑Max ഒരു സമയം മണിക്കൂറുകളോളം സ്വതന്ത്രമായി പ്രവർത്തിക്കാൻ കഴിയും. ഞങ്ങളുടെ ആന്തരിക വിലയിരുത്തലുകളിൽ, ഞങ്ങൾ GPT‑5.1‑Codex‑Max നിരീക്ഷിച്ചു 24 മണിക്കൂറിൽ കൂടുതൽ ടാസ്കുകളിൽ പ്രവർത്തിക്കുക. അത് നടപ്പിലാക്കലിൽ നിരന്തരം ആവർത്തിക്കുകയും, പരീക്ഷണ പരാജയങ്ങൾ പരിഹരിക്കുകയും, ഒടുവിൽ വിജയകരമായ ഫലം നൽകുകയും ചെയ്യും.

ഈ ഉദാഹരണത്തിൽ, GPT‑5.1‑Codex‑Max Codex CLI ഓപ്പൺ സോഴ്‌സ് റിപ്പോസിറ്ററിയെ സ്വതന്ത്രമായി പുനഃസംഘടിപ്പിക്കുന്നു.

സെഷൻ ദൈർഘ്യം മോഡലിന്റെ സന്ദർഭം-വിൻഡോയിലേക്ക് അടുക്കുമ്പോൾ, ടാസ്ക് പുരോഗതി നഷ്ടപ്പെടാതെ തുടരാൻ ഇടം ഒഴിവാക്കാൻ സെഷൻ സ്വയം ഒതുക്കുന്നു.

വ്യക്തതയ്ക്കായി വീഡിയോ വെട്ടിച്ചുരുക്കി വേഗത്തിലാക്കിയിരിക്കുന്നു.

സുരക്ഷിതവും വിശ്വസനീയവുമായ എഐ ഏജൻ്റ്കൾ സൃഷ്ടിക്കൽ

GPT‑5.1‑Codex‑Max ദീർഘകാലവും സുസ്ഥിരവുമായ യുക്തി ആവശ്യമായ വിലയിരുത്തലുകളിൽ ഗണ്യമായി മികച്ച പ്രകടനം കാഴ്ചവയ്ക്കുന്നു. കോംപാക്ഷൻ ഉപയോഗിച്ച് ഒന്നിലധികം സന്ദർഭങ്ങൾ വിൻഡോകളിൽ യോജിച്ച രീതിയിൽ പ്രവർത്തിക്കാൻ കഴിയുന്നതിനാൽ, ദീർഘകാല കോഡിംഗ്, സൈബർസുരക്ഷ എന്നിവയുൾപ്പെടെയുള്ള മേഖലകളിലെ വെല്ലുവിളികളിൽ മോഡൽ മെച്ചപ്പെട്ട ഫലങ്ങൾ നൽകുന്നു. ഞങ്ങൾ GPT‑5.1‑Codex‑Max‑ൽ ഒന്നാം കക്ഷിയുടെയും മൂന്നാം കക്ഷിയുടെയും വിലയിരുത്തലുകളിൽ ഈ മോഡലിന്റെ പ്രകടന ഫലങ്ങൾ വിശകലനം ചെയ്തു സിസ്റ്റം കാർഡ്.

GPT‑5.1‑Codex‑Max ഞങ്ങളുടെ തയ്യാറെടുപ്പ് ചട്ടക്കൂടിന് കീഴിൽ സൈബർസുരക്ഷയിൽ ഉയർന്ന ശേഷി കൈവരിച്ചിട്ടില്ല, പക്ഷേ ഇതുവരെ ഞങ്ങൾ വിന്യസിച്ചിട്ടുള്ളതിൽ ഏറ്റവും കഴിവുള്ള സൈബർസുരക്ഷാ മോഡലാണിത്, കൂടാതെ ഏജന്റിക് സൈബർസുരക്ഷാ കഴിവുകൾ അതിവേഗം വികസിച്ചുകൊണ്ടിരിക്കുന്നു. ഫലമായി, സൈബർ സുരക്ഷയിൽ ഉയർന്ന ശേഷിക്കായി തയ്യാറെടുക്കുന്നതിനുള്ള നടപടികൾ ഞങ്ങൾ സ്വീകരിക്കുകയും സൈബർ ഡൊമെയ്നിൽ ഞങ്ങളുടെ സുരക്ഷാ സംവിധാനങ്ങൾ മെച്ചപ്പെടുത്തുകയും ആർഡ്‌വാർക്ക് പോലുള്ള പ്രോഗ്രാമുകൾ വഴി പ്രതിരോധക്കാർക്ക് ഈ മെച്ചപ്പെട്ട കഴിവുകളിൽ നിന്ന് പ്രയോജനം നേടാൻ പ്രവർത്തിക്കുകയും ചെയ്യുന്നു.

ഞങ്ങൾ GPT‑5‑Codex ആരംഭിച്ചപ്പോൾ, ദുഷ്ട പ്രവർത്തനങ്ങൾ കണ്ടെത്തുന്നതിനും തടസ്സപ്പെടുത്തുന്നതിനായി സമർപ്പിത സൈബർ സുരക്ഷാ-നിർദ്ദിഷ്ട നിരീക്ഷണം നടപ്പിലാക്കി. സ്കെയിൽ ചെയ്ത ദുരുപയോഗത്തിൽ അർത്ഥവത്തായ വർദ്ധനവ് ഞങ്ങൾ കണ്ടിട്ടില്ലെങ്കിലും, വിപുലമായ കഴിവുകൾക്കായി കൂടുതൽ പ്രതിരോധങ്ങൾ ഞങ്ങൾ തയ്യാറാക്കുകയാണ്. ഞങ്ങളുടെ മോഡലുകൾ ദുരുപയോഗം ചെയ്യാൻ ശ്രമിക്കുന്ന സൈബർ പ്രവർത്തനങ്ങൾ ഞങ്ങളുടെ ടീമുകൾ ഇതിനകം തടസ്സപ്പെടുത്തിയിട്ടുണ്ട്, കൂടാതെ സംശയാസ്‌പദമായ പ്രവർത്തനങ്ങൾ ഞങ്ങളുടെ നയ നിരീക്ഷണ സംവിധാനങ്ങൾ വഴി അവലോകനത്തിനായി വഴി തിരിച്ചു വിടുന്നു.

കോഡെക്‌സ് ഡിഫോൾട്ട് ആയി സുരക്ഷിതമായ ഒരു സാൻഡ്‌ബോക്‌സിൽ പ്രവർത്തിക്കുന്നതിനായി രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്നു: ഫയൽ എഴുത്തുകൾ അതിന്റെ വർക്ക്‌സ്‌പേസ്‌നു പരിമിതമാണ്, കൂടാതെ ഒരു ഡെവലപ്പർ അത് ഓണാക്കിയില്ലെങ്കിൽ നെറ്റ്‌വർക്ക് ആക്‌സസ് പ്രവർത്തനരഹിതമാക്കിയിരിക്കുന്നു. ഇന്റർനെറ്റ് അല്ലെങ്കിൽ വെബ് തിരയൽ പ്രാപ്തമാക്കുന്നത് വിശ്വസനീയമല്ലാത്ത ഉള്ളടക്കത്തിൽ നിന്ന് പ്രോംപ്റ്റ്-ഇൻജക്ഷൻ അപകടസാധ്യതകൾക്ക് കാരണമാകുമെന്നതിനാൽ, കോഡെക്സ് ഈ നിയന്ത്രിത-ആക്സസ് മോഡിൽ നിലനിർത്താൻ ഞങ്ങൾ ശുപാർശ ചെയ്യുന്നു.

കോഡെക്സ് ദീർഘകാല ടാസ്കുകൾ ചെയ്യാൻ കൂടുതൽ പ്രാപ്തമാകുന്നതോടെ, ഡെവലപ്പർമാർ മാറ്റങ്ങൾ വരുത്തുന്നതിനോ ഉൽപ്പാദനത്തിലേക്ക് വിന്യസിക്കുന്നതിനോ മുമ്പ് ഏജൻ്റിന്റെ പ്രവർത്തനം അവലോകനം ചെയ്യുന്നത് കൂടുതൽ പ്രധാനമാണ്. ഇതിനെ സഹായിക്കുന്നതിനായി, Codex ടെർമിനൽ ലോഗുകൾ നിർമ്മിക്കുകയും അതിന്റെ ടൂൾ കോളുകളും പരിശോധനാ ഫലങ്ങളും ഉദ്ധരിക്കുകയും ചെയ്യുന്നു. ഇതിന്റെ കോഡ് അവലോകനങ്ങൾ മോഡൽ അല്ലെങ്കിൽ മനുഷ്യ നിർമ്മിത ബഗുകൾ ഉൽ‌പാദനത്തിലേക്ക് വിന്യസിക്കുന്നതിനുള്ള അപകടസാധ്യത കുറയ്ക്കുമ്പോൾ, കോഡെക്സിനെ ഒരു അധിക അവലോകനനായി കണക്കാക്കണം, മനുഷ്യ അവലോകനങ്ങൾക്ക് പകരമായിട്ടല്ല.

സൈബർ സുരക്ഷാ കഴിവുകൾ പ്രതിരോധത്തിനും ആക്രമണത്തിനും ഉപയോഗിക്കാം, അതിനാൽ ഞങ്ങൾ ആവർത്തിച്ചുള്ള വിന്യാസ സമീപനം സ്വീകരിക്കുന്നു: യഥാർത്ഥ ലോക ഉപയോഗത്തിൽ നിന്ന് പഠിക്കുന്നു, സുരക്ഷാ മാർഗങ്ങൾ പുതുക്കുന്നു, ഓട്ടോമേറ്റഡ് വൾനറബിലിറ്റി സ്കാനിംഗ്, പരിഹാര സഹായം പോലുള്ള പ്രധാനപ്പെട്ട പ്രതിരോധ ഉപകരണങ്ങൾ സംരക്ഷിക്കുന്നു.

ലഭ്യത

GPT‑5.1‑Codex‑Max Codex-ൽ ChatGPT Plus, Pro, Business, Edu, Enterprise പദ്ധതികളിൽ ലഭ്യമാണ്. നിങ്ങളുടെ പദ്ധതിയിലെ ഉപയോഗ പരിധികൾ എങ്ങനെ പ്രവർത്തിക്കുന്നു എന്നതിനെക്കുറിച്ചുള്ള വിശദാംശങ്ങൾക്ക്, ദയവായി ഞങ്ങളുടെ ഡോക്യുമെന്റേഷൻ(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) കാണുക.

API കീ വഴി Codex CLI ഉപയോഗിക്കുന്ന ഡെവലപ്പർമാർക്കായി, GPT‑5.1‑Codex‑Max ലഭ്യമാക്കാൻ ഞങ്ങൾ പദ്ധതിയിടുന്നു API-യിൽ ഉടൻ ലഭ്യമാകും.

ഇന്ന് മുതൽ, കോഡെക്സ് പ്രതലങ്ങളിൽ GPT‑5.1‑Codex‑നെ GPT‑5.1‑Codex‑Max മാറ്റിസ്ഥാപിച്ച് ഡിഫോൾട്ട് മോഡലായി ഇരിക്കും. സാധാരണ ഉപയോഗത്തിനുള്ള മോഡലായ GPT‑5.1‑ൽ നിന്ന് വ്യത്യസ്തമായി, ഞങ്ങൾ GPT‑5.1‑Codex‑Max ഉപയോഗിക്കാൻ ശുപാർശ ചെയ്യുന്നു കോഡെക്സ് അല്ലെങ്കിൽ കോഡെക്സ് പോലുള്ള പരിതസ്ഥിതികളിൽ ഏജന്റിക് കോഡിംഗ് ടാസ്കുകൾക്കായി മാത്രം കോഡെക്സ് മോഡൽ കുടുംബം.

തീരുമാനം

GPT‑5.1‑Codex‑Max മോഡലുകൾ ലോംഗ്-ഹൊറൈസൺ കോഡിംഗ് ടാസ്കുകൾ നിലനിർത്തുന്നതിലും, സങ്കീർണ്ണമായ പ്രവൃത്തി പ്രവാഹങ്ങൾ കൈകാര്യം ചെയ്യുന്നതിലും, വളരെ കുറച്ച് token ഉപയോഗിച്ച് ഉയർന്ന നിലവാരമുള്ള നടപ്പാക്കലുകൾ നിർമ്മിക്കുന്നതിലും എത്രത്തോളം മുന്നേറിയെന്ന് കാണിക്കുന്നു. ഞങ്ങളുടെ CLI, IDE എക്സ്റ്റൻഷൻ, ക്ലൗഡ് ഇന്റഗ്രേഷൻ, കോഡ് റിവ്യൂ ടൂളിംഗ് എന്നിവയിലേക്കുള്ള സ്ഥിരമായ അപ്‌ഗ്രേഡുകളുമായി ഈ മോഡൽ സംയോജിപ്പിച്ചപ്പോൾ, ഞങ്ങൾ സൂപ്പർചാർജ്ഡ് എഞ്ചിനീയറിംഗ് ഉൽപ്പാദനക്ഷമത കൈവരിച്ചു: ആന്തരികമായി, 95% OpenAI എഞ്ചിനീയർമാരും ആഴ്ചതോറും കോഡെക്സ് ഉപയോഗിക്കുന്നു, കൂടാതെ ഈ എഞ്ചിനീയർമാർ കോഡെക്സ് സ്വീകരിച്ചതിനുശേഷം ഏകദേശം 70% കൂടുതൽ പുൾ അഭ്യർത്ഥനകൾ അയയ്ക്കുന്നു. ഏജൻ്റുകൾക്ക് ചെയ്യാൻ കഴിയുന്ന കാര്യങ്ങളുടെ അതിർത്തി ഞങ്ങൾ മുന്നോട്ട് കൊണ്ടുപോകുമ്പോൾ, നിങ്ങൾ അവരുമായി എന്താണ് നിർമ്മിക്കുന്നതെന്ന് കാണാൻ ഞങ്ങൾ ആവേശത്തിലാണ്.

അനുബന്ധം: മോഡൽ മൂല്യനിർണ്ണയങ്ങൾ

GPT‑5.1‑Codex (ഉയർന്നത്)

GPT‑5.1‑കോഡെക്സ്‑മാക്സ് (xhigh)

SWE-ബെഞ്ച് സ്ഥിരീകരിച്ചത് (n=500)

73.7%

77.9%

SWE-Lancer IC SWE

66.3%

79.9%

Terminal-Bench 2.0

52.8%

58.1%

രചയിതാവ്

OpenAI