ഞങ്ങൾ GPT‑5.1‑Codex‑Max അവതരിപ്പിക്കുന്നു, ഞങ്ങളുടെ പുതിയ ഫ്രോണ്ടിയർ ഏജന്റിക് കോഡിംഗ് മോഡൽ, ഇന്ന് Codex-ൽ ലഭ്യമാണ്. സോഫ്റ്റ്വെയർ എഞ്ചിനീയറിംഗ്, ഗണിതം, ഗവേഷണം എന്നിവയിലും അതിലേറെയും ഏജന്റിക് ടാസ്കുകളിൽ പരിശീലനം നേടിയ ഞങ്ങളുടെ അടിസ്ഥാന യുക്തി മോഡലിലേക്കുള്ള ഒരു അപ്ഡേറ്റിലാണ് GPT‑5.1‑Codex‑Max നിർമ്മിച്ചിരിക്കുന്നത്. വികസന ചക്രത്തിന്റെ ഓരോ ഘട്ടത്തിലും GPT‑5.1‑Codex‑Max വേഗതയേറിയതും കൂടുതൽ ബുദ്ധിപരവുമായും കൂടുതൽ token കാര്യക്ഷമവുമായും ആണ് - കൂടാതെ വിശ്വസനീയമായ കോഡിംഗ് പങ്കാളിയാകുന്നതിനുള്ള ഒരു പുതിയ ചുവടുവയ്പ്പാണ്.
GPT‑5.1‑Codex‑Max ദീർഘകാലം നീണ്ടുനിൽക്കുന്ന, വിശദമായ ജോലികൾക്കായി രൂപകൽപ്പന ചെയ്തിരിക്കുന്നു. കോംപാക്ഷൻ എന്ന പ്രക്രിയയിലൂടെ ഒന്നിലധികം സന്ദർഭ വിൻഡോകളിൽ പ്രവർത്തിക്കാൻ തദ്ദേശീയമായി പരിശീലനം ലഭിച്ച ഞങ്ങളുടെ ആദ്യത്തെ മോഡലാണിത്, ഒരൊറ്റ ടാസ്കിൽ ദശലക്ഷക്കണക്കിന് tokenകളിൽ സ്ഥിരതയോടെ പ്രവർത്തിക്കുന്നു. ഇത് പദ്ധതി-തലത്തിലുള്ള റിഫാക്ടറുകൾ, ആഴത്തിലുള്ള ഡീബഗ്ഗിംഗ് സെഷനുകൾ, മൾട്ടി-മണിക്കൂർ ഏജൻ്റ് ലൂപ്പുകൾ എന്നിവ തുറക്കുന്നു.
GPT‑5.1‑Codex‑Max ഇന്ന് CLI, IDE വിപുലീകരണം, ക്ലൗഡ്, കോഡ് അവലോകനം എന്നിവയിൽ ഉപയോഗിക്കുന്നതിന് കോഡെക്സിൽ ലഭ്യമാണ്, കൂടാതെ API ആക്സസ് ഉടൻ ലഭ്യമാകും.
GPT‑5.1‑Codex‑Max യഥാർത്ഥ ലോക സോഫ്റ്റ്വെയർ എഞ്ചിനീയറിംഗ് ടാസ്കുകളിൽ, ഉദാഹരണത്തിന് PR സൃഷ്ടിക്കൽ, കോഡ് അവലോകനം, ഫ്രണ്ട്എൻഡ് കോഡിംഗ്, ചോദ്യോത്തരങ്ങൾ എന്നിവയിൽ പരിശീലനം നേടിയിട്ടുണ്ട്, കൂടാതെ നിരവധി ഫ്രണ്ടിയർ കോഡിംഗ് വിലയിരുത്തലുകളിൽ ഞങ്ങളുടെ മുൻ മോഡലുകളെ മറികടക്കുന്നു. ബെഞ്ച്മാർക്കുകളിൽ മോഡലിന്റെ നേട്ടങ്ങൾ യഥാർത്ഥ ലോക ഉപയോഗത്തിൽ മെച്ചപ്പെടുത്തലുകളുമായി കൂടിയിരിക്കുന്നു: വിൻഡോസ് പരിതസ്ഥിതികളിൽ പ്രവർത്തിക്കാൻ ഞങ്ങൾ പരിശീലിപ്പിച്ച ആദ്യത്തെ മോഡലാണ് GPT‑5.1‑Codex‑Max, കോഡെക്സ് CLI-യിൽ മികച്ച സഹകരണം നൽകാൻ രൂപകൽപ്പന ചെയ്ത ടാസ്കുകൾ ഇപ്പോൾ മോഡലിന്റെ പരിശീലനത്തിൽ ഉൾപ്പെടുന്നു.
* എല്ലാ മൂല്യനിർണ്ണയങ്ങളും എക്സ്ട്രാ ഹൈ റീസണിംഗ് ശ്രമത്തിൽ കോംപാക്ഷൻ പ്രവർത്തന സജ്ജമാക്കിയ നിലയിൽ പ്രവർത്തിപ്പിച്ചു
* ടെർമിനൽ-ബെഞ്ച് 2.0 ലോഡ് ഇൻസ്റ്റിറ്റ്യൂട്ട് ഹാർബർ ഹാർനെസിൽ(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു)കോഡെക്സ് CLI ഉപയോഗിച്ച് പ്രവർത്തിച്ചു
GPT‑5.1‑Codex‑Max കൂടുതൽ ഫലപ്രദമായ യുക്തി കാരണം token കാര്യക്ഷമതയിൽ ഗണ്യമായ പുരോഗതി കാണിക്കുന്നു. SWE-ബെഞ്ച് സ്ഥിരീകരിച്ച, GPT‑5.1‑കോഡെക്സ്‑മാക്സ് 'മീഡിയം' റീസണിംഗ് ശ്രമത്തിൽ GPT‑5.1‑കോഡെക്സിനേക്കാൾ മികച്ച പ്രകടനം കാഴ്ചവെക്കുന്നു അതേ യുക്തിസഹമായ ശ്രമം ഉപയോഗിച്ച്, 30% കുറവ് ചിന്താ token-കൾ ഉപയോഗിക്കുമ്പോൾ. ലേറ്റൻസി-സെൻസിറ്റീവ് അല്ലാത്ത ടാസ്കുകൾക്കായി, ഞങ്ങൾ ഒരു പുതിയ എക്സ്ട്രാ ഹൈ ('xhigh') യുക്തിവാദ ശ്രമം അവതരിപ്പിക്കുന്നു, ഇത് മികച്ച ഉത്തരത്തിനായി കൂടുതൽ സമയത്തേക്ക് ചിന്തിക്കുന്നു. മിക്ക ടാസ്കുകൾക്കും ദൈനംദിന ഡ്രൈവറായി ഞങ്ങൾ ഇപ്പോഴും മധ്യനിര ശുപാർശ ചെയ്യുന്നു.
token കാര്യക്ഷമത മെച്ചപ്പെടുത്തലുകൾ ഡെവലപ്പർമാർക്ക് യഥാർത്ഥ ലോകത്തിൽ സമ്പാദ്യങ്ങൾ ഉണ്ടാക്കുമെന്ന് ഞങ്ങൾ പ്രതീക്ഷിക്കുന്നു.
ഉദാഹരണത്തിന്, GPT‑5.1‑Codex‑Max‑ന് സമാനമായ പ്രവർത്തനക്ഷമതയും സൗന്ദര്യശാസ്ത്രവുമുള്ള ഉയർന്ന നിലവാരമുള്ള ഫ്രണ്ട് എൻഡ് ഡിസൈനുകൾ നിർമ്മിക്കാൻ കഴിയും, പക്ഷേ GPT‑5.1‑Codex‑നേക്കാൾ വളരെ കുറഞ്ഞ ചെലവിൽ.
പ്രോംപ്റ്റ്: canvas ഗ്രാഫിക്സ്, ഒരു ചെറിയ പോളിസി-ഗ്രേഡിയൻ്റ് കൺട്രോളർ, മെട്രിക്സ്, ഒരു SVG നെറ്റ്വർക്ക് വിഷ്വലൈസർ എന്നിവയ്ക്കൊപ്പം ഒരു ഇൻ്ററാക്റ്റീവ് CartPole RL സാൻഡ്ബോക്സ് റെൻഡർ ചെയ്യുന്ന ഒരു സ്വയം ഉൾക്കൊള്ളുന്ന ബ്രൗസർ ആപ്പ് സൃഷ്ടിക്കുക.
സവിശേഷതകൾ
കാർട്ട് പോളിൽ മോഡൽ മെച്ചപ്പെടുത്താൻ ഒരു നയം യഥാർത്ഥത്തിൽ ട്രെയിൻ ചെയ്യാൻ കഴിയണംമോഡൽ പരിശീലനം നടത്തുമ്പോഴോ അനുമാനത്തിലായിരിക്കുമ്പോഴോ ആക്റ്റിവേഷനുകൾ/ഭാരങ്ങൾക്കായുള്ള ദൃശ്യവൽക്കരണ ഉപകരണംഎപ്പിസോഡിലെ ഘട്ടങ്ങൾ, ഈ എപ്പിസോഡിലെ പ്രതിഫലങ്ങൾഅവസാനത്തെ അതിജീവന സമയവും ഘട്ടങ്ങളിലെ ഏറ്റവും മികച്ച അതിജീവന സമയവും
index.html എന്നതിലേക്ക് സംരക്ഷിക്കുക
സങ്കീർണ്ണമായ റിഫാക്ടറുകൾ, ദീർഘകാലമായി പ്രവർത്തിക്കുന്ന ഏജൻ്റ് ലൂപ്പുകൾ എന്നിവ പോലുള്ള സന്ദർഭ-വിൻഡോ പരിധികൾ കാരണം മുമ്പ് പരാജയപ്പെട്ട ടാസ്കുകൾ പൂർത്തിയാക്കാൻ പ്രവർത്തന സജ്ജമാക്കുക GPT‑5.1‑Codex‑Max നെ പ്രാപ്തമാക്കുന്നു, അതിന്റെ ചരിത്രം ചുരുക്കിക്കൊണ്ട് ദീർഘകാല സന്ദർഭം സംരക്ഷിക്കുന്നു. കോഡെക്സ് ആപ്ലിക്കേഷനുകളിൽ, GPT‑5.1‑Codex‑Max അത് അതിന്റെ സന്ദർഭ വിൻഡോ പരിധിയെ സമീപിക്കുമ്പോൾ, അതിന്റെ സെഷൻ യാന്ത്രികമായി കോംപാക്റ്റ് ചെയ്യുന്നു, അതിനാൽ അത് ഒരു പുതിയ സന്ദർഭ വിൻഡോ നൽകുന്നു. ടാസ്ക് പൂർത്തിയാകുന്നതുവരെ ഈ പ്രക്രിയ ആവർത്തിക്കപ്പെടുന്നു.
കൂടുതൽ പൊതുവായതും വിശ്വസനീയവുമായ AI സിസ്റ്റങ്ങളിലേക്കുള്ള പാതയിലെ ഒരു അടിസ്ഥാന കഴിവാണ് ദീർഘകാലങ്ങളിൽ സുസ്ഥിരമായ പ്രവർത്തനം നിലനിർത്താനുള്ള കഴിവ്. GPT‑5.1‑Codex‑Max ഒരു സമയം മണിക്കൂറുകളോളം സ്വതന്ത്രമായി പ്രവർത്തിക്കാൻ കഴിയും. ഞങ്ങളുടെ ആന്തരിക വിലയിരുത്തലുകളിൽ, ഞങ്ങൾ GPT‑5.1‑Codex‑Max നിരീക്ഷിച്ചു 24 മണിക്കൂറിൽ കൂടുതൽ ടാസ്കുകളിൽ പ്രവർത്തിക്കുക. അത് നടപ്പിലാക്കലിൽ നിരന്തരം ആവർത്തിക്കുകയും, പരീക്ഷണ പരാജയങ്ങൾ പരിഹരിക്കുകയും, ഒടുവിൽ വിജയകരമായ ഫലം നൽകുകയും ചെയ്യും.
ഈ ഉദാഹരണത്തിൽ, GPT‑5.1‑Codex‑Max Codex CLI ഓപ്പൺ സോഴ്സ് റിപ്പോസിറ്ററിയെ സ്വതന്ത്രമായി പുനഃസംഘടിപ്പിക്കുന്നു.
സെഷൻ ദൈർഘ്യം മോഡലിന്റെ സന്ദർഭം-വിൻഡോയിലേക്ക് അടുക്കുമ്പോൾ, ടാസ്ക് പുരോഗതി നഷ്ടപ്പെടാതെ തുടരാൻ ഇടം ഒഴിവാക്കാൻ സെഷൻ സ്വയം ഒതുക്കുന്നു.
വ്യക്തതയ്ക്കായി വീഡിയോ വെട്ടിച്ചുരുക്കി വേഗത്തിലാക്കിയിരിക്കുന്നു.
GPT‑5.1‑Codex‑Max ദീർഘകാലവും സുസ്ഥിരവുമായ യുക്തി ആവശ്യമായ വിലയിരുത്തലുകളിൽ ഗണ്യമായി മികച്ച പ്രകടനം കാഴ്ചവയ്ക്കുന്നു. കോംപാക്ഷൻ ഉപയോഗിച്ച് ഒന്നിലധികം സന്ദർഭങ്ങൾ വിൻഡോകളിൽ യോജിച്ച രീതിയിൽ പ്രവർത്തിക്കാൻ കഴിയുന്നതിനാൽ, ദീർഘകാല കോഡിംഗ്, സൈബർസുരക്ഷ എന്നിവയുൾപ്പെടെയുള്ള മേഖലകളിലെ വെല്ലുവിളികളിൽ മോഡൽ മെച്ചപ്പെട്ട ഫലങ്ങൾ നൽകുന്നു. ഞങ്ങൾ GPT‑5.1‑Codex‑Max‑ൽ ഒന്നാം കക്ഷിയുടെയും മൂന്നാം കക്ഷിയുടെയും വിലയിരുത്തലുകളിൽ ഈ മോഡലിന്റെ പ്രകടന ഫലങ്ങൾ വിശകലനം ചെയ്തു സിസ്റ്റം കാർഡ്.
GPT‑5.1‑Codex‑Max ഞങ്ങളുടെ തയ്യാറെടുപ്പ് ചട്ടക്കൂടിന് കീഴിൽ സൈബർസുരക്ഷയിൽ ഉയർന്ന ശേഷി കൈവരിച്ചിട്ടില്ല, പക്ഷേ ഇതുവരെ ഞങ്ങൾ വിന്യസിച്ചിട്ടുള്ളതിൽ ഏറ്റവും കഴിവുള്ള സൈബർസുരക്ഷാ മോഡലാണിത്, കൂടാതെ ഏജന്റിക് സൈബർസുരക്ഷാ കഴിവുകൾ അതിവേഗം വികസിച്ചുകൊണ്ടിരിക്കുന്നു. ഫലമായി, സൈബർ സുരക്ഷയിൽ ഉയർന്ന ശേഷിക്കായി തയ്യാറെടുക്കുന്നതിനുള്ള നടപടികൾ ഞങ്ങൾ സ്വീകരിക്കുകയും സൈബർ ഡൊമെയ്നിൽ ഞങ്ങളുടെ സുരക്ഷാ സംവിധാനങ്ങൾ മെച്ചപ്പെടുത്തുകയും ആർഡ്വാർക്ക് പോലുള്ള പ്രോഗ്രാമുകൾ വഴി പ്രതിരോധക്കാർക്ക് ഈ മെച്ചപ്പെട്ട കഴിവുകളിൽ നിന്ന് പ്രയോജനം നേടാൻ പ്രവർത്തിക്കുകയും ചെയ്യുന്നു.
ഞങ്ങൾ GPT‑5‑Codex ആരംഭിച്ചപ്പോൾ, ദുഷ്ട പ്രവർത്തനങ്ങൾ കണ്ടെത്തുന്നതിനും തടസ്സപ്പെടുത്തുന്നതിനായി സമർപ്പിത സൈബർ സുരക്ഷാ-നിർദ്ദിഷ്ട നിരീക്ഷണം നടപ്പിലാക്കി. സ്കെയിൽ ചെയ്ത ദുരുപയോഗത്തിൽ അർത്ഥവത്തായ വർദ്ധനവ് ഞങ്ങൾ കണ്ടിട്ടില്ലെങ്കിലും, വിപുലമായ കഴിവുകൾക്കായി കൂടുതൽ പ്രതിരോധങ്ങൾ ഞങ്ങൾ തയ്യാറാക്കുകയാണ്. ഞങ്ങളുടെ മോഡലുകൾ ദുരുപയോഗം ചെയ്യാൻ ശ്രമിക്കുന്ന സൈബർ പ്രവർത്തനങ്ങൾ ഞങ്ങളുടെ ടീമുകൾ ഇതിനകം തടസ്സപ്പെടുത്തിയിട്ടുണ്ട്, കൂടാതെ സംശയാസ്പദമായ പ്രവർത്തനങ്ങൾ ഞങ്ങളുടെ നയ നിരീക്ഷണ സംവിധാനങ്ങൾ വഴി അവലോകനത്തിനായി വഴി തിരിച്ചു വിടുന്നു.
കോഡെക്സ് ഡിഫോൾട്ട് ആയി സുരക്ഷിതമായ ഒരു സാൻഡ്ബോക്സിൽ പ്രവർത്തിക്കുന്നതിനായി രൂപകൽപ്പന ചെയ്തിരിക്കുന്നു: ഫയൽ എഴുത്തുകൾ അതിന്റെ വർക്ക്സ്പേസ്നു പരിമിതമാണ്, കൂടാതെ ഒരു ഡെവലപ്പർ അത് ഓണാക്കിയില്ലെങ്കിൽ നെറ്റ്വർക്ക് ആക്സസ് പ്രവർത്തനരഹിതമാക്കിയിരിക്കുന്നു. ഇന്റർനെറ്റ് അല്ലെങ്കിൽ വെബ് തിരയൽ പ്രാപ്തമാക്കുന്നത് വിശ്വസനീയമല്ലാത്ത ഉള്ളടക്കത്തിൽ നിന്ന് പ്രോംപ്റ്റ്-ഇൻജക്ഷൻ അപകടസാധ്യതകൾക്ക് കാരണമാകുമെന്നതിനാൽ, കോഡെക്സ് ഈ നിയന്ത്രിത-ആക്സസ് മോഡിൽ നിലനിർത്താൻ ഞങ്ങൾ ശുപാർശ ചെയ്യുന്നു.
കോഡെക്സ് ദീർഘകാല ടാസ്കുകൾ ചെയ്യാൻ കൂടുതൽ പ്രാപ്തമാകുന്നതോടെ, ഡെവലപ്പർമാർ മാറ്റങ്ങൾ വരുത്തുന്നതിനോ ഉൽപ്പാദനത്തിലേക്ക് വിന്യസിക്കുന്നതിനോ മുമ്പ് ഏജൻ്റിന്റെ പ്രവർത്തനം അവലോകനം ചെയ്യുന്നത് കൂടുതൽ പ്രധാനമാണ്. ഇതിനെ സഹായിക്കുന്നതിനായി, Codex ടെർമിനൽ ലോഗുകൾ നിർമ്മിക്കുകയും അതിന്റെ ടൂൾ കോളുകളും പരിശോധനാ ഫലങ്ങളും ഉദ്ധരിക്കുകയും ചെയ്യുന്നു. ഇതിന്റെ കോഡ് അവലോകനങ്ങൾ മോഡൽ അല്ലെങ്കിൽ മനുഷ്യ നിർമ്മിത ബഗുകൾ ഉൽപാദനത്തിലേക്ക് വിന്യസിക്കുന്നതിനുള്ള അപകടസാധ്യത കുറയ്ക്കുമ്പോൾ, കോഡെക്സിനെ ഒരു അധിക അവലോകനനായി കണക്കാക്കണം, മനുഷ്യ അവലോകനങ്ങൾക്ക് പകരമായിട്ടല്ല.
സൈബർ സുരക്ഷാ കഴിവുകൾ പ്രതിരോധത്തിനും ആക്രമണത്തിനും ഉപയോഗിക്കാം, അതിനാൽ ഞങ്ങൾ ആവർത്തിച്ചുള്ള വിന്യാസ സമീപനം സ്വീകരിക്കുന്നു: യഥാർത്ഥ ലോക ഉപയോഗത്തിൽ നിന്ന് പഠിക്കുന്നു, സുരക്ഷാ മാർഗങ്ങൾ പുതുക്കുന്നു, ഓട്ടോമേറ്റഡ് വൾനറബിലിറ്റി സ്കാനിംഗ്, പരിഹാര സഹായം പോലുള്ള പ്രധാനപ്പെട്ട പ്രതിരോധ ഉപകരണങ്ങൾ സംരക്ഷിക്കുന്നു.
GPT‑5.1‑Codex‑Max Codex-ൽ ChatGPT Plus, Pro, Business, Edu, Enterprise പദ്ധതികളിൽ ലഭ്യമാണ്. നിങ്ങളുടെ പദ്ധതിയിലെ ഉപയോഗ പരിധികൾ എങ്ങനെ പ്രവർത്തിക്കുന്നു എന്നതിനെക്കുറിച്ചുള്ള വിശദാംശങ്ങൾക്ക്, ദയവായി ഞങ്ങളുടെ ഡോക്യുമെന്റേഷൻ(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) കാണുക.
API കീ വഴി Codex CLI ഉപയോഗിക്കുന്ന ഡെവലപ്പർമാർക്കായി, GPT‑5.1‑Codex‑Max ലഭ്യമാക്കാൻ ഞങ്ങൾ പദ്ധതിയിടുന്നു API-യിൽ ഉടൻ ലഭ്യമാകും.
ഇന്ന് മുതൽ, കോഡെക്സ് പ്രതലങ്ങളിൽ GPT‑5.1‑Codex‑നെ GPT‑5.1‑Codex‑Max മാറ്റിസ്ഥാപിച്ച് ഡിഫോൾട്ട് മോഡലായി ഇരിക്കും. സാധാരണ ഉപയോഗത്തിനുള്ള മോഡലായ GPT‑5.1‑ൽ നിന്ന് വ്യത്യസ്തമായി, ഞങ്ങൾ GPT‑5.1‑Codex‑Max ഉപയോഗിക്കാൻ ശുപാർശ ചെയ്യുന്നു കോഡെക്സ് അല്ലെങ്കിൽ കോഡെക്സ് പോലുള്ള പരിതസ്ഥിതികളിൽ ഏജന്റിക് കോഡിംഗ് ടാസ്കുകൾക്കായി മാത്രം കോഡെക്സ് മോഡൽ കുടുംബം.
GPT‑5.1‑Codex‑Max മോഡലുകൾ ലോംഗ്-ഹൊറൈസൺ കോഡിംഗ് ടാസ്കുകൾ നിലനിർത്തുന്നതിലും, സങ്കീർണ്ണമായ പ്രവൃത്തി പ്രവാഹങ്ങൾ കൈകാര്യം ചെയ്യുന്നതിലും, വളരെ കുറച്ച് token ഉപയോഗിച്ച് ഉയർന്ന നിലവാരമുള്ള നടപ്പാക്കലുകൾ നിർമ്മിക്കുന്നതിലും എത്രത്തോളം മുന്നേറിയെന്ന് കാണിക്കുന്നു. ഞങ്ങളുടെ CLI, IDE എക്സ്റ്റൻഷൻ, ക്ലൗഡ് ഇന്റഗ്രേഷൻ, കോഡ് റിവ്യൂ ടൂളിംഗ് എന്നിവയിലേക്കുള്ള സ്ഥിരമായ അപ്ഗ്രേഡുകളുമായി ഈ മോഡൽ സംയോജിപ്പിച്ചപ്പോൾ, ഞങ്ങൾ സൂപ്പർചാർജ്ഡ് എഞ്ചിനീയറിംഗ് ഉൽപ്പാദനക്ഷമത കൈവരിച്ചു: ആന്തരികമായി, 95% OpenAI എഞ്ചിനീയർമാരും ആഴ്ചതോറും കോഡെക്സ് ഉപയോഗിക്കുന്നു, കൂടാതെ ഈ എഞ്ചിനീയർമാർ കോഡെക്സ് സ്വീകരിച്ചതിനുശേഷം ഏകദേശം 70% കൂടുതൽ പുൾ അഭ്യർത്ഥനകൾ അയയ്ക്കുന്നു. ഏജൻ്റുകൾക്ക് ചെയ്യാൻ കഴിയുന്ന കാര്യങ്ങളുടെ അതിർത്തി ഞങ്ങൾ മുന്നോട്ട് കൊണ്ടുപോകുമ്പോൾ, നിങ്ങൾ അവരുമായി എന്താണ് നിർമ്മിക്കുന്നതെന്ന് കാണാൻ ഞങ്ങൾ ആവേശത്തിലാണ്.
GPT‑5.1‑Codex (ഉയർന്നത്) | GPT‑5.1‑കോഡെക്സ്‑മാക്സ് (xhigh) | |
SWE-ബെഞ്ച് സ്ഥിരീകരിച്ചത് (n=500) | 73.7% | 77.9% |
SWE-Lancer IC SWE | 66.3% | 79.9% |
Terminal-Bench 2.0 | 52.8% | 58.1% |


