2026 ഏപ്രിൽ 23

GPT‑5.5 അവതരിപ്പിക്കുന്നു

യഥാർത്ഥ ജോലികൾക്കായി രൂപപ്പെടുത്തിയ ഒരു പുതിയ തരം ബുദ്ധിശക്തി

ലോഡിംഗ്…

2026 ഏപ്രിൽ 24-ലെ അപ്ഡേറ്റ്: GPT‑5.5യും GPT‑5.5 Proയും ഇപ്പോൾ API-യിൽ ലഭ്യമാണ്. സിസ്റ്റം കാർഡ് -ഉം ബാധകമായ അധിക സുരക്ഷാ നടപടികളെ വിവരിക്കുന്നതിനായി അപ്ഡേറ്റ് ചെയ്തിട്ടുണ്ട്.

കമ്പ്യൂട്ടറിൽ ജോലികൾ ചെയ്യുന്നതിൽ ഒരു പുതിയ രീതിയിലേക്കുള്ള അടുത്ത ചുവടുവെപ്പായി, ഞങ്ങളുടെ ഏറ്റവും ബുദ്ധിശക്തിയുള്ളതും അനായാസം കൈകാര്യം ചെയ്യാവുന്നതുമായ GPT‑5.5 (GPT‑5.5) ഞങ്ങൾ പുറത്തിറക്കുന്നു.

GPT‑5.5 നിങ്ങൾ ചെയ്യാൻ ശ്രമിക്കുന്നത് കൂടുതൽ വേഗത്തിൽ മനസ്സിലാക്കുകയും ജോലികളുടെ വലിയൊരു ഭാഗം സ്വയം ഏറ്റെടുത്ത് നിർവ്വഹിക്കുകയും ചെയ്യുന്നു. കോഡ് എഴുതുന്നതിലും ഡീബഗ് ചെയ്യുന്നതിലും, ഓൺലൈനിൽ ഗവേഷണം നടത്തുന്നതിലും, ഡാറ്റ വിശകലനം ചെയ്യുന്നതിലും, ഡോക്യുമെന്റുകളും സ്പ്രെഡ്ഷീറ്റുകളും സൃഷ്ടിക്കുന്നതിലും, സോഫ്റ്റ്‌വെയർ പ്രവർത്തിപ്പിക്കുന്നതിലും, ഒരു ടാസ്ക് പൂർത്തിയാകുന്നതുവരെ ടൂളുകളിലുടനീളം നീങ്ങുന്നതിലും ഇത് മികവ് പുലർത്തുന്നു. ഓരോ ഘട്ടവും ശ്രദ്ധാപൂർവം നിയന്ത്രിക്കുന്നതിനുപകരം, നിങ്ങൾക്ക് GPT‑5.5‑ന് ക്രമരഹിതമായ, ഒന്നിലധികം ഭാഗങ്ങളുള്ള ഒരു ടാസ്ക് നൽകുകയും, അതിനായി പദ്ധതിയിടാനും, ടൂളുകൾ ഉപയോഗിക്കാനും, സ്വന്തം ജോലി പരിശോധിക്കാനും, അവ്യക്തതകളിലൂടെ നാവിഗേറ്റ് ചെയ്യാനും, തുടർന്നുകൊണ്ടിരിക്കാനും അതിനെ വിശ്വസിക്കുകയും ചെയ്യാം.

ഏജൻ്റിക് കോഡിംഗ്, കമ്പ്യൂട്ടർ ഉപയോഗം, വിജ്ഞാന ജോലി, പ്രാരംഭ ശാസ്ത്രീയ ഗവേഷണം എന്നിവയിൽ നേട്ടങ്ങൾ പ്രത്യേകിച്ച് ശക്തമാണ്—ഈ മേഖലകളിൽ പുരോഗതി സന്ദർഭങ്ങളലുടനീളം റീസണിംഗ് നടത്തുകയും കാലക്രമേണ നടപടികൾ സ്വീകരിക്കുകയും ചെയ്യുന്നതിൽ ആശ്രയിക്കുന്നു. GPT‑5.5 വേഗതയിൽ വിട്ടുവീഴ്ച ചെയ്യാതെ ബുദ്ധിശേഷിയിലെ ഈ മുന്നേറ്റം നൽകുന്നു. വലുതും കൂടുതൽ കഴിവുള്ളതുമായ മോഡൽ സാധാരണയായി സേവനമൊരുക്കുന്നത് മന്ദഗതിയിലായിരിക്കും. എന്നാൽ GPT‑5.5 യഥാർത്ഥ ഉപയോഗ സാഹചര്യങ്ങളിൽ ഓരോ ടോക്കണിലുമുള്ള ലാറ്റൻസിയിൽ GPT‑5.4‑നോട് തുല്യമാണ്, അതേസമയം വളരെ ഉയർന്ന ബുദ്ധിശേഷി നിലവാരത്തിൽ പ്രവർത്തിക്കുന്നു. അതേ Codex ടാസ്കുകൾ പൂർത്തിയാക്കാൻ ഇത് ഗണ്യമായി കുറവ് ടോക്കൺ ഉപയോഗിക്കുന്നു. അതുവഴി ഇത് കൂടുതൽ കാര്യക്ഷമവും കൂടുതൽ കഴിവുള്ളതുമാകുന്നു.

ദുരുപയോഗം കുറയ്ക്കുന്നതിനൊപ്പം പ്രയോജനകരമായ പ്രവർത്തനങ്ങൾക്കുള്ള ആക്‌സസ് നിലനിർത്തുന്നതിനായി രൂപകൽപ്പന ചെയ്ത, ഇതുവരെയുള്ളതിൽ ഏറ്റവും ശക്തമായ സുരക്ഷാ മുൻകരുതലുകളോടെ ഞങ്ങൾ GPT‑5.5 റിലീസ് ചെയ്യുന്നു. റിലീസിന് മുമ്പ്, സുരക്ഷയും തയ്യാറെടുപ്പും സംബന്ധിച്ച ഞങ്ങളുടെ സമഗ്ര ചട്ടക്കൂടുകളിലുടനീളം ഞങ്ങൾ ഈ മോഡൽ വിലയിരുത്തി, ആന്തരിക, ബാഹ്യ റെഡ് ടീം അംഗങ്ങളുമായി ചേർന്ന് പ്രവർത്തിച്ചു, ഉന്നത സൈബർസുരക്ഷാ, ജീവശാസ്ത്ര ശേഷികൾക്കായി ലക്ഷ്യമിട്ട പരിശോധനകൾ ചേർത്തു, കൂടാതെ ഏകദേശം 200 വിശ്വസനീയമായ പ്രാരംഭ-ആക്സസ് പങ്കാളികളിൽ നിന്ന് യഥാർത്ഥ ഉപയോഗ സാഹചര്യങ്ങളിലെ പ്രതികരണവും ശേഖരിച്ചു.

ഇന്ന്, ChatGPT, Codex എന്നിവയിൽ Plus, Pro, Business, Enterprise ഉപയോക്താക്കൾക്കായി GPT‑5.5 പുറത്തിറക്കുന്നു. കൂടാതെ ChatGPT‑ൽ Pro, Business, Enterprise ഉപയോക്താക്കൾക്കായി GPT‑5.5 Pro പുറത്തിറക്കുന്നു. API വിന്യാസങ്ങൾക്ക് വ്യത്യസ്ത സുരക്ഷാ മുൻകരുതലുകൾ ആവശ്യമാണ്. അത് വലിയ തോതിൽ ലഭ്യമാക്കുന്നതിനുള്ള സുരക്ഷയും സംരക്ഷണവുമായി ബന്ധപ്പെട്ട ആവശ്യകതകളിൽ പങ്കാളികളുമായും ഉപഭോക്താക്കളുമായും ഞങ്ങൾ അടുത്ത് പ്രവർത്തിക്കുന്നു. ഞങ്ങൾ GPT‑5.5യും GPT‑5.5 Proയും വളരെ വേഗം API-യിലേക്ക് കൊണ്ടുവരും.

	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	ജെമിനി 3.1 Pro
Terminal-Bench 2.0	82.7%	75.1%	-	-	69.4%	68.5%
Expert-SWE (ആന്തരികം)	73.1%	68.5%	-	-	-	-
GDPval (വിജയങ്ങൾ അല്ലെങ്കിൽ സമനില)	84.9%	83.0%	82.3%	82.0%	80.3%	67.3%
OSWorld-സ്ഥിരീകരിച്ചത്	78.7%	75.0%	-	-	78.0%	-
Toolathlon	55.6%	54.6%	-	-	-	48.8%
BrowseComp	84.4%	82.7%	90.1%	89.3%	79.3%	85.9%
ഫ്രോണ്ടിയർമാത്ത് ടയർ 1–3	51.7%	47.6%	52.4%	50.0%	43.8%	36.9%
ഫ്രോണ്ടിയർമാത്ത് ടയർ 4	35.4%	27.1%	39.6%	38.0%	22.9%	16.7%
CyberGym	81.8%	79.0%	-	-	73.1%	-

മോഡൽ ശേഷികൾ

OpenAI ഏജന്റിക് AI-യ്ക്കായുള്ള ആഗോള അടിസ്ഥാന സൗകര്യം നിർമ്മിക്കുന്നു, ഇത് ലോകമെമ്പാടുമുള്ള ആളുകൾക്കും ബിസിനസുകൾക്കും AI ഉപയോഗിച്ച് ജോലികൾ പൂർത്തിയാക്കുന്നത് സാധ്യമാക്കുന്നു. കഴിഞ്ഞ ഒരു വർഷമായി, AI സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയറിംഗിനെ ഗണ്യമായി വേഗത്തിലാക്കുന്നതായി ഞങ്ങൾ കണ്ടിട്ടുണ്ട്. Codex-ലും ChatGPT‑ലും GPT‑5.5 ഉപയോഗിച്ച്, അതേ മാറ്റം ശാസ്ത്രീയ ഗവേഷണത്തിലേക്കും ആളുകൾ കമ്പ്യൂട്ടറുകളിൽ ചെയ്യുന്ന കൂടുതൽ വിപുലമായ പ്രവർത്തനങ്ങളിലേക്കും വ്യാപിക്കുന്നു.

ഈ മേഖലകളിലുടനീളം, GPT‑5.5 കൂടുതൽ ബുദ്ധിശാലിയാണെന്നത് മാത്രമല്ല; പ്രശ്നങ്ങളിലൂടെ പ്രവർത്തിക്കുന്ന രീതിയിൽ അത് കൂടുതൽ കാര്യക്ഷമവുമാണ്, പലപ്പോഴും കുറച്ച് ടോക്കണുകളും കുറച്ച് റീട്രൈകളും ഉപയോഗിച്ച് ഉയർന്ന നിലവാരമുള്ള ഔട്ട്പുട്ടുകളിൽ എത്തിച്ചേരുന്നു. ആർട്ടിഫിഷ്യൽ അനാലിസിസിന്റെ കോഡിംഗ് ഇൻഡക്സിൽ, മത്സരാധിഷ്ഠിത അത്യാധുനിക കോഡിംഗ് മോഡലുകളുടെ പകുതി ചെലവിൽ GPT‑5.5 അത്യാധുനികമായ ബുദ്ധിശക്തി കാഴ്ചവെക്കുന്നു.

ആർട്ടിഫിഷ്യൽ അനാലിസിസ് ഇന്റലിജൻസ് ഇൻഡക്സ്⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) എന്നത് പുറമെ നിന്നുള്ള ഒരു വിഭാഗം നടത്തിയ പത്ത് വിലയിരുത്തലുകളുടെ വെയ്റ്റഡ് ആവറേജ് ആണ്: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, ഹ്യൂമാനിറ്റീസ് ലാസ്റ്റ് എക്സാം, IFBench, SciCode, ടെർമിനൽ-ബെഞ്ച് ഹാർഡ്, τ²-ബെഞ്ച് ടെലികോം.

ഏജന്റിക് കോഡിംഗ്

GPT‑5.5 ഇതുവരെയുള്ളതിൽ ഞങ്ങളുടെ ഏറ്റവും ശക്തമായ ഏജന്റിക് കോഡിംഗ് മോഡൽ ആണ്. Terminal-Bench 2.0-ൽ, ആസൂത്രണം, ആവർത്തനം, ഉപകരണങ്ങളുടെ ഏകോപനം എന്നിവ ആവശ്യമായ സങ്കീർണ്ണമായ കമാൻഡ്-ലൈൻ വർക്ക്‌ഫ്ലോകൾ പരിശോധിക്കുന്ന ഇത് 82.7% എന്ന അത്യാധുനിക നിലവാരത്തിലുള്ള കൃത്യത കൈവരിക്കുന്നു. യഥാർത്ഥ GitHub പ്രശ്ന പരിഹാരങ്ങളെ വിലയിരുത്തുന്ന SWE-Bench Pro-യിൽ, 58.6% എന്ന നേട്ടം ഇത് കൈവരിക്കുന്നു. മുൻപത്തെ മോഡലുകളേക്കാൾ കൂടുതൽ ജോലികൾ ഒറ്റത്തവണ കൊണ്ട് പൂർണ്ണമായി പരിഹരിക്കാൻ ഇതിന് സാധിക്കുന്നു. 20 മണിക്കൂർ കൊണ്ട് ഒരു മനുഷ്യൻ പൂർത്തിയാക്കുമെന്ന് കണക്കാക്കപ്പെടുന്ന, സങ്കീർണ്ണവും ദൈർഘ്യമേറിയതുമായ കോഡിംഗ് ജോലികൾക്കായുള്ള ഞങ്ങളുടെ ഇന്റേണൽ ഫ്രോണ്ടിയർ ഇവാല്വേഷനായ Expert-SWE-ൽ, GPT‑5.4‑നേക്കാൾ മികച്ച പ്രകടനമാണ് GPT‑5.5 കാഴ്ചവെക്കുന്നത്.

മൂന്ന് മൂല്യനിർണ്ണയങ്ങളിലും, കുറഞ്ഞ ടോക്കണുകൾ ഉപയോഗിച്ചുകൊണ്ട് GPT‑5.4‑നേക്കാൾ മികച്ച സ്കോറുകൾ GPT‑5.5 കൈവരിക്കുന്നു.

മോഡലിന്റെ കോഡിംഗിലെ ശക്തികൾ പ്രത്യേകിച്ച് വ്യക്തമായി പ്രകടമാകുന്നത് Codex-ലാണ്, അവിടെ പ്രോഗ്രാം നടപ്പിലാക്കുന്നതും പുനഃക്രമീകരിക്കുന്നതും മുതൽ പിഴവുകൾ പരിഹരിക്കുന്നതും പരിശോധിക്കുന്നതും സ്ഥിരീകരിക്കുന്നതും വരെയുള്ള എഞ്ചിനീയറിംഗ് ജോലികൾ ഏറ്റെടുക്കാൻ ഇതിന് സാധിക്കുന്നു. വലിയ സിസ്റ്റങ്ങളിലുടനീളം സന്ദർഭം നിലനിർത്തുക, അവ്യക്തമായ പരാജയങ്ങളിലൂടെ റീസണിംഗ് നടത്തുക, ഉപകരണങ്ങൾ ഉപയോഗിച്ച് അനുമാനങ്ങൾ പരിശോധിക്കുക, ചുറ്റുപാടിലുള്ള കോഡ്ബേസിലുടനീളം മാറ്റങ്ങൾ കൊണ്ടുപോകുക എന്നിവ പോലുള്ള യഥാർത്ഥ എഞ്ചിനീയറിംഗ് ജോലികൾ ആശ്രയിക്കുന്ന പെരുമാറ്റങ്ങളിൽ GPT‑5.5 കൂടുതൽ മികച്ചതാണെന്ന് ആദ്യകാല പരിശോധനകൾ സൂചിപ്പിക്കുന്നു.

റെൻഡർ ചെയ്ത ട്രാജക്ടറി ഓറിയൺ, ചന്ദ്രൻ, സൂര്യൻ എന്നിവയ്ക്കായി NASA/JPL Horizons വെക്റ്റർ ഡാറ്റ ഉപയോഗിക്കുന്നു. വായനാസൗകര്യത്തിനായി ഡിസ്പ്ലേ സ്കെയിലിംഗ് പ്രയോഗിച്ചിരിക്കുന്നു.

പ്രോംപ്റ്റ്: [അറ്റാച്ച് ചെയ്ത ചിത്രം] webgl, vite എന്നിവ ഉപയോഗിച്ച് ആർട്ടെമിസ് II ദൗത്യത്തിൽ നിന്നുള്ള യഥാർത്ഥ ഡാറ്റ ഉപയോഗിച്ച് ഇത് ഒരു പുതിയ ആപ്പായി നടപ്പിലാക്കുക. ആപ്പ് പൂർണ്ണമായി പ്രവർത്തനക്ഷമമാകുകയും ചിത്രത്തിലുള്ള ആപ്പിനെപ്പോലെ കാണപ്പെടുകയും ചെയ്യുന്നുവെന്ന് ഉറപ്പാക്കുന്നതുവരെ അത് സമഗ്രമായി പരീക്ഷിക്കുക. ഗ്രഹങ്ങളുടെയും പറക്കുന്ന പാതകളുടെയും റെൻഡറിംഗ് ശ്രദ്ധാപൂർവ്വം ശ്രദ്ധിക്കുക. എനിക്ക് 3D റെൻഡറിംഗുമായി സംവദിക്കാൻ കഴിയണം. അതിന് യാഥാർത്ഥ്യപരമായ ഓർബിറ്റൽ മെക്കാനിക്സ് ഉണ്ടെന്ന് ഉറപ്പാക്കുക.

ബെഞ്ച്മാർക്കുകൾക്കപ്പുറം, ആദ്യകാല ടെസ്റ്റർമാർ GPT‑5.5 ഒരു സിസ്റ്റത്തിന്റെ ഘടന മനസ്സിലാക്കാനുള്ള കൂടുതൽ ശക്തമായ കഴിവ് കാണിക്കുന്നുവെന്ന് പറഞ്ഞു: എന്തുകൊണ്ടാണ് എന്തെങ്കിലും പരാജയപ്പെടുന്നത്, പരിഹാരം എവിടെയാണ് പ്രയോഗിക്കേണ്ടത്, കൂടാതെ കോഡ്ബേസിലെ മറ്റെന്തൊക്കെയാണ് ബാധിക്കപ്പെടുക.

“ഗൗരവമുള്ള ആശയ വ്യക്തതയുള്ള ഞാൻ ഉപയോഗിച്ച ആദ്യത്തെ കോഡിംഗ് മോഡൽ.”

ഡാൻ ഷിപ്പർ, Every-യുടെ സ്ഥാപകനും CEOയും, GPT‑5.5 നെ “ഗൗരവകരമായ ആശയ വ്യക്തതയുള്ള, ഞാൻ ഉപയോഗിച്ച ആദ്യത്തെ കോഡിംഗ് മോഡലാണിത്.” എന്ന് വിവരിച്ചു.

ഒരു ആപ്പ് ലോഞ്ച് ചെയ്തതിന് ശേഷം, ലോഞ്ചിന് ശേഷമുള്ള ഒരു പ്രശ്നം ഡീബഗ് ചെയ്യാൻ അദ്ദേഹം ദിവസങ്ങളോളം ചെലവഴിച്ചു; തുടർന്ന് സിസ്റ്റത്തിന്റെ ഒരു ഭാഗം വീണ്ടും എഴുതാൻ തന്റെ മികച്ച എഞ്ചിനീയർമാരിൽ ഒരാളെ കൊണ്ടുവന്നു. GPT‑5.5 പരീക്ഷിക്കാൻ, അദ്ദേഹം സമയം പിന്നോട്ടു തിരിച്ചതുപോലെ ചെയ്തു. തകരാറിലായ അവസ്ഥ നോക്കി, എഞ്ചിനീയർ ഒടുവിൽ തീരുമാനിച്ച അതേ തരത്തിലുള്ള പുനരെഴുത്ത് മോഡലിന് സൃഷ്ടിക്കാനാകുമോ? GPT‑5.4‑ന് കഴിഞ്ഞില്ല. GPT‑5.5‑ന് കഴിഞ്ഞു.

“യഥാർത്ഥത്തിൽ ഒരു ഉന്നത ബുദ്ധിശക്തിയുള്ള വ്യക്തിയോടൊപ്പമാണ് ഞാൻ ജോലി ചെയ്യുന്നതെന്ന് എനിക്ക് തോന്നുന്നു, കൂടാതെ അതിനോട് ഒരുതരം ബഹുമാനവും തോന്നുന്നു.”

പിയട്രോ ഷിറാനോ, MagicPath-ന്റെ CEO, GPT‑5.5 നൂറുകണക്കിന് ഫ്രണ്ട് എൻഡ് മാറ്റങ്ങളും റീഫാക്ടർ മാറ്റങ്ങളുമുള്ള ഒരു ബ്രാഞ്ച്, ഗണ്യമായ മാറ്റങ്ങൾ സംഭവിച്ച മെയിൻ ബ്രാഞ്ചുമായി ലയിപ്പിച്ചപ്പോൾ സമാനമായ ഒരു വലിയ മാറ്റം ഞാൻ കണ്ടു; വെറും 20 മിനിറ്റിനുള്ളിൽ ഒറ്റയടിക്ക് ആ ജോലി അത് പൂർത്തിയാക്കി.

മോഡൽ പരീക്ഷിച്ച സീനിയർ എഞ്ചിനീയർമാർ പറഞ്ഞത്, റീസണിംഗിലും സ്വയംഭരണ ശേഷിയിലും GPT‑5.5, GPT‑5.4‑നെയും Claude Opus 4.7-നെയും അപേക്ഷിച്ച് ശ്രദ്ധേയമായി കൂടുതൽ ശക്തമാണെന്നും, പ്രശ്നങ്ങൾ മുൻകൂട്ടി കണ്ടെത്തുന്നതിലും വ്യക്തമായ പ്രോംപ്റ്റിംഗ് ഇല്ലാതെയും ടെസ്റ്റിംഗിനും റിവ്യൂവിനും ആവശ്യങ്ങൾ മുൻകൂട്ടി പ്രവചിക്കുന്നതിലും മികവ് കാട്ടിയെന്നും ആണ്. ഒരു സംഭവത്തിൽ, ഒരു എഞ്ചിനീയർ ഒരു സഹകരണ മാർക്ക്ഡൗൺ എഡിറ്ററിലെ കമന്റ് സിസ്റ്റം പുനർരൂപകൽപ്പന ചെയ്യാൻ ഇതിനോട് ആവശ്യപ്പെട്ടു, ഏകദേശം പൂർത്തിയായ നിലയിലുള്ള 12-വ്യത്യാസ സ്റ്റാക്കുമായാണ് ഇത് തിരിച്ചുവന്നത്. മറ്റുചിലർ പറഞ്ഞത്, നടപ്പാക്കലിലെ തിരുത്തൽ അതിശയകരമാംവിധം വളരെ കുറച്ച് മാത്രമേ ആവശ്യമായിരുന്നുള്ളൂ എന്നും GPT‑5.4നെ അപേക്ഷിച്ച് GPT‑5.5ന്റെ പദ്ധതികളിൽ അവർക്ക് കൂടുതൽ ആത്മവിശ്വാസം തോന്നിയെന്നും ആണ്.

മോഡലിലേക്ക് നേരത്തേ ആക്സസ് ലഭിച്ചിരുന്ന NVIDIAയിലെ ഒരു എഞ്ചിനീയറുടെ വാക്കുകളിൽ, "GPT‑5.5‑ലേക്കുള്ള ആക്സസ് നഷ്ടപ്പെടുന്നത് എന്റെ ഒരു അവയവം മുറിച്ചുമാറ്റിയതുപോലെ തോന്നുന്നു.”

“GPT-5.5, GPT-5.4-നെക്കാൾ ശ്രദ്ധേയമായ ബുദ്ധിശക്തിയും സ്ഥിരോത്സാഹവും പ്രകടിപ്പിക്കുന്നു കൂടുതൽ കരുത്തുറ്റ കോഡിംഗ് പ്രകടനവും കൂടുതൽ വിശ്വസനീയമായ ഉപകരണ ഉപയോഗവും ഇതിനുണ്ട്. നേരത്തെ നിർത്താതെ ഗണ്യമായ കൂടുതൽ സമയം ഇത് ഒരു ജോലിയിൽ തന്നെ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു; സങ്കീർണ്ണവും ദൈർഘ്യമേറിയതുമായ ജോലികൾക്കായി ഞങ്ങളുടെ ഉപഭോക്താക്കൾ Cursor-നെ ആശ്രയിക്കുന്ന സാഹചര്യത്തിൽ ഇതിന് വലിയ പ്രാധാന്യമുണ്ട്.”

— Michael Truell, Cursor-ന്റെ സഹസ്ഥാപകനും CEOയും

വിജ്ഞാന പ്രവർത്തനം

കോഡിംഗിൽ GPT‑5.5‑നെ മികച്ചതാക്കുന്ന അതേ ശക്തികൾ കമ്പ്യൂട്ടറിലെ ദൈനംദിന ജോലികൾക്കായും അതിനെ ശക്തമാക്കുന്നു. മോഡൽ ഉദ്ദേശ്യം കൂടുതൽ നന്നായി മനസ്സിലാക്കുന്നതിനാൽ, വിജ്ഞാന ജോലിയുടെ പൂർണ്ണ ചക്രത്തിലൂടെ അത് സ്വാഭാവികമായി സഞ്ചരിക്കുന്നു: വിവരങ്ങൾ കണ്ടെത്തുക, പ്രധാന കാര്യങ്ങൾ മനസ്സിലാക്കുക, ഉപകരണങ്ങൾ ഉപയോഗിക്കുക, ഔട്ട്പുട്ട് പരിശോധിക്കുക, അസംസ്കൃത വസ്തുക്കളെ ഉപകാരപ്രദമായവയാക്കി മാറ്റുക.

Codex-ൽ, ഡോക്യുമെന്റുകൾ, സ്പ്രെഡ്ഷീറ്റുകൾ, സ്ലൈഡ് അവതരണങ്ങൾ എന്നിവ സൃഷ്ടിക്കുന്നതിൽ GPT‑5.5, GPT‑5.4‑നെക്കാൾ മികച്ചതാണ്. ഓപ്പറേഷണൽ റിസർച്ച്, സ്പ്രെഡ്ഷീറ്റ് മോഡലിംഗ്, കൂടാതെ ക്രമരഹിതമായ ബിസിനസ് ഇൻപുട്ടുകളെ പ്ലാനുകളാക്കി മാറ്റുന്നത് പോലുള്ള ജോലികളിൽ ഇത് മുൻകാല മോഡലുകളെക്കാൾ മികച്ച പ്രകടനം കാഴ്ചവെച്ചതായി ആൽഫ ടെസ്റ്റർമാർ പറഞ്ഞു. Codex-ന്റെ കമ്പ്യൂട്ടർ ഉപയോഗ ശേഷികളുമായി ചേർന്നപ്പോൾ, GPT‑5.5 മോഡലിന് നിങ്ങളോടൊപ്പം തന്നെ കമ്പ്യൂട്ടർ യഥാർത്ഥത്തിൽ ഉപയോഗിക്കാൻ കഴിയും എന്ന അനുഭവത്തിലേക്ക് നമ്മെ കൂടുതൽ അടുപ്പിക്കുന്നു: സ്ക്രീനിലുള്ളത് കാണുക, ക്ലിക്ക് ചെയ്യുക, ടൈപ്പ് ചെയ്യുക, ഇന്റർഫേസുകളിലൂടെ നാവിഗേറ്റ് ചെയ്യുക, വിവിധ ടൂളുകൾക്കിടയിൽ കൃത്യതയോടെ നീങ്ങുക.

OpenAI-യിലെ ടീമുകൾ ഇതിനകം തന്നെ ഈ ശക്തികൾ യഥാർത്ഥ പ്രവൃത്തിപദ്ധതികളിൽ ഉപയോഗിക്കുന്നു. ഇന്ന്, സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയറിംഗ്, ഫിനാൻസ്, കമ്മ്യൂണിക്കേഷൻസ്, മാർക്കറ്റിംഗ്, ഡാറ്റാ സയൻസ്, പ്രൊഡക്റ്റ് മാനേജ്മെന്റ് എന്നിവ ഉൾപ്പെടെയുള്ള വിവിധ പ്രവർത്തനമേഖലകളിലായി കമ്പനിയിലെ 85%-ത്തിലധികം പേർ ഓരോ ആഴ്ചയും Codex ഉപയോഗിക്കുന്നു. കമ്മ്യൂണിക്കേഷൻസിൽ, ടീം Codex-ലുള്ള GPT‑5.5 ഉപയോഗിച്ച് ആറുമാസത്തെ സ്പീക്കിംഗ് അഭ്യർത്ഥന ഡാറ്റ വിശകലനം ചെയ്യുകയും, ഒരു സ്കോറിംഗും റിസ്ക് ചട്ടക്കൂടും നിർമ്മിക്കുകയും, ഒരു ഓട്ടോമേറ്റഡ് Slack ഏജന്റിനെ സാധൂകരിക്കുകയും ചെയ്തു. ഇതിലൂടെ കുറഞ്ഞ അപകടസാധ്യതയുള്ള അഭ്യർത്ഥനകൾ സ്വയമേവ കൈകാര്യം ചെയ്യാനാകുകയും കൂടുതൽ അപകടസാധ്യതയുള്ള അഭ്യർത്ഥനകൾ ഇപ്പോഴും മനുഷ്യ അവലോകനത്തിലേക്ക് റൂട്ട് ചെയ്യപ്പെടുകയും ചെയ്തു. ഫിനാൻസ് വിഭാഗത്തിൽ, വ്യക്തിഗത വിവരങ്ങൾ ഒഴിവാക്കിയ ഒരു വർക്ക്‌ഫ്ലോ ഉപയോഗിച്ച്, ടീം 71,637 പേജുകളിലായി വ്യാപിച്ചിരുന്ന 24,771 K-1 നികുതി ഫോമുകൾ പരിശോധിക്കാൻ Codex ഉപയോഗിച്ചു. ഇതിലൂടെ, മുൻവർഷത്തേക്കാൾ രണ്ട് ആഴ്ച വേഗത്തിൽ ഈ ജോലി പൂർത്തിയാക്കാൻ ടീമിന് സാധിച്ചു. ഗോ-ടു-മാർക്കറ്റ് ടീമിൽ, ഒരു ജീവനക്കാരൻ പ്രതിവാര ബിസിനസ് റിപ്പോർട്ടുകൾ സൃഷ്ടിക്കുന്നത് ഓട്ടോമേറ്റ് ചെയ്ത് ആഴ്ചയിൽ 5-10 മണിക്കൂർ ലാഭിച്ചു.

ChatGPT‑ൽ, GPT‑5.5 Thinking കൂടുതൽ ബുദ്ധിമുട്ടുള്ള പ്രശ്നങ്ങൾക്ക് വേഗത്തിലുള്ള സഹായം ലഭ്യമാക്കുന്നു. കൂടുതൽ സ്മാർട്ടും സംക്ഷിപ്തവുമായ ഉത്തരങ്ങളിലൂടെ സങ്കീർണ്ണമായ ജോലികൾ നിങ്ങൾക്ക് കൂടുതൽ കാര്യക്ഷമമായി മുന്നോട്ട് കൊണ്ടുപോകാൻ ഇത് സഹായിക്കുന്നു. കോഡിംഗ്, ഗവേഷണം, വിവരങ്ങളുടെ ക്രോഡീകരണവും വിശകലനവും, ഡോക്യുമെന്റുകൾ ധാരാളമായി ഉപയോഗിക്കേണ്ടി വരുന്ന ജോലികൾ പോലുള്ള പ്രൊഫഷണൽ വർക്കിൽ ഇത് മികച്ചുനിൽക്കുന്നു; പ്രത്യേകിച്ച് പ്ലഗിനുകൾ ഉപയോഗിക്കുമ്പോൾ.

GPT‑5.5 Pro-യിൽ, ChatGPT‑ക്ക് ഏറ്റെടുക്കാൻ കഴിയുന്ന ജോലികളുടെ സങ്കീർണ്ണതയിലും ഗുണനിലവാരത്തിലും ഗണ്യമായ പുരോഗതി ഉണ്ടായതായി ആദ്യകാല ടെസ്റ്റർമാർ കണ്ടെത്തി. കൂടാതെ, ലേറ്റൻസിയിലെ മെച്ചപ്പെടുത്തലുകൾ ആവശ്യകത കൂടുതലുള്ള ടാസ്കുകൾക്ക് ഇത് കൂടുതൽ പ്രായോഗികമായതാക്കുന്നു. GPT‑5.4 Pro-യുമായി താരതമ്യം ചെയ്യുമ്പോൾ, GPT‑5.5 Pro-യുടെ പ്രതികരണങ്ങൾ ഗണ്യമായി കൂടുതൽ സമഗ്രവും, നല്ല ഘടനയുള്ളതും, കൃത്യവും, പ്രസക്തവും, ഉപകാരപ്രദവുമാണ് എന്ന് ടെസ്റ്റർമാർ കണ്ടെത്തി. പ്രത്യേകിച്ച് ബിസിനസ്, നിയമം, വിദ്യാഭ്യാസം, ഡാറ്റ സയൻസ് മേഖലകളിൽ ശക്തമായ പ്രകടനമാണ് കാണിച്ചത്.

ഇത്തരത്തിലുള്ള ജോലിയെ പ്രതിഫലിപ്പിക്കുന്ന ഒന്നിലധികം ബെഞ്ച്മാർക്കുകളിലുടനീളം GPT‑5.5 അത്യാധുനിക പ്രകടനം കൈവരിക്കുന്നു. On GDPval⁠⁠, 44 തൊഴിൽ മേഖലകളിലുടനീളം നന്നായി നിർവചിക്കപെട്ട വിജ്ഞാന പ്രവർത്തനം സൃഷ്ടിക്കുന്നതിലുള്ള ഏജന്റുകളുടെ കഴിവുകൾ പരിശോധിക്കുന്നതിൽ, GPT‑5.5 84.9% സ്കോർ രേഖപ്പെടുത്തുന്നു. റിയൽ കമ്പ്യൂട്ടർ എൻവയോൺമെന്റുകൾ സ്വയം നിയന്ത്രിക്കാനുള്ള ഒരു മോഡലിന്റെ കഴിവ് അളക്കുന്ന OSWorld-Verified-ൽ, GPT‑5.5 78.7% നേട്ടം കൈവരിക്കുന്നു. കൂടാതെ, സങ്കീർണ്ണമായ ഉപഭോക്തൃ-സേവന വർക്ക്ഫ്ലോകൾ പരിശോധിക്കുന്ന Tau2-bench Telecom-ൽ, പ്രോംപ്റ്റ് ട്യൂണിംഗ് ഇല്ലാതെ ഇത് 98.0% കൈവരിക്കുന്നു. GPT‑5.5 മറ്റ് അറിവ്-അധിഷ്ഠിത പ്രവർത്തന ബെഞ്ച്മാർക്കുകളിലുടനീളം കൂടി ശക്തമായ പ്രകടനം കാഴ്ചവെക്കുന്നു: FinanceAgent-ൽ 60.0%, ആന്തരിക നിക്ഷേപ-ബാങ്കിംഗ് മോഡലിംഗ് ടാസ്കുകളിൽ 88.5%, കൂടാതെ OfficeQA Pro-ൽ 54.1%.

Tau2-bench Telecom പ്രോംപ്റ്റ് ട്യൂണിംഗ് ഇല്ലാതെ (ഉപയോക്തൃ മോഡലായി GPT‑4.1) പ്രവർത്തിപ്പിച്ചു. GPT‑5.5 ടാസ്കിന്റെ ഉദ്ദേശ്യം കൂടുതൽ നന്നായി മനസ്സിലാക്കുന്നു, അതിന്റെ മുൻഗാമികളേക്കാൾ കൂടുതൽ ടോക്കൺ-കാര്യക്ഷമവുമാണ്.

“GPT-5.5 നിർവഹണം-കൂടുതലുള്ള ജോലികൾക്കാവശ്യമായ സുസ്ഥിരമായ പ്രകടനം നൽകുന്നു. NVIDIA GB200 NVL72 സിസ്റ്റങ്ങളിൽ നിർമ്മിക്കുകയും സേവനം നൽകുകയും ചെയ്ത ഈ മോഡൽ, സ്വാഭാവിക ഭാഷാ പ്രോംപ്റ്റുകളിൽ നിന്ന് എൻഡ്-ടു-എൻഡ് സവിശേഷതകൾ എത്തിക്കാനും, ഡീബഗ് സമയം ദിവസങ്ങളിൽ നിന്ന് മണിക്കൂറുകളാക്കി കുറയ്ക്കാനും, സങ്കീർണ്ണമായ കോഡ്ബേസുകളിൽ ആഴ്ചകളെടുത്ത പരീക്ഷണങ്ങളെ ഒറ്റരാത്രിക്കുള്ള പുരോഗതിയാക്കി മാറ്റാനും ഞങ്ങളുടെ ടീമുകളെ പ്രാപ്തരാക്കുന്നു. ഇത് വേഗത്തിലുള്ള കോഡിംഗ് മാത്രമല്ല—ആളുകൾക്ക് അടിസ്ഥാനപരമായി വ്യത്യസ്തമായ ഒരു വേഗത്തിൽ പ്രവർത്തിക്കാൻ സഹായിക്കുന്ന ഒരു പുതിയ പ്രവർത്തനരീതിയാണ്.”

— ജസ്റ്റിൻ ബോയിറ്റാനോ, NVIDIA-ലെ Enterprise AI വിഭാഗത്തിന്റെ വൈസ് പ്രസിഡന്റ്

ശാസ്ത്രീയ ഗവേഷണം

കഠിനമായ ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകുന്നതിലുപരിയായി സങ്കീർണ്ണമായ പ്രവർത്തനരീതികൾ ആവശ്യമായ ശാസ്ത്രീയവും സാങ്കേതികവുമായ ഗവേഷണ പ്രക്രിയകളിൽ GPT‑5.5 മികച്ച പുരോഗതി പ്രകടിപ്പിക്കുന്നു. ഗവേഷകർ ഒരു ആശയം പരിശോധിക്കുകയും, തെളിവുകൾ ശേഖരിക്കുകയും, അനുമാനങ്ങൾ പരിശോധിക്കുകയും, ഫലങ്ങൾ വ്യാഖ്യാനിക്കുകയും, അടുത്തതായി എന്ത് പരീക്ഷിക്കണമെന്ന് തീരുമാനിക്കുകയും വേണം. മറ്റ് മോഡലുകളെ അപേക്ഷിച്ച്, ആ പ്രക്രിയയിലുടനീളം സ്ഥിരതയോടെ നിലനിൽക്കുന്നതിൽ GPT‑5.5 കൂടുതൽ മികവ് പുലർത്തുന്നു.

പ്രത്യേകിച്ച്, ജെനറ്റിക്സിലും ക്വാണ്ടിറ്റേറ്റീവ് ബയോളജിയിലും മൾട്ടി-സ്റ്റേജ് ശാസ്ത്രീയ ഡാറ്റാ വിശകലനത്തിൽ കേന്ദ്രീകരിക്കുന്ന പുതിയ മൂല്യനിർണയമായ GeneBench⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു)-ൽ, GPT‑5.5, GPT‑5.4‑നെ അപേക്ഷിച്ച് വ്യക്തമായ മെച്ചപ്പെടുത്തൽ കാണിക്കുന്നു. ഇത്തരം പ്രശ്നങ്ങൾക്ക്, അവ്യക്തതയുള്ളതോ പിഴവുകളുള്ളതോ ആകാൻ സാധ്യതയുള്ള വിവരങ്ങളെ കൃത്യമായ മേൽനോട്ടമില്ലാതെ തന്നെ യുക്തിസഹമായി വിശകലനം ചെയ്യാനും, മറഞ്ഞിരിക്കുന്ന ഘടകങ്ങൾ അല്ലെങ്കിൽ ക്വാളിറ്റി ചെക്ക് പരാജയങ്ങൾ പോലുള്ള പ്രായോഗിക തടസ്സങ്ങളെ നേരിടാനും, ആധുനിക സ്റ്റാറ്റിസ്റ്റിക്കൽ രീതികൾ കൃത്യമായി നടപ്പിലാക്കാനും വ്യാഖ്യാനിക്കാനും മോഡലുകൾ പ്രാപ്തമായിരിക്കണം. വിദഗ്ദ്ധരായ ശാസ്ത്രജ്ഞർക്ക് പൂർത്തിയാക്കാൻ പല ദിവസങ്ങൾ വേണ്ടിവരുന്ന പ്രോജക്റ്റുകൾക്ക് സമാനമായ ജോലികൾ ഇവിടെ പരിഗണിക്കുമ്പോൾ, ഈ മോഡൽ കാഴ്ചവെക്കുന്ന പ്രകടനം അതിശയിപ്പിക്കുന്നതാണ്.

അതുപോലെ, യഥാർത്ഥ ലോക ബയോഇൻഫോർമാറ്റിക്സിനെയും ഡാറ്റ വിശകലനത്തെയും അടിസ്ഥാനമാക്കി രൂപകൽപ്പന ചെയ്ത ബെഞ്ച്മാർക്കായ BixBench⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു)-ൽ, പ്രസിദ്ധീകരിച്ച സ്കോറുകളുള്ള മോഡലുകളിൽ GPT‑5.5 മുൻനിര പ്രകടനം കൈവരിച്ചു. ബയോമെഡിക്കൽ ഗവേഷണത്തിന്റെ മുൻനിരയിലുള്ള പ്രവർത്തനങ്ങളെ ഒരു യഥാർത്ഥ സഹ-ശാസ്ത്രജ്ഞനെപ്പോലെ അർത്ഥവത്തായ രീതിയിൽ വേഗത്തിലാക്കാൻ സാധിക്കുന്ന തരത്തിൽ ഈ മോഡലിന്റെ ശാസ്ത്രീയമായ കഴിവുകൾ ഇപ്പോൾ വളരെയധികം ശക്തിപ്പെട്ടിരിക്കുന്നു.

മറ്റൊരു ഉദാഹരണത്തിൽ, ഇഷ്ടാനുസൃത ഹാർണസോടുകൂടിയ GPT‑5.5‑ന്റെ ഒരു ആന്തരിക പതിപ്പ്, കോമ്പിനേറ്ററിക്സിലെ പ്രധാന വസ്തുക്കളിൽ ഒന്നായ റാംസി സംഖ്യകളെക്കുറിച്ചുള്ള പുതിയ തെളിവ്⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) കണ്ടെത്താൻ സഹായിച്ചു. വിഭിന്നമായ ഒബ്ജക്റ്റുകൾ എങ്ങനെ ഒന്നുചേരുന്നു എന്നതിനെക്കുറിച്ചുള്ള പഠനമാണ് കോമ്പിനേറ്റോറിക്സ്: ഗ്രാഫുകൾ, നെറ്റ്‌വർക്കുകൾ, സെറ്റുകൾ, പാറ്റേണുകൾ എന്നിവ.. ഏകദേശം പറഞ്ഞാൽ, നിശ്ചിതമായ ഒരു ക്രമം രൂപപ്പെടുമെന്ന് ഉറപ്പാക്കാൻ ഒരു നെറ്റ്‌വർക്ക് എത്രത്തോളം വലുതായിരിക്കണം എന്നാണ് റാംസി നമ്പറുകൾ അന്വേഷിക്കുന്നത്. ഈ മേഖലയിൽ ഫലങ്ങൾ അപൂർവമാണ്, കൂടാതെ പലപ്പോഴും സാങ്കേതികമായി ബുദ്ധിമുട്ടുള്ളവയാണ്. ഇവിടെ, GPT‑5.5 ഓഫ്-ഡയഗണൽ റാംസി സംഖ്യകളെക്കുറിച്ചുള്ള ദീർഘകാലമായി അറിയപ്പെട്ടിരുന്ന ഒരു അസിംപ്റ്റോട്ടിക് വസ്തുതയ്ക്ക് ഒരു തെളിവ് കണ്ടെത്തി. പിന്നീട് അത് Lean-ൽ സ്ഥിരീകരിക്കപ്പെട്ടു. ഗവേഷണ മേഖലയിലെ ഒരു പ്രധാന മേഖലയിൽ, വെറും കോഡോ വിശദീകരണമോ നൽകുന്നതിലുപരിയായി, അതിശയിപ്പിക്കുന്നതും ഉപകാരപ്രദവുമായ ഒരു ഗണിതശാസ്ത്രപരമായ വാദം അവതരിപ്പിക്കാൻ GPT‑5.5‑ന് സാധിച്ചു എന്നതിന്റെ വ്യക്തമായ ഉദാഹരണമാണ് ഈ ഫലം.

ആദ്യകാല ടെസ്റ്റർമാർ ChatGPT‑ൽ GPT‑5.5 Pro വൺ-ഷോട്ട് ഉത്തര എഞ്ചിനായി ഉപയോഗിച്ചതിനേക്കാൾ, ഒരു ഗവേഷണ പങ്കാളിയായി ഉപയോഗിച്ചു: ഒന്നിലധികം ഘട്ടങ്ങളിലൂടെ കൈയെഴുത്തുപ്രതികളെ വിമർശനാത്മകമായി വിലയിരുത്തുക, സാങ്കേതിക വാദങ്ങളെ സമ്മർദ്ദപരിശോധനയ്ക്ക് വിധേയമാക്കുക, വിശകലനങ്ങൾ നിർദേശിക്കുക, കൂടാതെ കോഡ്, കുറിപ്പുകൾ, PDF കോൺടെക്സ്റ്റ് എന്നിവയുമായി പ്രവർത്തിക്കുക. പൊതുവായ കാര്യം എന്തെന്നാൽ, ഗവേഷകരെ ചോദ്യത്തിൽ നിന്ന് പരീക്ഷണത്തിലേക്കും ഫലത്തിലേക്കും നീങ്ങാൻ സഹായിക്കുന്നതിൽ GPT‑5.5 കൂടുതൽ മികച്ചതാണ്.

ഡെറിയ ഉനുത്മാസ്, ജാക്‌സൺ ലബോറട്ടറി ഫോർ ജീനോമിക് മെഡിസിനിലെ ഇമ്മ്യൂണോളജി പ്രൊഫസറും ഗവേഷകനുമായ അദ്ദേഹം, 62 സാമ്പിളുകളും ഏകദേശം 28,000 ജീനുകളും അടങ്ങിയ ഒരു ജീൻ-എക്സ്പ്രഷൻ ഡാറ്റാസെറ്റ് GPT‑5.5 Pro ഉപയോഗിച്ച് വിശകലനം ചെയ്തു. ഫലമായി, കണ്ടെത്തലുകൾ സംഗ്രഹിച്ചതിൽ മാത്രം ഒതുങ്ങാതെ പ്രധാന ചോദ്യങ്ങളും ഉൾക്കാഴ്ചകളും മുന്നിലെത്തിച്ച ഒരു വിശദമായ ഗവേഷണ റിപ്പോർട്ട് ഇത് തയ്യാറാക്കി—ഈ ജോലി തന്റെ ടീമിന് പൂർത്തിയാക്കാൻ മാസങ്ങൾ എടുത്തേനെയെന്ന് അദ്ദേഹം പറഞ്ഞു.

Bartosz Naskręcki, പോളണ്ടിലെ പോസ്‌നാനിലുള്ള Adam Mickiewicz University-യിലെ ഗണിതശാസ്ത്ര അസിസ്റ്റന്റ് പ്രൊഫസർ, Codex-ലുള്ള GPT‑5.5 ഉപയോഗിച്ച് ഒരൊറ്റ പ്രോംപ്റ്റ് നിന്ന് 11 മിനിറ്റിനുള്ളിൽ ഒരു ബീജഗണിത ജ്യാമിതി ആപ്പ് നിർമ്മിച്ചു. അതിൽ ക്വാഡ്രാറ്റിക് പ്രതലങ്ങളുടെ ഇന്റർസെക്ഷൻ ദൃശ്യവൽക്കരിക്കുകയും ഫലമായി ലഭിച്ച കർവിനെ ഒരു വെയർസ്ട്രാസ് മോഡൽ ആയി പരിവർത്തനം ചെയ്യുകയും ചെയ്തു.

പിന്നീട് അദ്ദേഹം കൂടുതൽ സുസ്ഥിരമായ സിംഗുലാരിറ്റി വിഷ്വലൈസേഷനും, തുടർന്നുള്ള പ്രവർത്തനങ്ങളിൽ വീണ്ടും ഉപയോഗിക്കാൻ കഴിയുന്ന കൃത്യമായ ഗുണകങ്ങളും ഉൾപ്പെടുത്തി ആപ്പ് വിപുലീകരിച്ചു. അദ്ദേഹത്തിന്റെ അഭിപ്രായത്തിൽ, കൂടുതൽ വലിയ മാറ്റം ഇതാണ്: മുമ്പ് പ്രത്യേക ടൂളുകൾ ആവശ്യമായിരുന്ന ഇഷ്ടാനുസൃത ഗണിത ദൃശ്യവൽക്കരണവും കമ്പ്യൂട്ടർ-ബീജഗണിത വർക്ക്‌ഫ്ലോകളും നടപ്പിലാക്കാൻ Codex ഇപ്പോൾ സഹായിക്കും. ഈ ഉദാഹരണങ്ങളെല്ലാം ചേർത്ത് പരിശോധിക്കുമ്പോൾ, വിദഗ്ധരുടെ ലക്ഷ്യങ്ങളെ ഫലപ്രദമായ ഗവേഷണ ഉപകരണങ്ങളായും വിശകലനങ്ങളായും മാറ്റാൻ GPT‑5.5‑ന് സാധിക്കുമെന്ന് വ്യക്തമാകുന്നു.

ക്രെഡിറ്റ്: Bartosz Naskręcki⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു)

പ്രോംപ്റ്റ്: # ബീജഗണിത ജ്യാമിതി ഉപരിതല ഇന്റർസെക്ഷൻ

രണ്ട് ക്വാഡ്രാറ്റിക് ഉപരിതലങ്ങൾ വരയ്ക്കുകയും അവയുടെ ഇന്റർസെക്ഷൻ കർവ് ചുവപ്പ് നിറത്തിൽ കാണിക്കുകയും ചെയ്യുന്ന ഒരു ആപ്പ് നിർമ്മിക്കുക. കമ്പ്യൂട്ടേഷണൽ റീമാൻ-റോക്ക് സിദ്ധാന്തം ഉപയോഗിച്ച് ഇതിനെ വൈയർസ്ട്രാസ് കർവാക്കി മാറ്റുക.

## പ്രധാന വിൻഡോ

അൽപം സുതാര്യമായ നിഴലോടുകൂടിയ നിറം ചേർത്ത രണ്ട് ഉപരിതലങ്ങൾ, ഉയർന്ന നിലവാരത്തിലുള്ള റെൻഡറിംഗിൽ, ചുവപ്പ് നിറത്തിലുള്ള ഒരു ബീജഗണിത കർവിലൂടെ പരസ്പരം മുറിച്ചുകടക്കുന്നു

മൗസ് ഉപയോഗിച്ച് ഇരുവശങ്ങളിലേക്കും തിരിക്കാനുള്ള സൗകര്യം, സൂം ചെയ്യുന്നതിനായി ഫുൾ പിഞ്ച് മെക്കാനിസം, ഓരോ പ്രതലത്തിന്റെയും ഗുണകങ്ങൾ മാറ്റുന്നതിനുള്ള സ്ലൈഡറുകളോട് കൂടിയ ചെറിയ മെനു കാണാൻ ഹാപ്റ്റിക് പ്രസ്സ്, Z-ബഫർ നിലവാരത്തിലൂടെയുള്ള തിരിച്ചറിയൽ രീതി

## വലതുവശത്തെ വിൻഡോ

ഫലപ്രദമായ റീമാൻ-റോച്ച് സിദ്ധാന്ത സൂത്രവാക്യങ്ങളിലൂടെ അപ്പപ്പോൾ കണക്കാക്കിയ ഷോർട്ട് വെയർസ്ട്രാസ് സമവാക്യം ($Q$ അല്ലെങ്കിൽ ക്വാഡ്രാറ്റിക് ഫീൽഡ് എക്സ്റ്റൻഷനുകളിൽ)

## എല്ലാ നിയന്ത്രണങ്ങളും മറച്ചുവെച്ചിരിക്കുന്നതും ഉപയോക്താവിന് ആകൃതികളുടെ സൗന്ദര്യം ആസ്വദിക്കാൻ കഴിയുന്നതുമായ ആംബിയന്റ് മോഡ്

## സവിശേഷതകൾ

ആപ്പ് ബ്രൗസറിൽ പ്രവർത്തിക്കുന്നു, ഏറ്റവും പുതിയ ഫുൾ-സ്റ്റാക്ക് ലൈബ്രറികളോടെ ലഘുഭാരമുള്ള ഇംപ്ലിമെന്റേഷൻ, പോർട്ടബിൾ, ഡിപ്ലോയ് ചെയ്യാവുന്നത്

## ഡോക്യുമെന്റുകൾ

Git റിപ്പോ, ജേർണൽ, പ്ലാൻ (മാർക്ക്ഡൗൺ ഫയലുകൾ)

“OpenAIയുടെ പുതിയ GPT-5.5 മോഡൽ ഞങ്ങളുടെ ഹാർണസിൽ ഉപയോഗിച്ച്, വിപുലമായ ബയോകെമിക്കൽ ഡാറ്റാസെറ്റുകൾ വിശകലനം ചെയ്ത് മനുഷ്യരിലെ മരുന്നുകളുടെ ഫലങ്ങൾ പ്രവചിക്കുകയും, അതിന്റെ ഫലമായി ഞങ്ങളുടെ ഏറ്റവും പ്രയാസകരമായ മരുന്ന് കണ്ടെത്തൽ മൂല്യനിർണയങ്ങളിൽ ശ്രദ്ധേയമായ കൃത്യതാ നേട്ടങ്ങൾ കൈവരിക്കുകയും ചെയ്യുന്നത് അത്യന്തം ഉണർവ് നൽകുന്നു. “OpenAI ഇങ്ങനെ തന്നെ മുന്നേറുകയാണെങ്കിൽ, ഈ വർഷാവസാനത്തോടെ മരുന്ന് കണ്ടെത്തലിന്റെ അടിസ്ഥാനങ്ങൾ മാറും.”

— Brandon White, Axiom Bio-യുടെ സഹസ്ഥാപകനും CEOയും

അടുത്ത തലമുറയിലെ ഇൻഫറൻസ് കാര്യക്ഷമത

GPT‑5.4 ലേറ്റൻസിയിൽ GPT‑5.5 നൽകുന്നതിന്, ഇൻഫറൻസിനെ ഒറ്റപ്പെട്ട ഒപ്റ്റിമൈസേഷനുകളുടെ ഒരു കൂട്ടമായി അല്ല, മറിച്ച് ഒരു സംയോജിത സംവിധാനമായി പുനർവിചിന്തനം ചെയ്യേണ്ടിവന്നു. NVIDIA GB200, GB300 NVL72 സിസ്റ്റങ്ങൾക്കായി പ്രത്യേകം രൂപകൽപ്പന ചെയ്തതും അവ ഉപയോഗിച്ച് പരിശീലിപ്പിച്ചതും, അവയിലൂടെ ലഭ്യമാക്കുന്നതുമാണ് GPT‑5.5 (GPT‑5.5). Codex-ഉം GPT‑5.5‑ഉം ഞങ്ങളുടെ പ്രകടന ലക്ഷ്യങ്ങൾ കൈവരിക്കുന്നതിൽ നിർണായക പങ്ക് വഹിച്ചു. ആശയങ്ങളിൽ നിന്ന് ബെഞ്ച്മാർക്ക് ചെയ്യാവുന്ന നടപ്പാക്കലിലേക്ക് വേഗത്തിൽ നീങ്ങാനും, രീതികൾ ആസൂത്രണം ചെയ്യാനും, പരീക്ഷണങ്ങൾ ഏകോപിപ്പിക്കാനും, ഏതൊക്കെ ഒപ്റ്റിമൈസേഷനുകളിലാണ് കൂടുതൽ നിക്ഷേപം നടത്തേണ്ടതെന്ന് തിരിച്ചറിയാനും കോഡെക്സ് ടീമിനെ സഹായിച്ചു. GPT‑5.5 സ്റ്റാക്കിൽ തന്നെയുള്ള പ്രധാന മെച്ചപ്പെടുത്തലുകൾ കണ്ടെത്താനും നടപ്പിലാക്കാനും സഹായിച്ചു. ലളിതമായി പറഞ്ഞാൽ, ഈ മോഡലിനെ ലഭ്യമാക്കുന്ന അടിസ്ഥാന സൗകര്യങ്ങൾ മെച്ചപ്പെടുത്താൻ മോഡൽ തന്നെ സഹായിച്ചു.

ലോഡ് ബാലൻസിംഗും പാർട്ടീഷനിംഗ് ഹ്യൂറിസ്റ്റിക്സും അത്തരത്തിലുള്ള ഒരു മെച്ചപ്പെടുത്തലായിരുന്നു. GPT‑5.5‑ന് മുമ്പ്, കമ്പ്യൂട്ടിംഗ് കോറുകളിലുടനീളം ജോലി സമതുലിതമാക്കാൻ, ഒരു ആക്സിലറേറ്ററിലെ അഭ്യർത്ഥനകളെ നിശ്ചിത ഭാഗങ്ങളായി വിഭജിച്ചു. ഇതിലൂടെ വലിയ അഭ്യർത്ഥനകളും ചെറിയ അഭ്യർത്ഥനകളും ഒരേ GPU-യിൽ പ്രവർത്തിക്കുന്നത് സാധ്യമായി. എങ്കിലും, എല്ലാ തരം ട്രാഫിക് സാഹചര്യങ്ങൾക്കും മുൻകൂട്ടി നിശ്ചയിച്ച സ്റ്റാറ്റിക് ചങ്കുകൾ അനുയോജ്യമല്ല. GPU-കളെ കൂടുതൽ ഫലപ്രദമായി ഉപയോഗിക്കുന്നതിനായി, Codex ആഴ്ചകളോമുള്ള പ്രൊഡക്ഷൻ ട്രാഫിക് പാറ്റേണുകൾ വിശകലനം ചെയ്തു. ജോലി ഏറ്റവും ഉചിതമായി വിഭജിക്കാനും സന്തുലിതമാക്കാനും കസ്റ്റം ഹ്യൂറിസ്റ്റിക് ആൽഗോരിതങ്ങൾ എഴുതി. ആ ശ്രമം വലിയ സ്വാധീനം ചെലുത്തി, ടോക്കൺ സൃഷ്ടിക്കൽ വേഗത 20%-ലധികം വർദ്ധിപ്പിച്ചു.

എല്ലാവർക്കും സുരക്ഷയ്ക്കായി സൈബർസുരക്ഷ മെച്ചപ്പെടുത്തുന്നു

സുരക്ഷാ ദൗർബല്യങ്ങൾ കണ്ടെത്തുകയും പരിഹരിക്കുകയും ചെയ്യുന്നതിൽ കഴിവുള്ള മോഡലുകൾക്കായി ലോകത്തെ തയ്യാറാക്കുന്നത് ഒരു ടീമിന്റെ കൂട്ടായ ശ്രമമാണ്. സൈബർ പ്രതിരോധത്തിന്റെ അടുത്ത കാലഘട്ടത്തിനായി⁠ ജനാധിപത്യവൽക്കരിച്ച മോഡൽ ആക്സസും ആവർത്തിത വിന്യാസവും ഉൾപ്പെടുത്തി പ്രതിരോധശേഷി വർദ്ധിപ്പിക്കാൻ മുഴുവൻ ഇക്കോസിസ്റ്റവും കഠിനമായി പ്രവർത്തിക്കേണ്ടതുണ്ട്.

അത്യാധുനിക മോഡലുകൾ സൈബർസുരക്ഷയിൽ ക്രമേണ കൂടുതൽ കരുത്താർജ്ജിച്ചുകൊണ്ടിരിക്കുകയാണ്. ആ കഴിവുകൾ വ്യാപകമായി ലഭ്യമാകും. അവ സൈബർ പ്രതിരോധം വേഗത്തിലാക്കാനും ഇക്കോസിസ്റ്റം ശക്തിപ്പെടുത്താനും ഉപയോഗിക്കാനാകുമെന്ന് ഉറപ്പാക്കുന്നതാണ് മുന്നോട്ടുള്ള ഏറ്റവും നല്ല വഴി എന്ന് ഞങ്ങൾ വിശ്വസിക്കുന്നു.

GPT‑5.5, സൈബർസുരക്ഷ പോലെയുള്ള ലോകത്തിലെ ഏറ്റവും ദുഷ്കരമായ ചില വെല്ലുവിളികൾ പരിഹരിക്കാൻ കഴിയുന്ന AIയിലേക്കുള്ള ക്രമാനുഗതവും എന്നാൽ പ്രധാനപ്പെട്ടതുമായ ഒരു മുന്നേറ്റമാണ്. ഡിസംബറിൽ GPT‑5.2‑യോടെ, ഞങ്ങളുടെ മോഡലുകൾ ഉപയോഗിച്ച് ഉണ്ടാകാൻ സാധ്യതയുള്ള സൈബർ ദുരുപയോഗം പരിമിതപ്പെടുത്താൻ ആവശ്യമായ സൈബർ സംരക്ഷണങ്ങൾ⁠ ഞങ്ങൾ മുൻകൂട്ടി വിന്യസിച്ചു; ഇപ്പോൾ GPT‑5.5‑യോടെ, സാധ്യതയുള്ള സൈബർ അപകടസാധ്യതയ്ക്കായി കൂടുതൽ കർശനമായ ക്ലാസിഫയറുകൾ ഞങ്ങൾ വിന്യസിക്കുകയാണ്. കാലക്രമേണ അവ ക്രമീകരിച്ചുകൊണ്ടിരിക്കുമ്പോൾ, തുടക്കത്തിൽ ചില ഉപയോക്താക്കൾക്ക് ഇത് അലോസരമായി തോന്നിയേക്കാം.

വർഷങ്ങളായി ഞങ്ങളുടെ മോഡൽ ക്രമാനുഗതമായി മെച്ചപ്പെട്ടുകൊണ്ടിരിക്കുമ്പോൾ, അർത്ഥവത്തായ സൈബർസുരക്ഷാ ശേഷികളുള്ള മോഡൽ ഉത്തരവാദിത്തത്തോടെ പുറത്തിറക്കാൻ കഴിയുന്നതിനായി ഞങ്ങൾ ലഘൂകരണങ്ങൾ ആവർത്തിച്ച് വികസിപ്പിക്കുകയും ക്രമീകരിക്കുകയും ചെയ്തുവരുന്നതിനൊപ്പം, ഞങ്ങളുടെ പ്രിപെയർഡ്നസ് ഫ്രെയിംവർക്ക്⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) ൽ സൈബർ സുരക്ഷയെ ഒരു വിഭാഗമായി തിരിച്ചറിഞ്ഞിട്ടുണ്ട്.

ഈ തലത്തിലുള്ള സൈബർ ശേഷിക്കായി ഞങ്ങൾ വ്യവസായ രംഗത്ത് മുൻനിരയിലുള്ള സുരക്ഷാ മുൻകരുതലുകൾ വിന്യസിക്കുന്നു. കഴിഞ്ഞ വർഷം GPT‑5.2⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) -നൊപ്പം ഞങ്ങൾ ആദ്യമായി സൈബർ-നിർദ്ദിഷ്ട സുരക്ഷാ മുൻകരുതലുകൾ അവതരിപ്പിച്ചു, തുടർന്ന് വന്ന വിന്യാസങ്ങളിൽ അവ പരീക്ഷിക്കുകയും മെച്ചപ്പെടുത്തുകയും അതിന്റെ അടിസ്ഥാനത്തിൽ കൂടുതൽ വികസിപ്പിക്കുകയും ചെയ്തു. GPT‑5.5‑നായി, ഉയർന്ന തോതിൽ റിസ്ക് ഉള്ള പ്രവർത്തനങ്ങൾ, സെൻസിറ്റീവ് സൈബർ അഭ്യർത്ഥനകൾ എന്നിവയ്ക്ക് മേൽ കൂടുതൽ കർശനമായ നിയന്ത്രണങ്ങൾ ഞങ്ങൾ രൂപകൽപ്പന ചെയ്യുകയും, ആവർത്തിച്ചുള്ള ദുരുപയോഗങ്ങൾക്കെതിരെ കൂടുതൽ സുരക്ഷാ സംവിധാനങ്ങൾ കൂട്ടിച്ചേർക്കുകയും ചെയ്തു. മോഡൽ സുരക്ഷ, പ്രാമാണീകരിച്ച ഉപയോഗം, അനുവദനീയമല്ലാത്ത ഉപയോഗം നിരീക്ഷിക്കൽ എന്നിവയിലുള്ള ഞങ്ങളുടെ നിക്ഷേപങ്ങളിലൂടെയാണ് വിശാലമായ ആക്സസ് സാധ്യമാകുന്നത്. ഈ സുരക്ഷാ സംവിധാനങ്ങളുടെ കരുത്ത് വികസിപ്പിക്കുന്നതിനും പരീക്ഷിക്കുന്നതിനും മെച്ചപ്പെടുത്തുന്നതിനുമായി മാസങ്ങളായി ഞങ്ങൾ പുറമെനിന്നുള്ള വിദഗ്ധരുമായി ചേർന്ന് പ്രവർത്തിച്ചുവരികയാണ്. GPT‑5.5 ഉപയോഗിച്ച്, ഡെവലപ്പർമാർക്ക് തങ്ങളുടെ കോഡ് എളുപ്പത്തിൽ സുരക്ഷിതമാക്കാൻ കഴിയുന്നുവെന്ന് ഞങ്ങൾ ഉറപ്പാക്കുന്നു. അതോടൊപ്പം, ദോഷകരമായ ഘടകങ്ങൾ ഹാനി വരുത്താൻ ഏറ്റവും കൂടുതൽ സാധ്യതയുള്ള സൈബർ വർക്ക്ഫ്ലോകൾക്ക് ചുറ്റും കൂടുതൽ ശക്തമായ നിയന്ത്രണങ്ങൾ ഏർപ്പെടുത്തുകയും ചെയ്യുന്നു.
സൈബർ പ്രതിരോധം എല്ലാ തലങ്ങളിലും വേഗത്തിലാക്കാൻ ഞങ്ങൾ ആക്സസ് വ്യാപിപ്പിക്കുന്നു. ഞങ്ങൾ ഞങ്ങളുടെ സൈബർ-പെർമിസീവ് മോഡലുകൾ ട്രസ്റ്റഡ് ആക്സസ് ഫോർ സൈബർ⁠ മുഖേന ലഭ്യമാക്കുകയാണ് തുടക്കത്തിൽ Codex ആണ് ഇതിൽ ഉൾപ്പെടുന്നത്. തുടക്കഘട്ടത്തിൽ തന്നെ പ്രത്യേക ട്രസ്റ്റ് സിഗ്നലുകൾ⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) പാലിക്കുന്ന, വെരിഫൈഡ് ആയ ഉപയോക്താക്കൾക്കായി കുറഞ്ഞ നിയന്ത്രണങ്ങളോടെ GPT‑5.5‑ന്റെ വിപുലമായ സൈബർ സുരക്ഷാ സേവനങ്ങൾ ഇതിലൂടെ ലഭ്യമാകും. നിർണായക അടിസ്ഥാനസൗകര്യങ്ങളെ സംരക്ഷിക്കാൻ⁠ ഉത്തരവാദിത്തമുള്ള സ്ഥാപനങ്ങൾക്ക് GPT‑5.4‑Cyber പോലുള്ള സൈബർ-പെർമിസീവ് മോഡലുകളിലേക്കുള്ള ആക്സസ് നേടാൻ അപേക്ഷിക്കാവുന്നതാണ്. അതേസമയം, അവരുടെ ആഭ്യന്തര സംവിധാനങ്ങൾ സുരക്ഷിതമാക്കുന്നതിനായി ഈ മോഡലുകൾ ഉപയോഗിക്കാൻ കർശനമായ സുരക്ഷാ ആവശ്യകതകൾ പാലിക്കേണ്ടതുണ്ട്. പ്രധാനപ്പെട്ട പ്രതിരോധ ശേഷികൾ എല്ലാവർക്കും ലഭ്യമാക്കുന്നുവെന്ന് ഉറപ്പാക്കുന്നതിനായി, അനാവശ്യ തടസ്സങ്ങളില്ലാതെ നിയമാനുസൃതമായ സുരക്ഷാ ജോലികൾക്കായി കൂടുതൽ കരുത്തുറ്റ ഉപകരണങ്ങൾ വിവിധ വെരിഫൈഡ് ഡിഫൻഡർമാർക്ക് ഇത് നൽകുന്നു. ഉപയോക്താക്കൾക്ക് സ്ഥിരീകരിച്ച പ്രതിരോധ പ്രവർത്തനങ്ങൾക്കായി GPT‑5.5 ഉപയോഗിക്കുമ്പോൾ ഉണ്ടാകുന്ന അനാവശ്യമായ നിരസിക്കലുകൾ കുറയ്ക്കുന്നതിനായി chatgpt.com/cyber⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) ൽ വിശ്വസനീയമായ ആക്സസിന് അപേക്ഷിക്കാം.
പൊതുജനങ്ങൾക്കായി നിർണായക അടിസ്ഥാന സൗകര്യങ്ങളെ സംരക്ഷിക്കാൻ സഹായിക്കുന്നതിനായി ഞങ്ങൾ സർക്കാർ പങ്കാളികളുമായി ചേർന്ന് പ്രവർത്തിച്ചുകൊണ്ടിരിക്കുന്നു. ഒരുമിച്ച്, പ്രധാനപ്പെട്ട നികുതിദായകരുടെ ഡാറ്റ സുരക്ഷിതമാക്കുന്ന ഡിജിറ്റൽ സംവിധാനങ്ങൾ മുതൽ പ്രാദേശിക സമൂഹങ്ങളിലെ വൈദ്യുതി ഗ്രിഡും ജലവിതരണ സംവിധാനങ്ങളും വരെ, ആളുകൾ ആശ്രയിക്കുന്ന സംവിധാനങ്ങൾക്ക് ഉത്തരവാദികളായ വിശ്വസ്ത ഉദ്യോഗസ്ഥരുടെ പ്രതിരോധ പ്രവർത്തനത്തെ വിപുലമായ AI-യ്ക്ക് എങ്ങനെ പിന്തുണയ്ക്കാനാകുമെന്ന് ഞങ്ങൾ അന്വേഷിച്ചുകൊണ്ടിരിക്കുന്നു.

ഞങ്ങൾ GPT‑5.5‑ന്റെ ബയോളജിക്കൽ/കെമിക്കൽ, സൈബർസുരക്ഷാ ശേഷികളെ ഞങ്ങളുടെ പ്രിപെയർഡ്നസ് ഫ്രെയിംവർക്ക്⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) പ്രകാരം ഉയർന്നതായി പരിഗണിക്കുന്നു. GPT‑5.5 നിർണായക സൈബർസുരക്ഷാ ശേഷി നില കൈവരിച്ചിട്ടില്ലെങ്കിലും, GPT‑5.4 നെ അപേക്ഷിച്ച് അതിന്റെ സൈബർസുരക്ഷാ കഴിവുകൾ ഒരു പടി മുന്നിലാണെന്ന് ഞങ്ങളുടെ മൂല്യനിർണയങ്ങളും പരിശോധനകളും കാണിച്ചു.

കൂടാതെ, GPT‑5.5 പുറത്തിറക്കുന്നതിന് മുമ്പ് ഞങ്ങളുടെ സമ്പൂർണ്ണ സുരക്ഷാ-ഗവേണൻസ് പ്രക്രിയയിലൂടെ കടന്നുപോയി. ഇതിൽ തയ്യാറെടുപ്പ് വിലയിരുത്തലുകൾ, ഡൊമെയ്ൻ-നിർദ്ദിഷ്ട പരിശോധന, ഉയർന്ന ജീവശാസ്ത്ര, സൈബർസുരക്ഷാ കഴിവുകൾ ലക്ഷ്യമിട്ടുള്ള പുതിയ വിലയിരുത്തലുകൾ, കൂടാതെ ബാഹ്യ വിദഗ്ധരുമായി ചേർന്ന് നടത്തിയ ശക്തമായ പരിശോധന എന്നിവ ഉൾപ്പെടുന്നു. ഞങ്ങൾ GPT‑5.5 സിസ്റ്റം കാർഡ്⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു)യിൽ കൂടുതൽ വിശദാംശങ്ങൾ പങ്കുവയ്ക്കുന്നു.

ഈ പ്രവർത്തനം AI പ്രതിരോധക്ഷമതയിലേക്കുള്ള ഞങ്ങളുടെ വിശാലമായ സമീപനത്തെ പ്രതിഫലിപ്പിക്കുന്നു, മോഡൽ കഴിവുകൾ മുന്നേറുന്നതിനാൽ ഇത് ആവശ്യമാണെന്ന് ഞങ്ങൾ വിശ്വസിക്കുന്നു. സിസ്റ്റങ്ങളെയും സ്ഥാപനങ്ങളെയും പൊതുജനങ്ങളെയും സംരക്ഷിക്കാൻ ഉപയോഗിക്കുന്ന ആളുകൾക്ക് ശക്തമായ AI ലഭ്യമാകണമെന്ന് ഞങ്ങൾ ആഗ്രഹിക്കുന്നു. പ്രായോഗികമായ മാർഗം വിശ്വസനീയമായ ആക്‌സസ്, കഴിവുകൾക്കനുസരിച്ച് വ്യാപിക്കുന്ന ശക്തമായ സുരക്ഷാ മുൻകരുതലുകൾ, കൂടാതെ ഗുരുതരമായ ദുരുപയോഗം കണ്ടെത്താനും പ്രതികരിക്കാനും ഉള്ള പ്രവർത്തന ശേഷി എന്നിവയാണ്.

ലഭ്യതയും വിലനിർണ്ണയവും

ChatGPT‑ൽ, Plus, Pro, Business, Enterprise ഉപയോക്താക്കൾക്ക് GPT‑5.5 Thinking ലഭ്യമാണ്. Pro, Business, Enterprise ഉപയോക്താക്കൾക്ക് കൂടുതൽ സങ്കീർണ്ണമായ ചോദ്യങ്ങൾക്കും കൂടുതൽ കൃത്യതയുള്ള ജോലികൾക്കുമായി രൂപകൽപ്പന ചെയ്ത GPT‑5.5 Pro ലഭ്യമാണ്.

Codex-ൽ, Plus, Pro, Business, Enterprise, Edu, Go പ്ലാനുകളിൽ GPT‑5.5 400K കോൺടെക്സ്റ്റ് വിൻഡോയോടെ ലഭ്യമാണ്. GPT‑5.5 Fast mode-ലും ലഭ്യമാണ്, 2.5x ചെലവിൽ 1.5x വേഗത്തിൽ ടോക്കൺ സൃഷ്ടിക്കുന്നു.

API ഡെവലപ്പർമാർക്കായി, gpt-5.5 ഉടൻ റെസ്പോൺസസ് API-യിലും ചാറ്റ് കംപ്ലീഷൻസ് API-യിലും ലഭ്യമാകും. 1M ഇൻപുട്ട് ടോക്കണുകൾക്ക് $5, 1M ഔട്ട്പുട്ട് ടോക്കണുകൾക്ക് $30 എന്ന നിരക്കിൽ ലഭ്യമാണ്, കൂടാതെ 1M കോൺടെക്സ്റ്റ് വിൻഡോയും ഉണ്ടായിരിക്കും. Batch, Flex വില സ്റ്റാൻഡേർഡ് API നിരക്കിന്റെ പകുതിയായി ലഭ്യമാണ്, അതേസമയം Priority പ്രോസസ്സിംഗ് സ്റ്റാൻഡേർഡ് നിരക്കിന്റെ 2.5 മടങ്ങ് നിരക്കിൽ ലഭ്യമാണ്. ഇനിയും ഉയർന്ന കൃത്യതയ്ക്കായി, API-ൽ gpt-5.5-proയും ഞങ്ങൾ അവതരിപ്പിക്കും. ഇതിന് 1M ഇൻപുട്ട് ടോക്കണുകൾക്ക് $30, 1M ഔട്ട്പുട്ട് ടോക്കണുകൾക്ക് $180 എന്ന നിരക്കിൽ ലഭ്യമാണ്. പൂർണ്ണ വിശദാംശങ്ങൾക്കായി വിലനിർണ്ണയ പേജ്⁠ കാണുക.

അതേസമയം, GPT‑5.5‑ന്റെ വില GPT‑5.4‑നെക്കാൾ കൂടുതലാണ് ഇത് കൂടുതൽ ബുദ്ധിയുള്ളതും ടോക്കൺ കാര്യക്ഷമതയിൽ വളരെ മെച്ചപ്പെട്ടതുമാണ്. Codex-ൽ, മിക്ക ഉപയോക്താക്കൾക്കും GPT‑5.4‑നെക്കാൾ കുറച്ച് ടോക്കണുകൾ ഉപയോഗിച്ച് GPT‑5.5 മികച്ച ഫലങ്ങൾ നൽകുന്ന തരത്തിൽ ഞങ്ങൾ അനുഭവം ശ്രദ്ധാപൂർവം ക്രമീകരിച്ചിട്ടുണ്ട്. അതേസമയം, സബ്‌സ്‌ക്രിപ്ഷൻ ലെവലുകളിലുടനീളം ഉദാരമായ ഉപയോഗപരിധി തുടർന്നും നൽകിക്കൊണ്ടിരിക്കുന്നു.

വിലയിരുത്തലുകൾ

കോഡിംഗ്

എവാല്യൂവേഷൻ	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	ജെമിനി 3.1 Pro
SWE-Bench Pro (പൊതുവായത്) *	58.6%	57.7%	-	-	64.3%	54.2%
Terminal-Bench 2.0	82.7%	75.1%	-	-	69.4%	68.5%
Expert-SWE (ആന്തരികം)	73.1%	68.5%	-	-	-	-

^*^{ഈ മൂല്യനിർണയത്തിൽ}^{മനപ്പാഠമാക്കിയതിന്റെ തെളിവുകൾ}⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു)^{ലാബുകൾ ശ്രദ്ധിച്ചിട്ടുണ്ട്}

പ്രൊഫഷണൽ

എവാല്യൂവേഷൻ	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	ജെമിനി 3.1 Pro
GDPval (വിജയങ്ങൾ അല്ലെങ്കിൽ സമനില)	84.9%	83.0%	82.3%	82.0%	80.3%	67.3%
FinanceAgent v1.1	60.0%	56.0%	-	61.5%	64.4%	59.7%
നിക്ഷേപ ബാങ്കിംഗ് മോഡലിംഗ് ടാസ്കുകൾ (ആന്തരികം)	88.5%	87.3%	88.6%	83.6%	-	-
OfficeQA Pro	54.1%	53.2%	-	-	43.6%	18.1%

കമ്പ്യൂട്ടർ ഉപയോഗവും വിഷനും

എവാല്യൂവേഷൻ	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	ജെമിനി 3.1 Pro
OSWorld-സ്ഥിരീകരിച്ചത്	78.7%	75.0%	-	-	78.0%	-
MMMU Pro (ഉപകരണങ്ങളില്ല)	81.2%	81.2%	-	-	-	80.5%
MMMU Pro (ടൂളുകൾ ഉൾപ്പെടെ)	83.2%	82.1%	-	-	-	-

ഉപകരണങ്ങളുടെ ഉപയോഗം

എവാല്യൂവേഷൻ	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	ജെമിനി 3.1 Pro
BrowseComp	84.4%	82.7%	90.1%	89.3%	79.3%	85.9%
MCP അറ്റ്ലസ്**	75.3%	70.6%	-	-	79.1%	78.2%
Toolathlon	55.6%	54.6%	-	-	-	48.8%
Tau2-bench ടെലികോം*** (ഒറിജിനൽ പ്രോംപ്റ്റ്)	98.0%	92.8%	-	-	-	-

^{** MCP അറ്റ്ലസ്: 2026 ഏപ്രിലിലെ ഏറ്റവും പുതിയ അപ്‌ഡേറ്റിന് ശേഷമുള്ള Scale AI-യുടെ ഫലങ്ങൾ.
*** Tau2-bench Telecom: 5.5-നും 5.4-നും വേണ്ടിയുള്ള ഫലങ്ങൾ, ഒറിജിനൽ പ്രോംപ്റ്റുകൾ ഉപയോഗിച്ച്, അതായത് പ്രോംപ്റ്റിൽ യാതൊരു ക്രമീകരണവും ഇല്ലാതെ. ഇത് പ്രോംപ്റ്റ് ക്രമീകരണങ്ങളോടെ വിലയിരുത്തപ്പെട്ട മറ്റ് ലാബുകളിൽ നിന്നുള്ള ഫലങ്ങൾ ഒഴിവാക്കുന്നു.}

അക്കാദമിക്

എവാല്യൂവേഷൻ	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	ജെമിനി 3.1 Pro
GeneBench	25.0%	19.0%	33.2%	25.6%	-	-
ഫ്രോണ്ടിയർമാത്ത് ടയർ 1–3	51.7%	47.6%	52.4%	50.0%	43.8%	36.9%
ഫ്രോണ്ടിയർമാത്ത് ടയർ 4	35.4%	27.1%	39.6%	38.0%	22.9%	16.7%
BixBench	80.5%	74.0%	-	-	-	-
GPQA Diamond	93.6%	92.8%	-	94.4%	94.2%	94.3%
ഹ്യുമാനിറ്റീസ് അവസാന പരീക്ഷ (ടൂളുകളില്ല)	41.4%	39.8%	43.1%	42.7%	46.9%	44.4%
ഹ്യുമാനിറ്റീസ് അവസാന പരീക്ഷ (ടൂളുകളോടെ)	52.2%	52.1%	57.2%	58.7%	54.7%	51.4%

സൈബർസുരക്ഷ

എവാല്യൂവേഷൻ	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	ജെമിനി 3.1 Pro
ക്യാപ്ചർ-ദി-ഫ്ലാഗ്സ് ചലഞ്ച് ടാസ്കുകൾ (ആന്തരികം)****	88.1%	83.7%	-	-	-	-
CyberGym	81.8%	79.0%	-	-	73.1%	-

^{**** സിസ്റ്റം കാർഡുകളിൽ ഉപയോഗിക്കുന്ന ഏറ്റവും കഠിനമായ CTF-കളുടെ വിപുലീകരിച്ച രൂപം, ഒപ്പം കൂടുതൽ കടുപ്പമേറിയ വെല്ലുവിളികളും.}

ലോംഗ് കോൺടെക്സ്റ്റ്

എവാല്യൂവേഷൻ	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	ജെമിനി 3.1 Pro
Graphwalks BFS 256k f1	73.7%	62.5%	-	-	76.9%	-
Graphwalks BFS 1mil f1	45.4%	9.4%	-	-	41.2% (Opus 4.6)	-
Graphwalks പാരന്റുകൾ 256k f1	90.1%	82.8%	-	-	93.6%	-
Graphwalks പാരന്റുകൾ 1mil f1	58.5%	44.4%	-	-	72.0% (Opus 4.6)	-
OpenAI MRCR v2 8-നീഡിൽ 4K-8K	98.1%	97.3%	-	-	-	-
OpenAI MRCR v2 8-നീഡിൽ 8K-16K	93.0%	91.4%	-	-	-	-
OpenAI MRCR v2 8-നീഡിൽ 16K-32K	96.5%	97.2%	-	-	-	-
OpenAI MRCR v2 8-നീഡിൽ 32K-64K	90.0%	90.5%	-	-	-	-
OpenAI MRCR v2 8-നീഡിൽ 64K-128K	83.1%	86.0%	-	-	-	-
OpenAI MRCR v2 8-നീഡിൽ 128K-256K	87.5%	79.3%	-	-	59.2%	-
OpenAI MRCR v2 8-നീഡിൽ 256K-512K	81.5%	57.5%	-	-	-	-
OpenAI MRCR v2 8-നീഡിൽ 512K-1M	74.0%	36.6%	-	-	32.2%	-

അബ്സ്ട്രാക്റ്റ് റീസണിംഗ്

എവാല്യൂവേഷൻ	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	ജെമിനി 3.1 Pro
ARC-AGI-1 (സ്ഥിരീകരിച്ചത്)	95.0%	93.7%	-	94.5%	93.5%	98.0%
ARC-AGI-2 (സ്ഥിരീകരിച്ചത്)	85.0%	73.3%	-	83.3%	75.8%	77.1%

റീസണിംഗ് ശ്രമം xhigh ആയി സജ്ജമാക്കി GPT‑യുടെ Evals പ്രവർത്തിപ്പിച്ചു, കൂടാതെ അവ ഒരു ഗവേഷണ പരിസ്ഥിതിയിൽ നടത്തപ്പെട്ടവയാണ്, ചില സാഹചര്യങ്ങളിൽ ഇത് പ്രൊഡക്ഷൻ ChatGPT‑ൽ നിന്ന് അല്പം വ്യത്യസ്തമായ ഔട്ട്പുട്ട് നൽകാൻ സാധ്യതയുണ്ട്.