ஏப்ரல் 24, 2026 அன்று புதுப்பிக்கப்பட்டது: GPT‑5.5 மற்றும் GPT‑5.5 Pro ஆகியவை இப்போது API-இல் கிடைக்கின்றன. பொருந்தக்கூடிய கூடுதல் பாதுகாப்பு அம்சங்களை விவரிக்கும் வகையில்சிஸ்டம் கார்டும் புதுப்பிக்கப்பட்டுள்ளது.
நாங்கள் GPT‑5.5‑ஐ வெளியிடுகிறோம். இது இதுவரை எங்களின் மிகவும் புத்திசாலித்தனமான மற்றும் பயன்படுத்த மிகவும் உள்ளுணர்வான மாடல், மேலும் கணினியில் வேலைகளைச் செய்து முடிக்கும் புதிய முறைக்கான அடுத்த படியாகும்.
GPT‑5.5 நீங்கள் செய்ய முயற்சிப்பதை வேகமாகப் புரிந்து, வேலையின் பெரும்பகுதியை தானாகவே மேற்கொள்ள முடியும். இது குறியீடு எழுதுதல், பிழைத்திருத்தம், இணைய ஆய்வு, தரவுப் பகுப்பாய்வு, ஆவணங்கள் மற்றும் விரிதாள்களை உருவாக்குதல், மென்பொருளை இயக்குதல் மற்றும் ஒரு பணி முடியும் வரை கருவிகளுக்கிடையே நகர்வதில் சிறந்து விளங்குகிறது. ஒவ்வொரு படியையும் கவனமாக நிர்வகிக்காமல், பல பகுதிகளைக் கொண்ட ஒரு குழப்பமான பணியை GPT‑5.5‑க்கு வழங்கி, அது திட்டமிடவும், கருவிகளைப் பயன்படுத்தவும், தனது பணியைச் சரிபார்க்கவும், தெளிவின்மையை சமாளிக்கவும், தொடர்ந்து செயல்படவும் செய்யும் என்று நம்பலாம்.
ஏஜென்டிக் குறியீடாக்கம், கணினிப் பயன்பாடு, அறிவுசார் பணி மற்றும் ஆரம்பகால அறிவியல் ஆராய்ச்சி போன்ற துறைகளில் இந்த முன்னேற்றங்கள் குறிப்பாக வலுவாக உள்ளன. இத்துறைகளில், சூழல்களுக்கு அப்பாற்பட்ட ரீஸனிங்கையும், காலப்போக்கில் நடவடிக்கை எடுப்பதையும் சார்ந்தே முன்னேற்றம் அமைகிறது. வேகத்தில் சமரசம் செய்யாமல், நுண்ணறிவில் இந்த உயர்வை GPT‑5.5 வழங்குகிறது: பெரியதும் அதிக திறன் கொண்டதுமான மாடல்கள் பொதுவாக வழங்கும் போது மெதுவாக இருக்கும். ஆனால் GPT‑5.5, நிஜ உலகில் வழங்கும் போது GPT‑5.4 போலவே டோக்கன் தாமதத்தை வைத்துக்கொண்டு, அதைவிட மிகவும் உயர்ந்த நுண்ணறிவு மட்டத்தில் செயல்படுகிறது. அதே Codex பணிகளை முடிக்க இது குறிப்பிடத்தக்க அளவில் குறைவான டோக்கன்களை பயன்படுத்துகிறது; அதனால் இது அதிக திறன் கொண்டதோடு மேலும் திறமையானதாகவும் இருக்கிறது.
பயனுள்ள பணிகளுக்கான அணுகலைப் பேணிக்கொண்டே, தவறாகப் பயன்படுத்தப்படுவதை குறைக்கும் வகையில் வடிவமைக்கப்பட்ட எங்களுடைய இதுவரை மிக வலுவான பாதுகாப்பு நடவடிக்கைகளுடன் GPT‑5.5 ஐ நாங்கள் வெளியிடுகிறோம். வெளியீட்டிற்கு முன், இந்த மாடலை எங்கள் பாதுகாப்பு மற்றும் தயார்நிலை கட்டமைப்புகளின் முழுத் தொகுப்பில் மதிப்பீடு செய்தோம், உள்ளக மற்றும் வெளிப்புற ரெட் டீமர்களுடன் இணைந்து பணியாற்றினோம், மேம்பட்ட சைபர் பாதுகாப்பு மற்றும் உயிரியல் திறன்களுக்காக இலக்காகக் கொண்ட சோதனைகளைச் சேர்த்தோம், மேலும் சுமார் 200 நம்பகமான ஆரம்ப அணுகல் கூட்டாளர்களிடமிருந்து நிஜ பயன்பாட்டு நிகழ்வுகள் குறித்த கருத்துக்களையும் சேகரித்தோம்.
இன்று, ChatGPT மற்றும் Codex-இல் GPT‑5.5 Plus, Pro, Business, மற்றும் Enterprise பயனர்களுக்கு வெளியிடப்படுகிறது, மேலும் ChatGPT‑இல் GPT‑5.5 Pro, Pro, Business, மற்றும் Enterprise பயனர்களுக்கு வெளியிடப்படுகிறது. API பயன்பாட்டு அமலாக்கங்களுக்கு வேறுபட்ட பாதுகாப்பு நடவடிக்கைகள் தேவைப்படுகின்றன, மேலும் அதை பெரிய அளவில் வழங்குவதற்கான பாதுகாப்பு மற்றும் பாதுகாப்புத்தன்மை தேவைகள் குறித்து நாங்கள் கூட்டாளிகளுடனும் வாடிக்கையாளர்களுடனும் நெருக்கமாக பணியாற்றி வருகிறோம். GPT‑5.5 மற்றும் GPT‑5.5 Pro இரண்டையும் மிக விரைவில் API க்கு கொண்டு வருகிறோம்.
GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro | |
டெர்மினல்-பெஞ்ச் 2.0 | 82.7% | 75.1% | - | - | 69.4% | 68.5% |
நிபுணர்-SWE (உள்) | 73.1% | 68.5% | - | - | - | - |
GDPval (வெற்றி அல்லது சமநிலை) | 84.9% | 83.0% | 82.3% | 82.0% | 80.3% | 67.3% |
OSWorld சரிபாரிக்கப்பட்டது | 78.7% | 75.0% | - | - | 78.0% | - |
Toolathlon | 55.6% | 54.6% | - | - | - | 48.8% |
BrowseComp | 84.4% | 82.7% | 90.1% | 89.3% | 79.3% | 85.9% |
FrontierMath அடுக்கு 1–3 | 51.7% | 47.6% | 52.4% | 50.0% | 43.8% | 36.9% |
FrontierMath அடுக்கு 4 | 35.4% | 27.1% | 39.6% | 38.0% | 22.9% | 16.7% |
CyberGym | 81.8% | 79.0% | - | - | 73.1% | - |
OpenAI, ஏஜென்டிக் AI-க்கான உலகளாவிய உள்கட்டமைப்பை உருவாக்கி வருகிறது. இது உலகம் முழுவதும் உள்ள மக்களும் வணிகங்களும் AI-ஐ பயன்படுத்தி தங்கள் பணிகளைச் செய்து முடிக்க உதவுகிறது. கடந்த ஒரு ஆண்டில், AI மென்பொருள் பொறியியலை மிகுந்த வேகமாக துரிதப்படுத்தியதை நாம் கண்டுள்ளோம். Codex மற்றும் ChatGPT இல் GPT‑5.5 உடன், அதே மாற்றம் அறிவியல் ஆராய்ச்சிக்கும், மக்கள் கணினிகளில் மேற்கொள்ளும் பரந்த பணிகளுக்கும் விரிவடையத் தொடங்கியுள்ளது.
இந்த துறைகளில், GPT‑5.5 வெறும் அதிக நுண்ணறிவு கொண்டது மட்டுமல்ல; அது பிரச்சினைகளை தீர்க்கும் விதத்தில் மேலும் செயல்திறன் கொண்டது, மேலும் குறைவான டோக்கன்களையும் மறுமுயற்சிகளையும் கொண்டு உயர்தரமான முடிவுகளை அடைகிறது. Artificial Analysis's Coding Index இல், GPT‑5.5 போட்டியாளர்களின் அதிநவீன குறியீட்டு மாடல்களின் செலவின் பாதி செலவில் முன்னணி நுண்ணறிவை வழங்குகிறது.
Artificial Analysis Intelligence Index(புதிய சாளரத்தில் திறக்கும்) என்பது ஒரு வெளிப்புற தரப்பால் நடத்தப்பட்ட 10 மதிப்பீடுகளின் எடையிட்ட சராசரி ஆகும்: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.
GPT‑5.5 இன்றுவரை எங்களின் மிக வலிமையான ஏஜன்டிக் குறியீட்டு மாடல் ஆகும். திட்டமிடல், மீளுருவாக்கம் மற்றும் கருவி ஒருங்கிணைப்பு தேவைப்படும் சிக்கலான கட்டளை-வரி பணிப்பாய்வுகளைச் சோதிக்கும் டெர்மினல்-பெஞ்ச் 2.0 இல், இது 82.7% என்ற முன்னணி துல்லியத்தை அடைகிறது. நிஜ உலக GitHub சிக்கல் தீர்வை மதிப்பிடும் SWE-Bench Pro இல், இது 58.6%-ஐ எட்டுகிறது; முந்தைய மாடல்களை விட ஒரே முயற்சியில் தொடக்கம் முதல் முடிவு வரை அதிக பணிகளைத் தீர்க்கிறது. Expert-SWE இல், மனிதர்கள் முடிக்க மதிப்பிடப்பட்ட நடுக்கால நேரம் 20 மணி நேரமாக உள்ள நீண்டகால கோடிங் பணிகளுக்கான எங்கள் உள்துறை அதிநவீன மதிப்பீட்டில், GPT‑5.5, GPT‑5.4 ஐ விட சிறப்பாக செயல்படுகிறது.
மூன்று மதிப்பீடுகளிலும், GPT‑5.5, GPT‑5.4‑இன் குறைவான டோக்கன்களைப் பயன்படுத்தி மதிப்பெண்கள்.
மாடலின் குறியீட்டுத் திறன்கள் குறிப்பாக Codex இல் தெளிவாக வெளிப்படுகின்றன; அங்கு அது செயல்படுத்தல் மற்றும் மறுசீரமைப்பு முதல் பிழைத்திருத்தம், சோதனை மற்றும் சரிபார்ப்பு வரை பொறியியல் பணிகளை மேற்கொள்ள முடியும். ஆரம்பகட்ட சோதனைகள், பெரிய அமைப்புகள் முழுவதும் சூழலைத் தொடர்ந்து தக்கவைத்தல், தெளிவற்ற தோல்விகளை ரீஸனிங் மூலம் பகுத்தறிதல், கருவிகளின் உதவியுடன் முன்கணிப்புகளைச் சரிபார்த்தல், மற்றும் சுற்றியுள்ள கோட்பேஸ் முழுவதும் மாற்றங்களைத் தொடர்ந்து செயல்படுத்துதல் போன்ற, உண்மையான பொறியியல் பணிகள் சார்ந்திருக்கும் செயல்பாடுகளில் GPT‑5.5 சிறப்பாக செயல்படுகிறது என்பதை காட்டுகின்றன.
காட்சிப்படுத்தப்பட்ட பாதை, Orion, நிலா மற்றும் சூரியன் ஆகியவற்றிற்கான NASA/JPL Horizons வெக்டர் தரவை பயன்படுத்துகிறது; வாசிப்பதற்கான எளிமைக்காக காட்சி அளவுமாற்றம் பயன்படுத்தப்பட்டுள்ளது.
ப்ராம்ப்ட்: [attached image] Artemis II பயணத்தின் உண்மையான தரவைப் பயன்படுத்தி, WebGL மற்றும் Vite மூலம் இதை ஒரு புதிய செயலியாக உருவாக்கவும். செயலி முழுமையாகச் செயல்படும் நிலையில் இருந்து, படத்தில் உள்ள செயலியைப் போலவே தோற்றமளிக்கிறது என்பதை உறுதிப்படுத்தும் வரை அதை முழுமையாகச் சோதிக்க வேண்டும். கோள்களின் ரெண்டரிங் மற்றும் பறக்கும் பாதைகளில் உன்னிப்பாக கவனம் செலுத்த வேண்டும். நான் 3D ரெண்டரிங்குடன் ஊடாட முடியும் வகையில் இருக்க விரும்புகிறேன். அதில் யதார்த்தமான சுற்றுப்பாதை இயக்கவியல் உள்ளதா என்பதை உறுதிப்படுத்தவும்.
அளவுகோல்களைத் தாண்டி, ஆரம்ப சோதனையாளர்கள் GPT‑5.5 ஒரு அமைப்பின் வடிவத்தைப் புரிந்துகொள்ளும் திறனில் மேம்பட்டது என்று கூறினர்: ஏதாவது தோல்வியடைவதற்கான காரணம், திருத்தம் எங்கு செய்யப்பட வேண்டும், மேலும் குறியீட்டுத் தளத்தில் வேறு எது பாதிக்கப்படும் என்பதையும்.

“நான் பயன்படுத்திய கோடிங் மாடல்களில் தீவிரமான கருத்தியல் தெளிவு கொண்ட முதல் மாடல்.”
Dan Shipper, Every நிறுவனத்தின் நிறுவனர் மற்றும் CEO, GPT‑5.5‑ஐ “நான் பயன்படுத்தியவற்றில் தீவிரமான கருத்துத் தெளிவு கொண்ட முதல் குறியீட்டுக்கான மாடல்” என்று விவரித்தார்.
ஒரு செயலியை வெளியிட்ட பிறகு, வெளியீட்டுக்குப் பிறகான ஒரு சிக்கலைப் பிழைத்திருத்துவதில் அவர் பல நாட்கள் செலவிட்டார்; அதன் பிறகு, அமைப்பின் ஒரு பகுதியை மறுபடியும் எழுதச் செய்வதற்காக தனது சிறந்த பொறியாளர்களில் ஒருவரை அழைத்து வந்தார். GPT‑5.5‑ஐச் சோதிக்க, அவர் திறம்பட காலத்தைப் பின்னோக்கிச் சுழற்றினார்: அந்த மாடல், பழுதடைந்த நிலையைக் கருத்தில் கொண்டு, பொறியாளர் இறுதியில் முடிவு செய்த அதே வகையான திருத்தத்தை உருவாக்க முடியுமா? GPT‑5.4‑ஆல் முடியவில்லை. GPT‑5.5‑ஆல் முடிந்தது.

“நான் உயர்ந்த நுண்ணறிவுடன் வேலை செய்கிறேன் என்று உண்மையிலேயே உணர்கிறேன், மேலும் மரியாதை உணர்வும் ஏற்படுகிறது.”
Pietro Schirano, MagicPath நிறுவனத்தின் CEO, GPT‑5.5 நூற்றுக்கணக்கான முன்புற மற்றும் ரீஃபாக்டர் மாற்றங்கள் கொண்ட ஒரு கிளை நிறுவனத்தை, குறிப்பிடத்தக்க அளவில் மாற்றப்பட்டிருந்த ஒரு முதன்மை நிறுவனத்துடன் ஒருங்கிணைத்தபோது, அதேபோன்ற பெரிய முன்னேற்றத்தைக் கண்டார்; இந்த வேலை சுமார் 20 நிமிடங்களில் ஒரே முயற்சியில் (ஒன்-ஷாட்) தீர்க்கப்பட்டது.
மாடலை சோதித்த மூத்த பொறியாளர்கள், GPT‑5.5 என்பது ரீஸனிங் மற்றும் தன்னாட்சியில் GPT‑5.4 மற்றும் Claude Opus 4.7-ஐ விட குறிப்பிடத்தக்க அளவில் வலிமையானது என்றும், வெளிப்படையான தூண்டுதல் இல்லாமலேயே சிக்கல்களை முன்கூட்டியே கண்டறிந்து சோதனை மற்றும் மதிப்பாய்வு தேவைகளை கணித்தது என்றும் தெரிவித்தனர். ஒரு சந்தர்ப்பத்தில், ஒரு பொறியாளர் ஒரு கூட்டு markdown editor இல் உள்ள கருத்து அமைப்பை மறுகட்டமைக்கச் கேட்டார்; அவர் திரும்பி வந்தபோது, கிட்டத்தட்ட முடிந்திருந்த 12-diff stack ஒன்று அவருக்குக் கிடைத்தது. மற்றவர்கள் கூறியதாவது, செயல்படுத்தலில் எதிர்பாராத அளவில் மிகக் குறைவான திருத்தமே தேவைப்பட்டதாகவும், GPT‑5.4 உடன் ஒப்பிடும்போது GPT‑5.5 இன் திட்டங்களில் அதிக நம்பிக்கை கொண்டதாகவும் இருந்தது.
அந்த மாடலை முன்கூட்டியே அணுகும் வாய்ப்பைப் பெற்றிருந்த என்விடியா நிறுவனத்தின் ஒரு பொறியாளர், "GPT‑5.5‑ஐ அணுகும் வாய்ப்பை இழந்தது, என் ஒரு கை அல்லது கால் துண்டிக்கப்பட்டது போல் உணர்கிறேன்" என்று கூறும் அளவுக்குச் சென்றார்.
“GPT-5.5, GPT-5.4 ஐ விட குறிப்பிடத்தக்க அளவில் மேலும் புத்திசாலித்தனமானதும் மேலும் விடாமுயற்சியுடையதும் ஆகும், மேம்பட்ட குறியீட்டு செயல்திறன் மற்றும் மேலும் நம்பகமான கருவி பயன்பாட்டுடன். இது முன்கூட்டியே நிற்காமல், குறிப்பிடத்தக்க அளவில் அதிக நேரம் பணியில் கவனம் சிதறாமல் தொடர்கிறது; எங்கள் பயனர்கள் Cursor-க்கு ஒப்படைக்கும் சிக்கலான, நீண்ட நேரம் இயங்கும் பணிகளுக்கு இது மிகவும் முக்கியமானது.”
GPT‑5.5‑ஐ குறியீட்டெழுதலில் சிறப்பாக ஆக்கும் அதே பலங்கள், கணினியில் செய்யும் அன்றாட வேலைகளுக்கும் அதை சக்திவாய்ந்ததாக ஆக்குகின்றன. மாடல் நோக்கத்தைப் புரிந்துகொள்வதில் சிறப்பாக இருப்பதால், அது அறிவுப் பணியின் முழு லூப்பில் மேலும் இயல்பாக நகர முடியும்: தகவலைக் கண்டுபிடித்தல், முக்கியமானது எது என்பதைப் புரிந்துகொள்வது, கருவிகளைப் பயன்படுத்துவது, வெளியீட்டைச் சரிபார்ப்பது, மற்றும் மூலப் பொருளை பயனுள்ள ஒன்றாக மாற்றுவது.
Codex இல், GPT‑5.5 ஆவணங்கள், ஸ்பிரெட்ஷீட்கள் மற்றும் ஸ்லைடு வழங்கல்களை உருவாக்குவதில் GPT‑5.4‑ஐ விட சிறப்பாக செயல்படுகிறது. ஆல்பா சோதனையாளர்கள், செயல்பாட்டு ஆராய்ச்சி, ஸ்பிரெட்ஷீட் மாதிரியாக்கம் மற்றும் குழப்பமான வணிக உள்ளீடுகளை திட்டங்களாக மாற்றுவது போன்ற பணிகளில், இது முந்தைய மாடல்களை விட சிறப்பாக செயல்பட்டதாக தெரிவித்தனர். Codex இன் கணினி பயன்பாட்டு திறன்களுடன் இணைந்தபோது, GPT‑5.5 திரையில் இருப்பதைப் பார்த்து, கிளிக் செய்து, தட்டச்சு செய்து, இடைமுகங்களில் வழிசென்று, கருவிகள் முழுவதும் துல்லியமாக நகர்ந்து, மாடல் உண்மையில் உங்களுடன் சேர்ந்து கணினியைப் பயன்படுத்த முடியும் என்ற உணர்வை உருவாக்குகிறது.
OpenAI-இல் உள்ள குழுக்கள் இந்த பலங்களை உண்மையான பணிப்பாய்வுகளில் ஏற்கனவே பயன்படுத்தி வருகின்றன. இன்று, நிறுவனத்தின் 85% க்கும் மேற்பட்டோர் மென்பொருள் பொறியியல், நிதி, தகவல்தொடர்பு, சந்தைப்படுத்தல், தரவு அறிவியல் மற்றும் தயாரிப்பு மேலாண்மை உள்ளிட்ட பல்வேறு செயல்பாடுகளில் ஒவ்வொரு வாரமும் Codex ஐப் பயன்படுத்துகின்றனர். Comms குழுவில், அணி Codex இல் GPT‑5.5 ஐ பயன்படுத்தி ஆறு மாதங்களுக்கான பேச்சு கோரிக்கை தரவை பகுப்பாய்வு செய்து, ஒரு மதிப்பீட்டு மற்றும் ஆபத்து கட்டமைப்பை உருவாக்கி, தானியக்கமான Slack ஏஜென்டை சரிபார்த்தது; இதனால் குறைந்த ஆபத்துள்ள கோரிக்கைகள் தானாகவே கையாளப்படலாம், மேலும் அதிக ஆபத்துள்ள கோரிக்கைகள் இன்னும் மனித மதிப்பாய்வுக்கு வழிமாற்றப்படுகின்றன. நிதித் துறையில், குழு 71,637 பக்கங்கள் கொண்ட மொத்தம் 24,771 K-1 வரி படிவங்களை மதிப்பாய்வு செய்ய Codex-ஐ பயன்படுத்தியது; இதில் தனிப்பட்ட தகவல்களை விலக்கிய பணிப்பாய்வு பயன்படுத்தப்பட்டதால், முந்தைய ஆண்டுடன் ஒப்பிடும்போது இந்தப் பணியை இரண்டு வாரங்கள் முன்கூட்டியே முடிக்க குழுவுக்கு உதவியது. கோ-டு-மார்க்கெட் குழுவில், ஒரு ஊழியர் வாராந்திர வணிக அறிக்கைகளை உருவாக்குவதை தானியக்கமாக்கி, வாரத்திற்கு 5-10 மணிநேரத்தைச் சேமித்தார்.
ChatGPT இல், GPT‑5.5 Thinking கடினமான பிரச்சினைகளுக்கு வேகமான உதவியை வழங்குகிறது; புத்திசாலித்தனமான மற்றும் சுருக்கமான பதில்கள் சிக்கலான பணிகளைச் செய்ய உதவுகிறது. இது கோடிங், ஆராய்ச்சி, தகவல் ஒருங்கிணைப்பு மற்றும் பகுப்பாய்வு போன்ற தொழில்முறை பணிகளில், குறிப்பாக பிளகின்களைப் பயன்படுத்தும்போது சிறந்து விளங்குகிறது.
GPT‑5.5 Pro இல், ஆரம்ப சோதனையாளர்கள் ChatGPT மேற்கொள்ளக்கூடிய பணிகளின் சிக்கல்தன்மையிலும் தரத்திலும் குறிப்பிடத்தக்க முன்னேற்றத்தைக் காண்கிறார்கள். தாமத நேர மேம்பாடுகள் காரணமாக, இது அதிகக் கோரிக்கையுள்ள பணிகளுக்கு மிகவும் நடைமுறைக்கு ஏற்றதாக உள்ளது. GPT‑5.4 Pro-உடன் ஒப்பிடும்போது, GPT‑5.5 Pro-இன் பதில்கள் மேலும் விரிவானவை, நன்கு கட்டமைக்கப்பட்டவை, துல்லியமானவை, தொடர்புடையவை மற்றும் பயனுள்ளவை என்று சோதனையாளர்கள் கண்டறிந்தனர். குறிப்பாக வணிகம், சட்டம், கல்வி மற்றும் தரவு அறிவியல் ஆகிய துறைகளில் இது மிகவும் வலுவான செயல்திறனை வெளிப்படுத்தியது.
GPT‑5.5 இந்த வகையான பணியை பிரதிபலிக்கும் பல அளவுகோல்களில் அதிநவீன செயல்திறனை அடைகிறது. On GDPval, 44 தொழில்களில் நன்கு வரையறுக்கப்பட்ட அறிவுப் பணிகளை உருவாக்க ஏஜென்ட்களின் திறன்களை சோதிக்கும் இதில், GPT‑5.5 84.9% மதிப்பெண் பெறுகிறது. OSWorld-Verified ல், ஒரு மாடல் உண்மையான கணினி சூழல்களில் தானாகவே செயல்பட முடியுமா என்பதை அளக்கும் இதில், இது 78.7% ஐ அடைகிறது. மேலும், சிக்கலான வாடிக்கையாளர்-சேவை பணிப்பாய்வுகளைச் சோதிக்கும் Tau2-bench Telecom இல், ப்ராம்ப்ட் ட்யூனிங் இல்லாமல் இது 98.0%-ஐ எட்டுகிறது. GPT‑5.5 பிற அறிவுசார் பணி அளவுகோல்களிலும் வலுவாக செயல்படுகிறது: FinanceAgent இல் 60.0%, உள் முதலீட்டு வங்கி மாதிரியாக்கப் பணிகளில் 88.5%, மற்றும் OfficeQA Pro இல் 54.1%.
Tau2-bench Telecom ப்ராம்ப்ட் ட்யூனிங் இல்லாமல் இயக்கப்பட்டது (மேலும் GPT‑4.1 பயனர் மாடல் பயன்படுத்தப்பட்டது). GPT‑5.5 பணியின் நோக்கத்தை மேலும் நன்றாகப் புரிந்துகொள்கிறது மற்றும் அதன் முன்னோடிகளை விட மேலும் டோக்கன் திறனாக உள்ளது.
“GPT-5.5 செயல்படுத்தல்-மையமான பணிகளுக்கு தேவையான நீடித்த செயல்திறனை வழங்குகிறது. NVIDIA GB200 NVL72 அமைப்புகளில் உருவாக்கப்பட்டு சேவை செய்யப்படும் இந்த மாடல், இயல்பான மொழி ப்ராம்ப்ட்களிலிருந்து முழுமையான அம்சங்களை வழங்கவும், டிபக் செய்யும் நேரத்தை நாட்களிலிருந்து மணிநேரங்களாகக் குறைக்கவும், மேலும் சிக்கலான கோட்பேஸ்களில் பல வாரங்களாக நீளும் பரிசோதனைகளை ஒரே இரவில் கிடைக்கும் முன்னேற்றமாக மாற்றவும் எங்கள் அணிகளுக்கு உதவுகிறது. இது வெறும் வேகமான குறியீட்டாக்கத்தைவிட மேலானது—இது மக்கள் அடிப்படையிலேயே மாறுபட்ட வேகத்தில் செயல்பட உதவும் பணிபுரியும் புதிய முறையாகும்.”
GPT‑5.5, வெறும் ஒரு கடினமான கேள்விக்கு பதிலளிப்பதை விட அதிகம் தேவைப்படும் அறிவியல் மற்றும் தொழில்நுட்ப ஆராய்ச்சி பணிப்பாய்வுகளில் முன்னேற்றங்களை காட்டுகிறது. ஆராய்ச்சியாளர்கள் ஒரு யோசனையை ஆராயவும், ஆதாரங்களைச் சேகரிக்கவும், ஊகங்களைச் சோதிக்கவும், முடிவுகளை விளக்கிப் புரிந்துகொள்ளவும், அடுத்து எதை முயற்சிக்க வேண்டும் என்பதைத் தீர்மானிக்கவும் வேண்டும். GPT‑5.5, அந்த செயல்முறையில் தொடர்ந்து நிலைத்திருக்க மற்ற மாடல்களை விட சிறந்தது.
குறிப்பிடத்தக்க வகையில், மரபியல் மற்றும் அளவியல் உயிரியல் துறைகளில் பல-நிலை அறிவியல் தரவு பகுப்பாய்வில் கவனம் செலுத்தும் ஒரு புதிய மதிப்பீடான GeneBench(புதிய சாளரத்தில் திறக்கும்) இல், GPT‑5.5 என்பது GPT‑5.4 விட தெளிவான முன்னேற்றத்தைக் காட்டுகிறது. இந்தப் பிரச்சனைகளுக்கு, மாடல்கள் குறைந்தபட்ச மேற்பார்வை வழிகாட்டுதலுடன், தெளிவற்றதாகவோ அல்லது பிழையானதாகவோ இருக்கக்கூடிய தரவுகளைப் பற்றிப் பகுத்தறியவும், மறைக்கப்பட்ட குழப்பக்காரணிகள் அல்லது தரக்கட்டுப்பாட்டுத் தோல்விகள் போன்ற யதார்த்தமான தடைகளை எதிர்கொள்ளவும், நவீன புள்ளியியல் முறைகளைச் சரியாகச் செயல்படுத்தி விளக்கமளிக்கவும் தேவைப்படுகின்றன. இங்குள்ள பணிகள் பெரும்பாலும் அறிவியல் நிபுணர்களுக்கு பல நாள் நீளும் திட்டங்களுக்கு ஒப்பானவை என்பதை கருத்தில் கொள்ளும்போது, மாடலின் செயல்திறன் குறிப்பிடத்தக்கதாக உள்ளது.
அதேபோல், நிஜ உலக உயிரியல் தகவல் மற்றும் தரவுப் பகுப்பாய்வை மையமாகக் கொண்டு வடிவமைக்கப்பட்ட அளவுகோலான BixBench(புதிய சாளரத்தில் திறக்கும்)-இல், வெளியிடப்பட்ட மதிப்பெண்களைக் கொண்ட மாடல்களில் GPT‑5.5 முன்னணி செயல்திறனை பெற்றது. இந்த மாடலின் அறிவியல் திறன்கள், ஒரு உண்மையான இணை விஞ்ஞானியாக, உயிர்மருத்துவ ஆராய்ச்சியின் ஃப்ரண்டியர்களில் முன்னேற்றத்தை அர்த்தமுள்ள வகையில் விரைவுபடுத்தும் அளவுக்கு இப்போது வலுவாக உள்ளன.அதிநவீன
மற்றொரு எடுத்துக்காட்டில், தனிப்பயன் ஹார்னஸுடன் கூடிய GPT‑5.5‑இன் உள்புற பதிப்பு, இணைப்பியலின் மையப் பொருட்களில் ஒன்றான ராம்ஸி எண்கள் பற்றிய புதிய ஆதாரத்தை(புதிய சாளரத்தில் திறக்கும்) கண்டறிய உதவியது. சேர்க்கைக் கணிதம் தனித்தனி பொருட்கள் எவ்வாறு ஒன்றோடொன்று பொருந்துகின்றன என்பதை ஆய்வு செய்கிறது: வரைபடங்கள், வலைப்பின்னல்கள், தொகுப்புகள் மற்றும் வடிவங்கள். ராம்ஸி எண்கள் என்பது, தோராயமாகச் சொன்னால், ஏதோ ஒரு வகையான ஒழுங்கு நிச்சயமாக தோன்றுவதற்கு முன் ஒரு வலையமைப்பு எவ்வளவு பெரியதாக இருக்க வேண்டும் என்பதை கேட்கின்றன. இந்த துறையில் முடிவுகள் அரிதானவை மற்றும் பெரும்பாலும் தொழில்நுட்ப ரீதியாக கடினமானவை. இங்கே, GPT‑5.5, மூலைவிட்டத்திற்கு அப்பாற்பட்ட ராம்சே எண்கள் பற்றிய ஒரு நீண்டகால அணுகுமுறை உண்மைக்கான ஆதாரத்தைக் கண்டறிந்தது, அது பின்னர் லீன் (Lean) முறையில் சரிபார்க்கப்பட்டது. இந்த முடிவு, ஒரு முக்கிய ஆராய்ச்சி துறையில் GPT‑5.5 வெறும் குறியீடு அல்லது விளக்கம் மட்டுமல்லாமல், ஆச்சரியமளிக்கும் மற்றும் பயனுள்ள கணிதவியல் வாதத்தையும் பங்களித்ததற்கான உறுதியான எடுத்துக்காட்டாகும்.
ஆரம்ப டெஸ்டர்கள் ChatGPT இல் GPT‑5.5 Pro-ஐ ஒன்-ஷாட் பதில் இயந்திரமாக அல்லாமல், ஆராய்ச்சி பங்காளியாக பயன்படுத்தினர்: பல சுற்றுகளில் கையெழுத்துப் பிரதிகளை விமர்சித்தல், தொழில்நுட்ப வாதங்களை அழுத்தச் சோதனை செய்தல், பகுப்பாய்வுகளை முன்மொழிதல், குறியீடு, குறிப்புகள் மற்றும் PDF சூழலுடன் பணிபுரிதல். பொதுவான இணைப்பு என்னவென்றால், GPT‑5.5 ஆராய்ச்சியாளர்கள் கேள்வியிலிருந்து பரிசோதனைக்கும், அங்கிருந்து வெளியீட்டிற்கும் நகர உதவுவதில் சிறந்தது.
Derya Unutmaz, மரபணு மருத்துவத்திற்கான ஜாக்சன் ஆய்வகத்தின் நோயெதிர்ப்பியல் பேராசிரியரும் ஆராய்ச்சியாளரும் ஆவார். அவர் 62 மாதிரிகளும் கிட்டத்தட்ட 28,000 மரபணுக்களும் கொண்ட ஒரு மரபணு வெளிப்பாட்டு தரவுத்தொகுப்பைப் பகுப்பாய்வு செய்ய GPT‑5.5 Pro-ஐ பயன்படுத்தினார். அதன் மூலம், கண்டறிவுகளைச் சுருக்குவதோடு மட்டுமல்லாமல் முக்கிய கேள்விகளையும் நுண்ணறிவுகளையும் வெளிக்கொணர்ந்த ஒரு விரிவான ஆராய்ச்சி அறிக்கை உருவாக்கப்பட்டது—இந்த வேலைக்கு அவரது குழுவிற்கு சாதாரணமாக பல மாதங்கள் எடுத்திருக்கும் என்று அவர் கூறினார்.
போலந்தின் போஸ்னானில் உள்ள ஆடம் மிக்விச் பல்கலைக்கழகத்தின் கணித உதவிப் பேராசிரியரான Bartosz Naskręcki, Codex இல் உள்ள GPT‑5.5‑ஐப் பயன்படுத்தி, ஒரே ஒரு ப்ராம்ப்ட்டில் இருந்து 11 நிமிடங்களில் ஒரு இயற்கணித-வடிவவியல் செயலியை உருவாக்கினார். இது இருபடிப் பரப்புகளின் வெட்டுப்பகுதியைக் காட்சிப்படுத்தி, அதன் விளைவாக உருவான வளைகோட்டை வெயர்ஸ்ட்ராஸ் மாடலாக மாற்றியது.
பின்னர், அவர் மேலும் நிலையான ஒருமைப் புள்ளி காட்சிப்படுத்தலையும் பின்னர் மேற்கொள்ளப்படும் பணிகளில் மீண்டும் பயன்படுத்தக்கூடிய துல்லியமான குணகங்களையும் சேர்த்து செயலியை மேலும் விரிவுபடுத்தினார். அவரைப் பொறுத்தவரை, மிகப் பெரிய மாற்றம் என்னவென்றால், முன்பு பிரத்யேக கருவிகள் தேவைப்பட்ட தனிப்பயன் கணிதக் காட்சிப்படுத்தல் மற்றும் கணினி இயற்கணித பணிச்சூழல்களை செயல்படுத்த Codex இப்போது உதவ முடியும். ஒட்டுமொத்தமாக, இந்த எடுத்துக்காட்டுகள் GPT‑5.5 நிபுணர்களின் நோக்கங்களை செயல்படும் ஆராய்ச்சி கருவிகளாகவும் பகுப்பாய்வுகளாகவும் மாற்றுவதைக் காட்டுகின்றன.

கிரெடிட்: Bartosz Naskręcki(புதிய சாளரத்தில் திறக்கும்)
ப்ராம்ப்ட்: # இயற்கணித வடிவியல் மேற்பரப்பு வெட்டு
இரண்டு இருபடிச் மேற்பரப்புகளை வரையும், அவற்றின் வெட்டுக்கோட்டை சிவப்பு நிறத்தில் காட்டும் ஒரு பயன்பாட்டை உருவாக்கவும். இதை வெயர்ஸ்ட்ராஸ் வளைவாக மாற்ற கணக்கீட்டு ரீமான்-ரோக் தேற்றத்தை பயன்படுத்தவும்.
## முதன்மை சாளரம்
சற்றே வெளிப்படையான நிழலுடன் கூடிய இரண்டு சாயமூட்டப்பட்ட மேற்பரப்புகள், உயர்தர உருவாக்கத்தில், சிவப்பு நிற இயற்கணித வளைவின் வழியாக ஒன்றையொன்று கடக்கின்றன
மவுஸைப் பயன்படுத்தி இரு திசைகளிலும் சுழற்றுதல், பெரிதாக்குவதற்கான முழுமையான கிள்ளுதல் அமைப்பு, ஒவ்வொரு பரப்பின் குணகங்களையும் மாற்றுவதற்கான ஸ்லைடர்களுடன் கூடிய சிறிய மெனுவைக் காண்பிக்க தொட்டுணரக்கூடிய அழுத்தம்; Z-பஃபர் நிலை வழியாகக் கண்டறிதல்
## வலது பக்க சாளரம்
பயனுள்ள ரீமான்-ரோக் தேற்றச் சூத்திரங்கள் மூலம் Go-ல் கணக்கிடப்பட்ட சுருக்கமான வைர்ஸ்ட்ராஸ் சமன்பாடு (Q அல்லது இருபடிப் புல விரிவாக்கத்தின் மீது)
## அனைத்து கட்டுப்பாடுகளும் மறைக்கப்பட்டிருக்கும், மேலும் பயனர் வடிவங்களின் அழகை ரசிக்க முடியும் ஆம்பியன்ட் பயன்முறை
## ஸ்பெக்ஸ்
ஆப் உலாவியில் இயங்குகிறது, இலகுரக செயல்படுத்தல், முழு-ஸ்டாக் சமீபத்திய நூலகங்களுடன், எடுத்துச் செல்லக்கூடியது, நடைமுறைப்படுத்தக்கூடியது
## ஆவணங்கள்
Git ரெப்போ, ஜர்னல், திட்டம் (Markdown கோப்புகள்)
“OpenAI இன் புதிய GPT-5.5 மாடலை எங்கள் சோதனைச் சூழலில் பயன்படுத்தி, மிகப் பெரிய உயிர்வேதியியல் தரவுத்தொகுப்புகளை தர்க்கரீதியாக பகுப்பாய்வு செய்து மனித மருந்து விளைவுகளை முன்கணிக்கச் செய்து, பின்னர் அது எங்கள் மிகவும் கடினமான மருந்து கண்டுபிடிப்புக்கான மதிப்பீடுகளில் குறிப்பிடத்தக்க துல்லிய உயர்வுகளை வழங்குவதைக் காணுவது மிகவும் உற்சாகமளிக்கிறது. OpenAI இதேபோலச் செயல்பட்டால், இந்த ஆண்டின் இறுதிக்குள் மருந்து கண்டுபிடிப்பின் அடித்தளங்களே மாறிவிடும்.
GPT‑5.4‑இன் தாமதத்தில் GPT‑5.5‑ஐ வழங்க, அனுமான செயல்முறையை தனித்தனியான மேம்பாடுகளின் தொகுப்பாக அல்லாமல், ஒருங்கிணைந்த அமைப்பாக மறுபரிசீலனை செய்யப்பட்டது. GPT‑5.5 NVIDIA GB200 மற்றும் GB300 NVL72 அமைப்புகளுக்காக இணைந்து வடிவமைக்கப்பட்டது, அவற்றுடன் பயிற்சி அளிக்கப்பட்டது மற்றும் அவற்றிலேயே சேவை செய்யப்பட்டது. எங்கள் செயல்திறன் இலக்குகளை அடைவதில் Codex மற்றும் GPT‑5.5 முக்கிய பங்கு வகித்தன. Codex, யோசனையிலிருந்து அளவுகோலிடக்கூடிய செயலாக்கம் வரை அணியை வேகமாக நகர உதவியது; அணுகுமுறைகளை வரைந்து, பரிசோதனைகளை அமைத்து, மேலும் எந்த மேம்படுத்தல்களில் ஆழமான முதலீடு மதிப்புடையது என்பதை கண்டறிய உதவியது. GPT‑5.5, அடுக்கே உள்ள முக்கிய மேம்பாடுகளைக் கண்டறிந்து செயல்படுத்த உதவியது. எளிமையாகச் சொன்னால், மாடல் அதற்கு சேவை வழங்கும் உள்கட்டமைப்பை மேம்படுத்த உதவியது.
அத்தகைய மேம்பாடுகளில் ஒன்று சுமை சமநிலைப்படுத்தல் மற்றும் பகிர்வு ஹியூரிஸ்டிக்ஸ் ஆகும். GPT‑5.5க்கு முன், கணக்கீட்டு கோர்களில் பணிச்சுமையை சமநிலைப்படுத்துவதற்காக, ஒரு முடுக்கியில் உள்ள கோரிக்கைகளை நிர்ணயிக்கப்பட்ட எண்ணிக்கையிலான துண்டுகளாகப் பிரித்தோம்; இதனால் பெரிய மற்றும் சிறிய கோரிக்கைகள் ஒரே GPU-வில் இயங்க முடிந்தது. இருப்பினும், முன்கூட்டியே நிர்ணயிக்கப்பட்ட நிலையான துண்டுகளின் எண்ணிக்கை அனைத்து போக்குவரத்து வடிவங்களுக்கும் உகந்ததாக இருக்காது. GPU-களை சிறப்பாக பயன்படுத்துவதற்காக, Codex பல வாரங்களாகச் சேகரிக்கப்பட்ட உற்பத்தி டிராஃபிக் வடிவங்களை பகுப்பாய்வு செய்து, பணியை உகந்த முறையில் பிரித்து சமநிலைப்படுத்த தனிப்பயன் ஹியூரிஸ்டிக் அல்கோரிதங்களை எழுதியது. இந்த முயற்சி மிகைப்படுத்தப்பட்ட தாக்கத்தை ஏற்படுத்தி, டோக்கன் உருவாக்க வேகத்தை 20%-க்கும் அதிகமாக அதிகரித்தது.
பாதுகாப்பு பலவீனங்களை கண்டறிந்து அவற்றைச் சரிசெய்வதில் மிகவும் திறமையான மாடல்களுக்கு உலகைத் தயார்படுத்துவது ஒரு கூட்டு முயற்சியாகும். மேலும், சைபர் பாதுகாப்பின் அடுத்த கட்டத்திற்காக, அனைவருக்கும் பொதுவான மாடல் அணுகலும் தொடர் செயலாக்கமும் உடன், மீள்திறனை உருவாக்க முழு சூழலமைப்பும் கடுமையாக உழைக்க வேண்டும்.
அதிநவீன மாடல்கள் சைபர் பாதுகாப்பில் மேலும் மேலும் திறனுள்ளவையாக மாறி வருகின்றன. அந்த திறன்கள் பரவலாகக் கிடைக்கக்கூடியதாக மாறும்; மேலும், சைபர் பாதுகாப்பை வேகப்படுத்தவும் சூழலமைப்பை வலுப்படுத்தவும் அவை பயன்படுத்தப்படுவதை உறுதிசெய்வதே முன்னோக்கிச் செல்லும் சிறந்த வழி என்று நாங்கள் நம்புகிறோம்.
GPT‑5.5 என்பது சைபர் பாதுகாப்பு போன்ற உலகின் மிகக் கடினமான சில சவால்களைத் தீர்க்கக்கூடிய AI-ஐ நோக்கிய படிப்படியான ஆனால் முக்கியமான முன்னேற்றமாகும். டிசம்பரில் GPT‑5.2 உடன், எங்கள் மாடல்களுடன் ஏற்படக்கூடிய சாத்தியமான சைபர் துஷ்பிரயோகத்தை கட்டுப்படுத்த தேவையான சைபர் பாதுகாப்புகளை நாங்கள் முன்கூட்டியே செயல்படுத்தினோம்; இப்போது GPT‑5.5 உடன், சாத்தியமான சைபர் ஆபத்திற்காக இன்னும் கடுமையான வகைப்படுத்திகளை நாங்கள் செயல்படுத்துகிறோம், அவற்றை காலப்போக்கில் நாங்கள் செம்மைப்படுத்தும் வரை ஆரம்பத்தில் சில பயனர்களுக்கு அவை எரிச்சலூட்டுவதாகத் தோன்றலாம்.
எங்கள் மாடல்கள் படிப்படியாக மேம்பட்டுள்ளதால், மேலும் தணிக்கை நடவடிக்கைகளைத் தொடர்ச்சியாக உருவாக்கி, சரிசெய்து வருவதன் மூலம், குறிப்பிடத்தக்க சைபர் பாதுகாப்பு திறன்களைக் கொண்ட மாடல்களை பொறுப்புடன் வெளியிடும் வகையில், பல ஆண்டுகளாக எங்கள் பிரிபேர்ட்நெஸ் ஃப்ரேம்வொர்க்(புதிய சாளரத்தில் திறக்கும்) இல் சைபர் பாதுகாப்பை ஒரு வகையாக அடையாளப்படுத்தி வருகிறோம்.
- இந்த அளவிலான சைபர் திறனுக்காக, துறையில் முன்னணி பாதுகாப்புகளை நாங்கள் அறிமுகப்படுத்துகிறோம். கடந்த ஆண்டு GPT‑5.2(புதிய சாளரத்தில் திறக்கும்) உடன் நாங்கள் சைபர்-குறிப்பிட்ட பாதுகாப்புகளை முதன்முதலில் அறிமுகப்படுத்தினோம். அவற்றை அடுத்தடுத்த டிப்ளாய்மெண்ட்களில் தொடர்ந்து சோதித்து, செம்மைப்படுத்தி, மேலும் மேம்படுத்தி வந்துள்ளோம். GPT‑5.5‑க்காக, அதிக அபாயமுள்ள செயல்பாடுகள், முக்கியமான சைபர் கோரிக்கைகள் ஆகியவற்றைச் சுற்றி மேலும் கடுமையான கட்டுப்பாடுகளை நாங்கள் வடிவமைத்தோம்; மேலும், மீண்டும் மீண்டும் நிகழும் தவறான பயன்பாட்டிற்கு கூடுதல் பாதுகாப்புகளையும் சேர்த்தோம். மாடல் பாதுகாப்பு, அங்கீகரிக்கப்பட்ட பயன்பாடு மற்றும் அனுமதிக்கப்படாத பயன்பாட்டைக் கண்காணித்தல் ஆகியவற்றில் எங்கள் முதலீடுகள் மூலம் பரவலான அணுகல் சாத்தியமாகியுள்ளது. இந்த பாதுகாப்பு நடவடிக்கைகளை உருவாக்கவும், சோதிக்கவும், அவற்றின் வலிமையைத் தொடர்ந்து மேம்படுத்தவும் நாங்கள் பல மாதங்களாக வெளிப்புற நிபுணர்களுடன் இணைந்து பணியாற்றி வருகிறோம். GPT‑5.5 மூலம், டெவலப்பர்கள் தங்கள் குறியீட்டைப் எளிதாகப் பாதுகாக்க முடிவதை உறுதிசெய்வதுடன், தீங்கிழைக்கும் நபர்களால் சேதம் ஏற்படுத்த அதிக வாய்ப்புள்ள சைபர் பணிப்பாய்வுகளின் மீது வலுவான கட்டுப்பாடுகளையும் அமைத்து வருகிறோம்.
- ஒவ்வொரு நிலையிலும் சைபர் பாதுகாப்பை விரைவுபடுத்த நாங்கள் அணுகலை விரிவாக்குகிறோம். எங்கள் சைபருக்கு அதிக அனுமதி வழங்கும் மாடல்களை சைபருக்கான நம்பகமான அணுகல் மூலம் கிடைக்கச் செய்கிறோம். இது Codex-இல் இருந்து தொடங்குகிறது; வெளியீட்டின் போது, குறிப்பிட்ட நம்பகத்தன்மைச் சுட்டிக்காட்டிகள்(புதிய சாளரத்தில் திறக்கும்) பூர்த்தி செய்யும் சரிபார்க்கப்பட்ட பயனர்களுக்கு, GPT‑5.5 இன் மேம்பட்ட சைபர் பாதுகாப்பு திறன்களுக்கான விரிவுபடுத்தப்பட்ட அணுகலை குறைவான கட்டுப்பாடுகளுடன் இதில் வழங்குகிறது. முக்கியமான உள்கட்டமைப்பைப் பாதுகாப்பதற்கு பொறுப்பான நிறுவனங்கள், தங்களின் உள்நாட்டு அமைப்புகளைப் பாதுகாப்பதற்காக இந்த மாடல்களைப் பயன்படுத்த கடுமையான பாதுகாப்புத் தேவைகளைப் பூர்த்தி செய்யும் நிலையில், GPT‑5.4‑Cyber போன்ற சைபர் பயன்பாட்டை அனுமதிக்கும் மாடல்களுக்கு அணுகலைப் பெற விண்ணப்பிக்கலாம். முக்கியமான பாதுகாப்புத் திறன்களுக்கான அணுகலை நாம் பரவலாவதை உறுதி செய்ய, சரிபார்க்கப்பட்ட பாதுகாவலர்களின் பரந்த வரம்பிற்கு, தேவையற்ற தடைகள் குறைவாக, நியாயமான பாதுகாப்புப் பணிகளுக்காக மேலும் திறனுள்ள கருவிகளை இது வழங்குகிறது. பயனர்கள், சரிபார்க்கப்பட்ட தற்காப்புப் பணிகளுக்காக GPT‑5.5 ஐ பயன்படுத்தும் போது தேவையற்ற மறுப்புகளை குறைக்க, chatgpt.com/cyber(புதிய சாளரத்தில் திறக்கும்) இல் நம்பகமான அணுகலுக்கு விண்ணப்பிக்கலாம்.
- பொதுமக்களுக்காக முக்கியமான உள்கட்டமைப்பைப் பாதுகாக்க உதவ, நாங்கள் அரசாங்கக் கூட்டாளர்களுடன் இணைந்து செயல்பட்டு வருகிறோம். ஒன்றிணைந்து, முக்கியமான வரி செலுத்துநர்களின் தரவைப் பாதுகாக்கும் டிஜிட்டல் அமைப்புகளிலிருந்து உள்ளூர் சமூகங்களின் மின்சார வலையமைப்பு மற்றும் நீர் வழங்கல் அமைப்புகள் வரை, மக்கள் நம்பி சார்ந்திருக்கும் அமைப்புகளுக்குப் பொறுப்பான நம்பகமான அதிகாரிகளின் தற்காப்பு பணிகளுக்கு மேம்பட்ட AI எவ்வாறு ஆதரவளிக்க முடியும் என்பதை நாம் ஆராய்ந்து வருகிறோம்.
எங்களின் பிரிபேர்ட்நெஸ் ஃப்ரேம்வொர்க்(புதிய சாளரத்தில் திறக்கும்) கீழ், GPT‑5.5‑இன் உயிரியல்/வேதியியல் மற்றும் இணையப் பாதுகாப்புத் திறன்களை நாங்கள் உயர்வானதாகக் கருதுகிறோம். GPT‑5.5 சைபர் பாதுகாப்பு திறனின் ‘முக்கிய’ நிலையை எட்டவில்லை என்றாலும், எங்கள் மதிப்பீடுகளும் சோதனைகளும் அதன் சைபர் பாதுகாப்பு திறன்கள் GPT‑5.4 உடன் ஒப்பிடும்போது ஒரு படி மேம்பட்டவை என்பதை காட்டின.
கூடுதலாக, GPT‑5.5 வெளியீட்டிற்கு முன் எங்கள் முழுமையான பாதுகாப்பு மற்றும் நிர்வாக செயல்முறையை கடந்து, தயார்நிலை மதிப்பீடுகள், துறை சார்ந்த சோதனைகள், மேம்பட்ட உயிரியல் மற்றும் சைபர் பாதுகாப்பு திறன்களுக்கான புதிய இலக்கு மதிப்பீடுகள், மேலும் வெளிப்புற நிபுணர்களுடன் கடுமையான சோதனைகள் ஆகியவற்றைச் செய்தது. GPT‑5.5 சிஸ்டம் கார்டில்(புதிய சாளரத்தில் திறக்கும்) மேலும் விவரங்களை பகிர்கிறோம்.
மாடல் திறன்கள் முன்னேறும்போது தேவைப்படும் AI மீள்தன்மைக்கான எங்கள் விரிவான அணுகுமுறையை இந்த வேலை பிரதிபலிக்கிறது. அமைப்புகள், நிறுவனங்கள், மற்றும் பொதுமக்களைப் பாதுகாக்க அதைப் பயன்படுத்தும் மக்களுக்குச் சக்திவாய்ந்த AI கிடைக்க வேண்டும் என்று நாங்கள் விரும்புகிறோம். சாத்தியமான வழி என்பது நம்பகமான அணுகல், திறனுக்கு ஏற்ப அளவுபடுத்தப்படும் வலுவான பாதுகாப்பு நடவடிக்கைகள், மற்றும் கடுமையான தவறான பயன்பாட்டைக் கண்டறிந்து அதற்கு பதிலளிக்கும் செயல்பாட்டு திறன் ஆகும்.
இன்று, ChatGPT மற்றும் Codex-இல் GPT‑5.5 Plus, Pro, Business, மற்றும் Enterprise பயனர்களுக்கு வெளியிடப்படுகிறது, மேலும் ChatGPT‑இல் GPT‑5.5 Pro, Pro, Business, மற்றும் Enterprise பயனர்களுக்கு வெளியிடப்படுகிறது. GPT‑5.5 மற்றும் GPT‑5.5 Pro இரண்டையும் மிக விரைவில் API க்கு கொண்டு வருகிறோம்.
ChatGPT இல் GPT‑5.5 சிந்தனை Plus, Pro, Business, மற்றும் Enterprise பயனர்களுக்குக் கிடைக்கிறது. கடினமான கேள்விகளுக்கும் அதிகத் துல்லியமான பணிகளுக்கும் வடிவமைக்கப்பட்ட GPT‑5.5 Pro, Pro, Business மற்றும் Enterprise பயனர்களுக்குக் கிடைக்கிறது.
Codex-இல், 400K context window உடன் GPT‑5.5 Plus, Pro, Business, Enterprise, Edu மற்றும் Go திட்டங்களில் கிடைக்கிறது. GPT‑5.5 Fast பயன்முறையிலும் கிடைக்கிறது, மேலும் 2.5x மடங்கு செலவில் 1.5x வேகமாக டோக்கன் உருவாக்குகிறது.
API டெவலப்பர்களுக்காக, gpt-5.5 ஆனது Responses மற்றும் Chat Completions API-களில், 1 மில்லியன் உள்ளீட்டு டோக்கன்களுக்கு $5 மற்றும் 1 மில்லியன் வெளியீட்டு டோக்கன்களுக்கு $30 என்ற விலையில், 1 மில்லியன் சூழல் சாளரத்துடன் விரைவில் கிடைக்கும். தொகுதி மற்றும் நெகிழ்வு விலை நிர்ணயம், வழக்கமான API கட்டணத்தில் பாதியளவிலும், முன்னுரிமைச் செயலாக்கம் வழக்கமான கட்டணத்தை விட 2.5 மடங்கு அதிகத்திலும் கிடைக்கின்றன. இன்னும் அதிக துல்லியத்திற்காக, API-யில் gpt-5.5-pro ஐயும் வெளியிடுவோம். இதன் விலை 1M உள்ளீட்டு டோக்கன் $30 (30 டாலர்) மற்றும் 1M வெளியீட்டு டோக்கன் $180 (180 டாலர்) ஆகும். முழு விவரங்களுக்கு விலை நிர்ணயப் பக்கத்தை பாருங்கள்.
GPT‑5.5, GPT‑5.4 ஐ விட அதிக விலையிலுள்ளது இது மேலும் புத்திசாலித்தனமானது மட்டுமல்ல, மேலும் டோக்கன் திறமையானதாகவும் உள்ளது. Codex இல், பெரும்பாலான பயனர்களுக்கு GPT‑5.4 ஐ விட குறைவான டோக்கன்களுடன் GPT‑5.5 சிறந்த முடிவுகளை வழங்கும் வகையில் அனுபவத்தை கவனமாகச் செம்மைப்படுத்தியுள்ளோம். அதே நேரத்தில் சந்தா நிலைகள் முழுவதும் தாராளமான பயன்பாட்டை தொடர்ந்து வழங்குகிறோம்.
கோடிங்
எவல் | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
SWE-Bench Pro (Public) * | 58.6% | 57.7% | - | - | 64.3% | 54.2% |
டெர்மினல்-பெஞ்ச் 2.0 | 82.7% | 75.1% | - | - | 69.4% | 68.5% |
நிபுணர்-SWE (உள்) | 73.1% | 68.5% | - | - | - | - |
*Labs மனப்பாடம் செய்ததற்கான ஆதாரம்(புதிய சாளரத்தில் திறக்கும்) இந்த மதிப்பீட்டில் குறிப்பிட்டுள்ளது
புரொஃபெஷனல்
எவல் | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GDPval (வெற்றி அல்லது சமநிலை) | 84.9% | 83.0% | 82.3% | 82.0% | 80.3% | 67.3% |
FinanceAgent v1.1 | 60.0% | 56.0% | - | 61.5% | 64.4% | 59.7% |
முதலீட்டு வங்கி மாதிரியாக்கப் பணிகள் (உள்) | 88.5% | 87.3% | 88.6% | 83.6% | - | - |
OfficeQA Pro | 54.1% | 53.2% | - | - | 43.6% | 18.1% |
கணினி பயன்பாடு மற்றும் காட்சி
எவல் | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
OSWorld சரிபாரிக்கப்பட்டது | 78.7% | 75.0% | - | - | 78.0% | - |
MMMU Pro (கருவிகள் இல்லை) | 81.2% | 81.2% | - | - | - | 80.5% |
MMMU Pro (கருவிகளுடன்) | 83.2% | 82.1% | - | - | - | - |
கருவி பயன்பாடு
எவல் | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
BrowseComp | 84.4% | 82.7% | 90.1% | 89.3% | 79.3% | 85.9% |
MCP Atlas** | 75.3% | 70.6% | - | - | 79.1% | 78.2% |
Toolathlon | 55.6% | 54.6% | - | - | - | 48.8% |
Tau2-பெஞ்ச் டெலிகாம்*** | 98.0% | 92.8% | - | - | - | - |
** MCP Atlas: சமீபத்திய 2026 ஏப்ரல் புதுப்பிப்புக்குப் பிறகு Scale AI-இலிருந்து பெறப்பட்ட முடிவுகள்.
*** Tau2-bench டெலிகாம்: அசல் ப்ராம்ப்ட்களுடன் 5.5 மற்றும் 5.4-க்கான முடிவுகள், அதாவது, ப்ராம்ப்டில் எந்தச் சரிசெய்தலும் இல்லை. இது ப்ராம்ப்ட் சரிசெய்தல்களுடன் மதிப்பிடப்பட்ட பிற ஆய்வகங்களின் முடிவுகளை விலக்குகிறது.
அகாடமிக் (கல்விசார்)
எவல் | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GeneBench | 25.0% | 19.0% | 33.2% | 25.6% | - | - |
FrontierMath அடுக்கு 1–3 | 51.7% | 47.6% | 52.4% | 50.0% | 43.8% | 36.9% |
FrontierMath அடுக்கு 4 | 35.4% | 27.1% | 39.6% | 38.0% | 22.9% | 16.7% |
BixBench | 80.5% | 74.0% | - | - | - | - |
GPQA Diamond | 93.6% | 92.8% | - | 94.4% | 94.2% | 94.3% |
மனிதகுலத்தின் கடைசித் தேர்வு (கருவிகள் இல்லை) | 41.4% | 39.8% | 43.1% | 42.7% | 46.9% | 44.4% |
மனிதகுலத்தின் கடைசித் தேர்வு (கருவிகளுடன்) | 52.2% | 52.1% | 57.2% | 58.7% | 54.7% | 51.4% |
சைபர் பாதுகாப்பு
எவல் | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Capture-the-Flags challenge tasks (உள்)**** | 88.1% | 83.7% | - | - | - | - |
CyberGym | 81.8% | 79.0% | - | - | 73.1% | - |
**** சிஸ்டம் கார்டுகளில் பயன்படுத்தப்படும் மிகவும் கடினமான CTF களின் கூடுதல் கடினமான சவால்களுடன் கூடிய விரிவாக்கம்.
நீண்ட சூழல்
எவல் | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Graphwalks BFS 256k f1 | 73.7% | 62.5% | - | - | 76.9% | - |
Graphwalks BFS 1M f1 | 45.4% | 9.4% | - | - | 41.2% (Opus 4.6) | - |
Graphwalks parents 256k f1 | 90.1% | 82.8% | - | - | 93.6% | - |
Graphwalks parents 1mil f1 | 58.5% | 44.4% | - | - | 72.0% (Opus 4.6) | - |
OpenAI MRCR v2 8-needle 4K-8K | 98.1% | 97.3% | - | - | - | - |
OpenAI MRCR v2 8-needle 8K-16K | 93.0% | 91.4% | - | - | - | - |
OpenAI MRCR v2 8-needle 16K-32K | 96.5% | 97.2% | - | - | - | - |
OpenAI MRCR v2 8-needle 32K-64K | 90.0% | 90.5% | - | - | - | - |
OpenAI MRCR v2 8-needle 64K-128K | 83.1% | 86.0% | - | - | - | - |
OpenAI MRCR v2 8-needle 128K-256K | 87.5% | 79.3% | - | - | 59.2% | - |
OpenAI MRCR v2 8-needle 256K-512K | 81.5% | 57.5% | - | - | - | - |
OpenAI MRCR v2 8-needle 512K-1M | 74.0% | 36.6% | - | - | 32.2% | - |
காரணவிளக்கமளித்தல் சிந்தனை
எவல் | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
ARC-AGI-1 (சரிபார்க்கப்பட்டது) | 95.0% | 93.7% | - | 94.5% | 93.5% | 98.0% |
ARC-AGI-2 (சரிபார்க்கவும்) | 85.0% | 73.3% | - | 83.3% | 75.8% | 77.1% |
GPT‑யின் மதிப்பீடுகள், ரீஸனிங் முயற்சி xhigh என அமைக்கப்பட்டு ஒரு ஆராய்ச்சிச் சூழலில் நடத்தப்பட்டன. இதனால், சில சமயங்களில் உற்பத்தி ChatGPT‑யிலிருந்து சற்று மாறுபட்ட வெளியீடு கிடைக்கக்கூடும்.








