இன்று, நாங்கள் GPT‑5.4 mini மற்றும் nano ஐ வெளியிடுகிறோம், இதுவரை எங்களின் மிக திறமையான சிறிய மாடல்கள். அதிக அளவிலான பணிச்சுமைகளுக்காக வடிவமைக்கப்பட்ட வேகமான, மேலும் திறன் வாய்ந்த மாடல்களுக்கு GPT‑5.4 இன் பல பலங்களை அவர்கள் கொண்டு வருகின்றனர்.
GPT‑5.4 mini கோடிங், ரீஸனிங், பல்மாதிரி புரிதல், மற்றும் கருவி பயன்பாடு ஆகியவற்றில் GPT‑5 mini யை விட குறிப்பிடத்தக்க வகையில் மேம்படுகிறது, மேலும் 2x க்கும் அதிகமாக வேகமாக இயங்குகிறது. பல மதிப்பீடுகளில், SWE-Bench Pro மற்றும் OSWorld-Verified உட்பட, இது பெரிய GPT‑5.4 மாடல் செயல்திறனைவும் நெருங்குகிறது.
GPT‑5.4 nano என்பது வேகம் மற்றும் செலவு மிக முக்கியமான பணிகளுக்கான GPT‑5.4 இன் மிகச் சிறிய, மிகக் குறைந்த விலையுள்ள பதிப்பு. இது GPT‑5 nano வுக்குப் பொறுத்தவரை ஒரு குறிப்பிடத்தக்க மேம்படுத்தலும்கூட ஆகும். வகைப்படுத்தல், தரவு எடுப்பு, தரவரிசைப்படுத்தல், மற்றும் எளிமையான ஆதரவு பணிகளை கையாளும் கோடிங் துணை-ஏஜென்ட்களுக்காக இதனை நாங்கள் பரிந்துரைக்கிறோம்.
இந்த மாடல்களின் லேட்டன்சி நேரடியாக தயாரிப்பு அனுபவத்தை வடிவமைக்கும் வகையான பணிச்சுமைகளுக்காக உருவாக்கப்பட்டவை: பதிலளிப்பாக உணரப்பட வேண்டிய கோடிங் உதவியாளர்கள், ஆதரவு பணிகளை விரைவாக முடிக்கும் சப்-ஏஜென்ட்கள், ஸ்கிரீன் ஷாட்களைப் பதிவு செய்து பொருள் விளக்கும் கணினி-பயன்பாட்டு அமைப்புகள், மேலும் நேரடி நேரத்தில் படங்களின் மீது ரீஸன் செய்யக்கூடிய மல்டிமோடல் பயன்பாடுகள். இந்த அமைப்புகளில், சிறந்த மாடல் என்பது பெரும்பாலும் மிகப் பெரியது அல்ல—அது விரைவாக பதிலளிக்கவும், கருவிகளை நம்பகமாக பயன்படுத்தவும், மேலும் சிக்கலான தொழில்முறை பணிகளில் கூட சிறப்பாக செயல்படவும் முடியும் என்பதுதான்.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 GPT‑5 mini க்குக் கிடைக்கும் reasoning_effort 'high' ஆகும்.
GPT‑5.4 mini மற்றும் nano வை தங்களின் பணிப்பாய்வுகளில் சோதித்த பிறகு எங்கள் வாடிக்கையாளர்கள் என்ன நினைக்கிறார்கள் என்பதுதான் இதோ:
GPT-5.4 mini இந்த வகுப்பில் உள்ள மாடல்களில் வலுவான எண்ட்-டு-எண்ட் செயல்திறனை வழங்குகிறது. எங்கள் மதிப்பீடுகளில், பல வெளியீட்டு பணிகளிலும் மேற்கோள் நினைவூட்டலிலும், மிகக் குறைந்த செலவில் போட்டியாளர் மாடல்களை ஒத்ததாகவோ அல்லது அதைவிடச் சிறப்பாகவோ இருந்தது. இது பெரிய GPT-5.4 மாடலை விட உயர்ந்த எண்ட்-டு-எண்ட் பாஸ் விகிதங்களையும் மேலும் வலுவான மூல ஒதுக்கீட்டையும் பெற்றது.
GPT‑5.4 mini மற்றும் nano, விரைவான மீளச்சுழற்சியால் பயன் பெறும் குறியீட்டு பணிப்பாய்வுகளில் சிறப்பாக செயல்படுகின்றன. இந்த மாடல்கள் இலக்கிடப்பட்ட திருத்தங்கள், குறியீட்டு அடிப்படையில் வழிசெலுத்தல், முன்-இறுதி உருவாக்கம் மற்றும் குறைந்த தாமதத்துடன் பிழைத்திருத்த சுழல்களைக் கையாளுகின்றன. இதனால், வேகமாகவும் குறைந்த செலவில் முடிக்க வேண்டிய குறியீட்டு பணிகளுக்கு இவை சிறந்த தேர்வாக அமைகின்றன.
பெஞ்ச்மார்க்குகளில், GPT‑5.4 mini ஒத்த தாமதங்களில் GPT‑5‑mini ஐ தொடர்ந்து மிஞ்சுகிறது மற்றும் GPT‑5.4 நிலையை அணுகுகிறது மிக வேகமாக இயங்கும் அதே வேளையில் தேர்ச்சி விகிதங்களையும், குறியீட்டு பணிப்பாய்வுகளுக்கான வலுவான செயல்திறன்-தாமத பரிமாற்றங்களில் ஒன்றை வழங்குகிறது.
எங்கள் மாடல்கள் புரொடக்ஷன் நடத்தையைப் பார்த்து, இதை ஆஃப்லைனில் சிமுலேட் செய்து, தாமதத்தை நாங்கள் மதிப்பீடு செய்கிறோம். தாமத மதிப்பீடு கருவி அழைப்பு கால அளவை (குறியீடு செயல்படுத்தும் நேரம்), மாடல் எடுக்கப்பட்ட டோக்கன்கள் மற்றும் உள்ளீட்டு டோக்கன்களை கணக்கில் எடுத்துக்கொள்கிறது. நிஜ உலக தாமதம் கணிசமாக மாறலாம், மேலும் எங்கள் சிமுலேஷனில் பிடிக்கப்படாத பல காரணிகளின் மீது அது சார்ந்துள்ளது. அதேபோல், எழுதும் நேரத்தில் இந்த மாடல்களின் API விலை நிர்ணயத்தின் அடிப்படையில் செலவுகள் கணக்கிடப்படுகின்றன. எதிர்காலத்தில் செலவுகள் மாறக்கூடும். ரீஸனிங் முயற்சிகள் low இலிருந்து xhigh வரை உயர்த்தப்பட்டன.
GPT‑5.4 mini வெவ்வேறு அளவுகளிலான மாடல்களை இணைக்கும் சிஸ்டம்களுக்குமான வலுவான பொருத்தமாகவும் இருக்கிறது. Codex-இல், உதாரணமாக, GPT‑5.4 போன்ற ஒரு பெரிய மாடல் திட்டமிடல், ஒருங்கிணைப்பு, மற்றும் இறுதி தீர்மானம் ஆகியவற்றை கையாள முடியும்; அதே சமயம், குறுகிய துணைப் பணிகளை இணையாக கையாளும் GPT‑5.4 mini துணை ஏஜென்ட்களுக்கு பணிகளை ஒப்படைக்கும்—உதாரணமாக ஒரு கோட்பேஸைத் தேடுவது, ஒரு பெரிய கோப்பை மதிப்பாய்வு செய்வது, அல்லது ஆதரவு ஆவணங்களை செயலாக்குவது. ஆவணங்களில்(புதிய சாளரத்தில் திறக்கும்) Codex இல் subagents எப்படி வேலை செய்கின்றன என்பதை கற்றுக்கொள்ளுங்கள்.
சிறிய மாடல்கள் வேகமாகவும் மேலும் திறனுள்ளவைகளாகவும் மாறும்போது, இந்த பேட்டர்ன் மேலும் பயனுள்ளதாகிறது. எல்லாவற்றுக்கும் ஒரே மாடலைப் பயன்படுத்துவதற்குப் பதிலாக, டெவலப்பர்கள் பெரிய மாடல்கள் என்ன செய்ய வேண்டும் என்று முடிவு செய்யவும் சிறிய மாடல்கள் அளவில் வேகமாக செயல்படுத்தவும் கூடிய அமைப்புகளை ஒருங்கிணைக்க முடியும். அந்த ஸ்டைல் வொர்க்ஃப்ளோவுக்கு GPT‑5.4 mini இதுவரை எங்களின் மிக ஸ்ட்ராங்கான mini மாடல்.
GPT‑5.4 mini பலமாதிரி பணிகளில் வலுவாக செயல்படுகிறது, குறிப்பாக கணினி பயன்பாட்டுடன் தொடர்புடைய பணிகளில். மாடல் அடர்த்தியான பயனர் இடைமுகங்களின் ஸ்கிரீன்ஷாட்களை விரைவாகப் புரிந்துகொண்டு, கணினி பயன்பாட்டு பணிகளை வேகமாக முடிக்க முடியும். OSWorld-Verified இல், GPT‑5.4 mini, GPT‑5.4 ஐ நெருங்குகிறது; அதே சமயம் GPT‑5 mini ஐ குறிப்பிடத்தக்க அளவில் மிஞ்சி செயல்படுகிறது.
GPT‑5.4 mini இன்று API, Codex மற்றும் ChatGPT ஆகியவற்றில் கிடைக்கிறது.
API-யில், GPT‑5.4 mini உரை மற்றும் பட உள்ளீடுகள், கருவி பயன்பாடு, செயல்பாடு அழைப்பு, வலை தேடல், கோப்பு தேடல், கணினி பயன்பாடு, மற்றும் திறன்களை ஆதரிக்கிறது. இதற்கு 400k சூழல் சாளரம் உள்ளது, மேலும் 1M உள்ளீட்டு டோக்கன் $0.75 மற்றும் 1M வெளியீட்டு டோக்கன் $4.50 செலவாகும்.
Codex இல், GPT‑5.4 mini Codex செயலி, CLI, IDE விரிவாக்கம் மற்றும் வெப் ஆகிய அனைத்திலும் கிடைக்கிறது. இது GPT‑5.4 இன் 30% மட்டுமே பயன்படுத்துகிறது கோட்டா, Codex இல் எளிய கோடிங் பணிகளை டெவலப்பர்கள் விரைவாக கையாள அனுமதித்து, சுமார் மூன்றில் ஒரு பங்கு செலவில். Codex, GPT‑5.4 mini துணை ஏஜென்ட்களுக்கு பணிகளை ஒப்படைக்க முடியும்; இதனால் குறைந்த ரீஸனிங் தேவைப்படும் பணிகள் குறைந்த செலவான மாடலில் இயங்கும்.
ChatGPT இல், GPT‑5.4 mini ஆனது + மெனுவில் உள்ள “Thinking” அம்சத்தின் மூலம் Free மற்றும் Go பயனர்களுக்கு கிடைக்கிறது. மற்ற அனைத்து பயனர்களுக்கும், GPT‑5.4 க்கான rate limit fallback ஆக GPT‑5.4 mini கிடைக்கிறது Thinking.
GPT‑5.4 nano API-யில் மட்டுமே கிடைக்கிறது மற்றும் 1M உள்ளீட்டு டோக்கன்களுக்கு $0.20 மற்றும் 1M வெளியீட்டு டோக்கன்களுக்கு $1.25 செலவாகும்.
மாடல்களின் பாதுகாப்பு அம்சங்கள் பற்றி மேலும் அறிய, எங்கள் Deployment Safety Hub(புதிய சாளரத்தில் திறக்கும்) இல் உள்ள சிஸ்டம் கார்ட் இணைப்பைப் பார்க்கவும்.
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 GPT‑5 mini க்குக் கிடைக்கும் reasoning_effort 'high' ஆகும்.
2 மொத்த திருத்தத் தூரம். குறைந்த செலவு, குறைந்த தாமத செயல்திறனை பிரதிபலிக்க, OmniDocBench `reasoning_effort` ஐ 'none' என அமைத்து இயக்கப்பட்டது.


