முக்கிய உள்ளடக்கத்திற்கு செல்க
OpenAI

GPT‑5.4 mini மற்றும் nano வை அறிமுகப்படுத்துகிறோம்

கோடிங் மற்றும் துணை-ஏஜென்ட்களுக்காக மேம்படுத்தப்பட்ட வேகமான மற்றும் திறமையான மாடல்கள்

ஏற்றுகிறது…

இன்று, நாங்கள் GPT‑5.4 mini மற்றும் nano ஐ வெளியிடுகிறோம், இதுவரை எங்களின் மிக திறமையான சிறிய மாடல்கள். அதிக அளவிலான பணிச்சுமைகளுக்காக வடிவமைக்கப்பட்ட வேகமான, மேலும் திறன் வாய்ந்த மாடல்களுக்கு GPT‑5.4 இன் பல பலங்களை அவர்கள் கொண்டு வருகின்றனர்.

GPT‑5.4 mini கோடிங், ரீஸனிங், பல்மாதிரி புரிதல், மற்றும் கருவி பயன்பாடு ஆகியவற்றில் GPT‑5 mini யை விட குறிப்பிடத்தக்க வகையில் மேம்படுகிறது, மேலும் 2x க்கும் அதிகமாக வேகமாக இயங்குகிறது. பல மதிப்பீடுகளில், SWE-Bench Pro மற்றும் OSWorld-Verified உட்பட, இது பெரிய GPT‑5.4 மாடல் செயல்திறனைவும் நெருங்குகிறது.

GPT‑5.4 nano என்பது வேகம் மற்றும் செலவு மிக முக்கியமான பணிகளுக்கான GPT‑5.4 இன் மிகச் சிறிய, மிகக் குறைந்த விலையுள்ள பதிப்பு. இது GPT‑5 nano வுக்குப் பொறுத்தவரை ஒரு குறிப்பிடத்தக்க மேம்படுத்தலும்கூட ஆகும். வகைப்படுத்தல், தரவு எடுப்பு, தரவரிசைப்படுத்தல், மற்றும் எளிமையான ஆதரவு பணிகளை கையாளும் கோடிங் துணை-ஏஜென்ட்களுக்காக இதனை நாங்கள் பரிந்துரைக்கிறோம்.

இந்த மாடல்களின் லேட்டன்சி நேரடியாக தயாரிப்பு அனுபவத்தை வடிவமைக்கும் வகையான பணிச்சுமைகளுக்காக உருவாக்கப்பட்டவை: பதிலளிப்பாக உணரப்பட வேண்டிய கோடிங் உதவியாளர்கள், ஆதரவு பணிகளை விரைவாக முடிக்கும் சப்-ஏஜென்ட்கள், ஸ்கிரீன் ஷாட்களைப் பதிவு செய்து பொருள் விளக்கும் கணினி-பயன்பாட்டு அமைப்புகள், மேலும் நேரடி நேரத்தில் படங்களின் மீது ரீஸன் செய்யக்கூடிய மல்டிமோடல் பயன்பாடுகள். இந்த அமைப்புகளில், சிறந்த மாடல் என்பது பெரும்பாலும் மிகப் பெரியது அல்ல—அது விரைவாக பதிலளிக்கவும், கருவிகளை நம்பகமாக பயன்படுத்தவும், மேலும் சிக்கலான தொழில்முறை பணிகளில் கூட சிறப்பாக செயல்படவும் முடியும் என்பதுதான்.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 GPT‑5 mini க்குக் கிடைக்கும் reasoning_effort 'high' ஆகும்.

GPT‑5.4 mini மற்றும் nano வை தங்களின் பணிப்பாய்வுகளில் சோதித்த பிறகு எங்கள் வாடிக்கையாளர்கள் என்ன நினைக்கிறார்கள் என்பதுதான் இதோ:

GPT-5.4 mini இந்த வகுப்பில் உள்ள மாடல்களில் வலுவான எண்ட்-டு-எண்ட் செயல்திறனை வழங்குகிறது. எங்கள் மதிப்பீடுகளில், பல வெளியீட்டு பணிகளிலும் மேற்கோள் நினைவூட்டலிலும், மிகக் குறைந்த செலவில் போட்டியாளர் மாடல்களை ஒத்ததாகவோ அல்லது அதைவிடச் சிறப்பாகவோ இருந்தது. இது பெரிய GPT-5.4 மாடலை விட உயர்ந்த எண்ட்-டு-எண்ட் பாஸ் விகிதங்களையும் மேலும் வலுவான மூல ஒதுக்கீட்டையும் பெற்றது.
— ஆபாஸ் ஷர்மா, Hebbia-வின் CTO

கோடிங்

GPT‑5.4 mini மற்றும் nano, விரைவான மீளச்சுழற்சியால் பயன் பெறும் குறியீட்டு பணிப்பாய்வுகளில் சிறப்பாக செயல்படுகின்றன. இந்த மாடல்கள் இலக்கிடப்பட்ட திருத்தங்கள், குறியீட்டு அடிப்படையில் வழிசெலுத்தல், முன்-இறுதி உருவாக்கம் மற்றும் குறைந்த தாமதத்துடன் பிழைத்திருத்த சுழல்களைக் கையாளுகின்றன. இதனால், வேகமாகவும் குறைந்த செலவில் முடிக்க வேண்டிய குறியீட்டு பணிகளுக்கு இவை சிறந்த தேர்வாக அமைகின்றன.

பெஞ்ச்மார்க்குகளில், GPT‑5.4 mini ஒத்த தாமதங்களில் GPT‑5‑mini ஐ தொடர்ந்து மிஞ்சுகிறது மற்றும் GPT‑5.4 நிலையை அணுகுகிறது மிக வேகமாக இயங்கும் அதே வேளையில் தேர்ச்சி விகிதங்களையும், குறியீட்டு பணிப்பாய்வுகளுக்கான வலுவான செயல்திறன்-தாமத பரிமாற்றங்களில் ஒன்றை வழங்குகிறது.

எங்கள் மாடல்கள் புரொடக்ஷன் நடத்தையைப் பார்த்து, இதை ஆஃப்லைனில் சிமுலேட் செய்து, தாமதத்தை நாங்கள் மதிப்பீடு செய்கிறோம். தாமத மதிப்பீடு கருவி அழைப்பு கால அளவை (குறியீடு செயல்படுத்தும் நேரம்), மாடல் எடுக்கப்பட்ட டோக்கன்கள் மற்றும் உள்ளீட்டு டோக்கன்களை கணக்கில் எடுத்துக்கொள்கிறது. நிஜ உலக தாமதம் கணிசமாக மாறலாம், மேலும் எங்கள் சிமுலேஷனில் பிடிக்கப்படாத பல காரணிகளின் மீது அது சார்ந்துள்ளது. அதேபோல், எழுதும் நேரத்தில் இந்த மாடல்களின் API விலை நிர்ணயத்தின் அடிப்படையில் செலவுகள் கணக்கிடப்படுகின்றன. எதிர்காலத்தில் செலவுகள் மாறக்கூடும். ரீஸனிங் முயற்சிகள் low இலிருந்து xhigh வரை உயர்த்தப்பட்டன.

துணை ஏஜென்ட்கள்

GPT‑5.4 mini வெவ்வேறு அளவுகளிலான மாடல்களை இணைக்கும் சிஸ்டம்களுக்குமான வலுவான பொருத்தமாகவும் இருக்கிறது. Codex-இல், உதாரணமாக, GPT‑5.4 போன்ற ஒரு பெரிய மாடல் திட்டமிடல், ஒருங்கிணைப்பு, மற்றும் இறுதி தீர்மானம் ஆகியவற்றை கையாள முடியும்; அதே சமயம், குறுகிய துணைப் பணிகளை இணையாக கையாளும் GPT‑5.4 mini துணை ஏஜென்ட்களுக்கு பணிகளை ஒப்படைக்கும்—உதாரணமாக ஒரு கோட்பேஸைத் தேடுவது, ஒரு பெரிய கோப்பை மதிப்பாய்வு செய்வது, அல்லது ஆதரவு ஆவணங்களை செயலாக்குவது. ஆவணங்களில்(புதிய சாளரத்தில் திறக்கும்) Codex இல் subagents எப்படி வேலை செய்கின்றன என்பதை கற்றுக்கொள்ளுங்கள்.

சிறிய மாடல்கள் வேகமாகவும் மேலும் திறனுள்ளவைகளாகவும் மாறும்போது, இந்த பேட்டர்ன் மேலும் பயனுள்ளதாகிறது. எல்லாவற்றுக்கும் ஒரே மாடலைப் பயன்படுத்துவதற்குப் பதிலாக, டெவலப்பர்கள் பெரிய மாடல்கள் என்ன செய்ய வேண்டும் என்று முடிவு செய்யவும் சிறிய மாடல்கள் அளவில் வேகமாக செயல்படுத்தவும் கூடிய அமைப்புகளை ஒருங்கிணைக்க முடியும். அந்த ஸ்டைல் வொர்க்ஃப்ளோவுக்கு GPT‑5.4 mini இதுவரை எங்களின் மிக ஸ்ட்ராங்கான mini மாடல்.

கணினி பயன்பாடு

GPT‑5.4 mini பலமாதிரி பணிகளில் வலுவாக செயல்படுகிறது, குறிப்பாக கணினி பயன்பாட்டுடன் தொடர்புடைய பணிகளில். மாடல் அடர்த்தியான பயனர் இடைமுகங்களின் ஸ்கிரீன்ஷாட்களை விரைவாகப் புரிந்துகொண்டு, கணினி பயன்பாட்டு பணிகளை வேகமாக முடிக்க முடியும். OSWorld-Verified இல், GPT‑5.4 mini, GPT‑5.4 ஐ நெருங்குகிறது; அதே சமயம் GPT‑5 mini ஐ குறிப்பிடத்தக்க அளவில் மிஞ்சி செயல்படுகிறது.

கிடைக்கும் நிலை மற்றும் விலை விவரங்கள்

GPT‑5.4 mini இன்று API, Codex மற்றும் ChatGPT ஆகியவற்றில் கிடைக்கிறது.

API-யில், GPT‑5.4 mini உரை மற்றும் பட உள்ளீடுகள், கருவி பயன்பாடு, செயல்பாடு அழைப்பு, வலை தேடல், கோப்பு தேடல், கணினி பயன்பாடு, மற்றும் திறன்களை ஆதரிக்கிறது. இதற்கு 400k சூழல் சாளரம் உள்ளது, மேலும் 1M உள்ளீட்டு டோக்கன் $0.75 மற்றும் 1M வெளியீட்டு டோக்கன் $4.50 செலவாகும்.

Codex இல், GPT‑5.4 mini Codex செயலி, CLI, IDE விரிவாக்கம் மற்றும் வெப் ஆகிய அனைத்திலும் கிடைக்கிறது. இது GPT‑5.4 இன் 30% மட்டுமே பயன்படுத்துகிறது கோட்டா, Codex இல் எளிய கோடிங் பணிகளை டெவலப்பர்கள் விரைவாக கையாள அனுமதித்து, சுமார் மூன்றில் ஒரு பங்கு செலவில். Codex, GPT‑5.4 mini துணை ஏஜென்ட்களுக்கு பணிகளை ஒப்படைக்க முடியும்; இதனால் குறைந்த ரீஸனிங் தேவைப்படும் பணிகள் குறைந்த செலவான மாடலில் இயங்கும்.

ChatGPT இல், GPT‑5.4 mini ஆனது + மெனுவில் உள்ள “Thinking” அம்சத்தின் மூலம் Free மற்றும் Go பயனர்களுக்கு கிடைக்கிறது. மற்ற அனைத்து பயனர்களுக்கும், GPT‑5.4 க்கான rate limit fallback ஆக GPT‑5.4 mini கிடைக்கிறது Thinking.

GPT‑5.4 nano API-யில் மட்டுமே கிடைக்கிறது மற்றும் 1M உள்ளீட்டு டோக்கன்களுக்கு $0.20 மற்றும் 1M வெளியீட்டு டோக்கன்களுக்கு $1.25 செலவாகும்.

மாடல்களின் பாதுகாப்பு அம்சங்கள் பற்றி மேலும் அறிய, எங்கள் Deployment Safety Hub(புதிய சாளரத்தில் திறக்கும்) இல் உள்ள சிஸ்டம் கார்ட் இணைப்பைப் பார்க்கவும்.

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 GPT‑5 mini க்குக் கிடைக்கும் reasoning_effort 'high' ஆகும்.

2 மொத்த திருத்தத் தூரம். குறைந்த செலவு, குறைந்த தாமத செயல்திறனை பிரதிபலிக்க, OmniDocBench `reasoning_effort` ஐ 'none' என அமைத்து இயக்கப்பட்டது.

ஆசிரியர்

OpenAI