17 మార్చి, 2026

GPT‑5.4 mini మరియు nano ను పరిచయం చేస్తున్నాము

కోడింగ్ మరియు సబ్‌ఏజెంట్స్ కోసం ఆప్టిమైజ్ చేసిన ఫాస్ట్ మరియు ఎఫిషియెంట్ మోడల్స్

లోడ్ అవుతోంది…

ఈ రోజు, మేము GPT‑5.4 mini మరియు nanoలను విడుదల చేస్తున్నాము, ఇవి ఇప్పటి వరకు మా అత్యంత సామర్థ్యవంతమైన చిన్న మోడల్స్. GPT‑5.4 యొక్క అనేక బలాలను వేగవంతమైన మరియు అధిక సామర్థ్యం కలిగిన మోడల్స్‌కు తీసుకువస్తాయి, ఇవి అధిక వాల్యూం వర్క్‌లోడ్స్ కోసం రూపొందించబడ్డాయి.

GPT‑5.4 mini కోడింగ్, రిజనింగ్, మల్టీమోడల్ అవగాహన, మరియు టూల్ వినియోగంలో GPT‑5 mini కంటే గణనీయంగా మెరుగుపడుతుంది, అలాగే 2x కంటే ఎక్కువ వేగంగా నడుస్తుంది. ఇది SWE-Bench Pro మరియు OSWorld-Verified వంటి అనేక ఈవాల్యుయేషన్స్‌లో పెద్ద GPT‑5.4 మోడల్ పనితీరుకు కూడా దగ్గరగా చేరుతుంది.

GPT‑5.4 nano అనేది స్పీడ్ మరియు ఖర్చు అత్యంత ముఖ్యమైన టాస్క్స్ కోసం GPT‑5.4 యొక్క అత్యంత చిన్నది మరియు చవకైన వెర్షన్. ఇది GPT‑5 nano కంటే గణనీయమైన అప్‌గ్రేడ్ కూడా. క్లాసిఫికేషన్, డేటా ఎక్స్‌ట్రాక్షన్, ర్యాంకింగ్ మరియు సింపుల్ సపోర్టింగ్ టాస్క్స్‌ను హ్యాండిల్ చేసే కోడింగ్ సబ్‌ఏజెంట్స్ కోసం మేము దీన్ని సిఫారసు చేస్తాము.

ఈ మోడల్స్, లేటెన్సీ నేరుగా ప్రోడక్ట్ అనుభవాన్ని ప్రభావితం చేసే వర్క్‌లోడ్స్ కోసం నిర్మించబడ్డాయి: రెస్పాన్సివ్‌గా అనిపించాల్సిన కోడింగ్ అసిస్టెంట్స్, త్వరగా సపోర్టింగ్ టాస్క్స్ పూర్తి చేసే సబ్‌ఏజెంట్స్, స్క్రీన్‌షాట్స్‌ను క్యాప్చర్ చేసి అర్థం చేసుకునే కంప్యూటర్-యూజింగ్ సిస్టమ్స్, మరియు రియల్-టైమ్‌లో ఇమేజెస్‌పై రీజన్ చేయగల మల్టీమోడల్ అప్లికేషన్స్. ఈ సందర్భాల్లో, ఉత్తమ మోడల్ అనేది పెద్దదైనది కాకపోవచ్చు—త్వరగా స్పందించగల, టూల్స్‌ను నమ్మకంగా ఉపయోగించగల, మరియు క్లిష్టమైన ప్రొఫెషనల్ టాస్క్స్‌పై కూడా బాగా పనిచేసే మోడల్.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 GPT‑5 mini కోసం అందుబాటులో ఉన్న అత్యధిక reasoning_effort 'high'.}

మా కస్టమర్లు తమ వర్క్‌ఫ్లోలలో GPT‑5.4 mini మరియు nano ను పరీక్షించిన తర్వాత ఏమనుకుంటున్నారో చూడండి:

"GPT-5.4 mini ఈ తరగతిలోని మోడల్‌కు బలమైన ఎండ్-టు-ఎండ్ పనితీరును అందిస్తుంది. మా ఎవాల్యుయేషన్స్‌లో, ఇది తక్కువ ఖర్చుతో అనేక అవుట్‌పుట్ టాస్క్స్ మరియు సిటేషన్ రీకాల్‌లో పోటీ మోడల్స్‌కు సమానంగా లేదా మెరుగ్గా పనిచేసింది. ఇది పెద్ద GPT-5.4 మోడల్ కంటే ఎక్కువ ఎండ్-టు-ఎండ్ పాస్ రేట్స్ మరియు బలమైన సోర్స్ అట్రిబ్యూషన్‌ను కూడా సాధించింది."

— Aabhas Sharma, Hebbia లో CTO

కోడింగ్

GPT‑5.4 mini మరియు nano ఫాస్ట్ ఇటరేషన్ వల్ల లాభపడే కోడింగ్ వర్క్‌ఫ్లోస్‌లో ప్రత్యేకంగా ప్రభావవంతంగా ఉంటాయి. ఈ మోడల్స్ టార్గెటెడ్ ఎడిట్స్, కోడ్‌బేస్ నావిగేషన్, ఫ్రంట్-ఎండ్ జనరేషన్, మరియు డీబగ్గింగ్ లూప్స్‌ను తక్కువ లేటెన్సీతో హ్యాండిల్ చేస్తాయి, దీంతో వేగంగా మరియు తక్కువ ఖర్చుతో పూర్తి చేయాల్సిన కోడింగ్ టాస్క్స్‌కు ఇవి బలమైన ఎంపికగా మారుతాయి.

బెంచ్‌మార్క్‌లలో, GPT‑5.4 mini సమానమైన లేటెన్సీలలో GPT‑5‑mini కంటే స్థిరంగా మెరుగ్గా పనిచేస్తుంది మరియు GPT‑5.4‑స్థాయి కి దగ్గరౌతుంది చాలా వేగంగా రన్ అవుతూనే పాస్ రేట్లను నిలుపుకుంటూ, కోడింగ్ వర్క్‌ఫ్లోల కోసం పెర్ఫార్మెన్స్-పర్-లేటెన్సీ ట్రేడ్‌ఆఫ్‌లలో అత్యంత బలమైన వాటిలో ఒకటిని అందిస్తోంది.

మేము మా మోడల్స్ ప్రొడక్షన్ బిహేవియర్‌ను పరిశీలించి, దీనిని ఆఫ్‌లైన్‌లో సిమ్యులేట్ చేసి లేటెన్సీని అంచనా వేస్తాము. లేటెన్సీ అంచనా టూల్ కాల్ డ్యూరేషన్ (కోడ్ ఎగ్జిక్యూషన్ టైమ్), సాంపిల్డ్ టోకెన్స్ మరియు ఇన్‌పుట్ టోకెన్స్‌ను పరిగణనలోకి తీసుకుంటుంది. నిజ జీవిత లేటెన్సీ గణనీయంగా మారవచ్చు, మరియు మా సిమ్యులేషన్‌లో పట్టుకోని అనేక అంశాలపై ఆధారపడుతుంది. అలాగే, ఈ మోడల్స్‌కు సంబంధించిన API ప్రైసింగ్ ఆధారంగా ఖర్చులు అంచనా వేయబడ్డాయి. భవిష్యత్తులో ఖర్చులు మారవచ్చు. రీజనింగ్ ఎఫర్ట్స్‌ను low నుంచి xhigh వరకు స్వీప్ చేశారు.

సబ్‌ఏజెంట్స్

GPT‑5.4 mini వివిధ సైజుల మోడల్స్‌ను కలిపే సిస్టమ్స్‌కు కూడా బలమైన ఎంపిక. ఉదాహరణకు Codex‌లో, GPT‑5.4 వంటి పెద్ద మోడల్ ప్లానింగ్, కోఆర్డినేషన్ మరియు ఫైనల్ జడ్జ్‌మెంట్‌ను హ్యాండిల్ చేస్తుంది, అదే సమయంలో చిన్న సబ్‌టాస్క్స్‌ను ప్యారలల్‌గా నిర్వహించే GPT‑5.4 mini సబ్‌ఏజెంట్స్‌కు డెలిగేట్ చేస్తుంది—ఉదాహరణకు కోడ్‌బేస్ సెర్చ్ చేయడం, పెద్ద ఫైల్ రివ్యూ చేయడం, లేదా సపోర్టింగ్ డాక్యుమెంట్స్ ప్రాసెస్ చేయడం. Codex‌లో సబ్‌ఏజెంట్స్ ఎలా పనిచేస్తాయో తెలుసుకోవడానికి docs⁠(కొత్త విండోలో తెరుచుకుంటుంది)ను చూడండి.

చిన్న మోడల్ మరింత వేగవంతంగా మరియు మరింత సామర్థ్యవంతంగా మారుతున్న కొద్దీ, ఈ ప్యాటర్న్ మరింత ఉపయోగకరంగా మారుతుంది. అన్నింటికీ ఒకే మోడల్‌ని ఉపయోగించకుండా, డెవలపర్లు పెద్ద మోడల్స్ ఏం చేయాలో నిర్ణయించేలా మరియు చిన్న మోడల్స్ స్కేల్‌లో త్వరగా అమలు చేసేలా సిస్టమ్‌లను కూర్చగలరు. GPT‑5.4 mini ఆ స్టైల్ వర్క్‌ఫ్లో కోసం మా దగ్గర ఇప్పటివరకు వచ్చిన అత్యంత శక్తివంతమైన mini మోడల్.

కంప్యూటర్ వినియోగం

GPT‑5.4 mini మల్టీమోడల్ పనుల్లో కూడా బలంగా ఉంది, ప్రత్యేకించి కంప్యూటర్ వినియోగానికి సంబంధించిన వాటిలో. మోడల్ ఘనమైన యూజర్ ఇంటర్‌ఫేస్‌ల స్క్రీన్షాట్‌లను త్వరగా అర్థం చేసుకుని, వేగంగా కంప్యూటర్ వినియోగ పనులను పూర్తి చేయగలదు. OSWorld-Verifiedలో, GPT‑5.4 mini GPT‑5.4కు చేరువవుతుండగా, GPT‑5 mini కంటే గణనీయంగా మెరుగైన పనితీరును ప్రదర్శిస్తోంది.

లభ్యత & ధరలు

GPT‑5.4 mini ఈరోజు API, Codex, మరియు ChatGPTలో అందుబాటులో ఉంది.

APIలో, GPT‑5.4 mini టెక్స్ట్ మరియు ఇమేజ్ ఇన్‌పుట్‌లు, టూల్ వినియోగం, ఫంక్షన్ కాలింగ్, వెబ్ శోధన, ఫైల్ శోధన, కంప్యూటర్ వినియోగం, మరియు నైపుణ్యాలను సపోర్ట్ చేస్తుంది. దీనికి 400k కాంటెక్స్ట్ విండో ఉంది మరియు 1M ఇన్‌పుట్ టోకెన్‌లకు $0.75 మరియు 1M అవుట్‌పుట్ టోకెన్‌లకు $4.50 ఖర్చు అవుతుంది.

Codex‌లో, GPT‑5.4 mini Codex app, CLI, IDE ఎక్స్‌టెన్షన్ మరియు web‌లో అందుబాటులో ఉంది. ఇది GPT‑5.4 యొక్క కేవలం 30% మాత్రమే ఉపయోగిస్తుంది quota వల్ల, డెవలపర్స్ Codex‌లో సింపుల్ కోడింగ్ టాస్క్స్‌ను సుమారు మూడో వంతు ఖర్చుతో వేగంగా పూర్తి చేయగలరు. తక్కువ రీజనింగ్ అవసరమైన పనులను చవకైన మోడల్‌పై నడిపేందుకు Codex, GPT‑5.4 mini సబ్‌ఏజెంట్స్‌కు డెలిగేట్ చేయగలదు.

ChatGPTలో, GPT‑5.4 mini + మెను లోని “Thinking” ఫీచర్ ద్వారా Free మరియు Go యూజర్లకు అందుబాటులో ఉంది. మిగతా అన్ని యూజర్ల కోసం, GPT‑5.4 కి రేట్ లిమిట్ వచ్చినప్పుడు ఉపయోగించే fallback గా GPT‑5.4 mini అందుబాటులో ఉంటుంది. Thinking.

GPT‑5.4 nano APIలో మాత్రమే అందుబాటులో ఉంటుంది మరియు ప్రతి 1M ఇన్‌పుట్ టోకెన్‌లకు $0.20 మరియు ప్రతి 1M అవుట్‌పుట్ టోకెన్‌లకు $1.25 ఖర్చవుతుంది.

మోడల్స్ యొక్క సేఫ్‌గార్డ్స్ గురించి మరింత సమాచారం కోసం మా డిప్లాయ్మెంట్ సేఫ్టీ హబ్⁠(కొత్త విండోలో తెరుచుకుంటుంది)లోని సిస్టమ్ కార్డ్ అడెండమ్‌ను చూడండి.

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 GPT‑5 mini కోసం అందుబాటులో ఉన్న అత్యధిక reasoning_effort 'high'.}

^{2 ఓవరాల్ ఎడిట్ డిస్టెన్స్. OmniDocBench ను reasoning_effort ను 'none'గా సెట్ చేసి నడిపారు, ఇది తక్కువ ఖర్చు మరియు తక్కువ లేటెన్సీ పనితీరును ప్రతిబింబిస్తుంది.}

2026

రచయిత

OpenAI

చదవడం కొనసాగించండి

అన్నీ చూడండి

Launching Health in ChatGPT

ప్రోడక్ట్23 జులై, 2026

How news organizations are using AI > Card Image

వార్తా సంస్థలు కీలక లక్ష్యాలకు AIను ఎలా వాడుతున్నాయి

Company22 జులై, 2026

OpenAI Presenceను పరిచయం చేస్తున్నాం

ప్రోడక్ట్22 జులై, 2026