ಮುಖ್ಯ ವಿಷಯಕ್ಕೆ ನೇರವಾಗಿ ಹೋಗಿ
OpenAI

ಮಾರ್ಚ್ 17, 2026

ಕಂಪನಿಉತ್ಪನ್ನ

GPT‑5.4 ಮಿನಿ ಮತ್ತು ನ್ಯಾನೋ ಪರಿಚಯ

ಕೋಡಿಂಗ್ ಮತ್ತು ಉಪ-ಏಜೆಂಟ್‌ಗಳಿಗಾಗಿ ಆಪ್ಟಿಮೈಸ್ ಮಾಡಲಾದ ವೇಗವಾದ ಮತ್ತು ದಕ್ಷ ಮಾಡೆಲ್‌ಗಳು

ಲೋಡ್ ಆಗುತ್ತಿದೆ…

ಇಂದು ನಾವು GPT‑5.4 ಮಿನಿ ಮತ್ತು ನ್ಯಾನೋ ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡುತ್ತಿದ್ದೇವೆ, ಇದುವರೆಗೆ ನಮ್ಮ ಅತ್ಯಂತ ಸಾಮರ್ಥ್ಯವಂತ ಸಣ್ಣ ಮಾಡೆಲ್‌ಗಳು. ಅವು GPT‑5.4 ನ ಅನೇಕ ಬಲಗಳನ್ನು ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದ ಕಾರ್ಯಭಾರಗಳಿಗೆ ವಿನ್ಯಾಸಗೊಳಿಸಿದ ವೇಗವಾದ, ಹೆಚ್ಚು ದಕ್ಷ ಮಾಡೆಲ್‌ಗಳಿಗೆ ತರುತ್ತವೆ.

GPT‑5.4 ಮಿನಿ ಕೋಡಿಂಗ್, ರೀಜನಿಂಗ್, ಮಲ್ಟಿಮೋಡಲ್ ಅರ್ಥಗ್ರಹಿಕೆ ಮತ್ತು ಸಾಧನ ಬಳಕೆಯಲ್ಲಿ GPT‑5 ಮಿನಿಗಿಂತ ಗಮನಾರ್ಹವಾಗಿ ಸುಧಾರಿಸುತ್ತದೆ, ಜೊತೆಗೆ 2x ಕ್ಕಿಂತ ಹೆಚ್ಚು ವೇಗವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಇದು SWE-Bench Pro ಮತ್ತು OSWorld-Verified ಸೇರಿದಂತೆ ಹಲವು ಮೌಲ್ಯಮಾಪನಗಳಲ್ಲಿ ದೊಡ್ಡ GPT‑5.4 ಮಾಡೆಲ್‌ನ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಸಹ ಸಮೀಪಿಸುತ್ತದೆ.

GPT‑5.4 ನ್ಯಾನೋ ವೇಗ ಮತ್ತು ವೆಚ್ಚ ಅತ್ಯಂತ ಮುಖ್ಯವಾಗಿರುವ ಕಾರ್ಯಗಳಿಗಾಗಿ GPT‑5.4 ನ ಅತ್ಯಂತ ಸಣ್ಣ, ಅತ್ಯಂತ ಕಡಿಮೆ ವೆಚ್ಚದ ಆವೃತ್ತಿಯಾಗಿದೆ. ಇದು GPT‑5 ನ್ಯಾನೋಗೆ ಹೋಲಿಸಿದರೆ ಬಹಳ ಮಹತ್ವದ ಅಪ್‌ಗ್ರೇಡ್ ಕೂಡ ಆಗಿದೆ. ವರ್ಗೀಕರಣ, ಡೇಟಾ ಹೊರತೆಗೆಯುವಿಕೆ, ರ‍್ಯಾಂಕಿಂಗ್ ಮತ್ತು ಸರಳ ಬೆಂಬಲ ಕಾರ್ಯಗಳನ್ನು ನಿಭಾಯಿಸುವ ಕೋಡಿಂಗ್ ಉಪಏಜೆಂಟ್‌ಗಳಿಗೆ ನಾವು ಇದನ್ನು ಶಿಫಾರಸು ಮಾಡುತ್ತೇವೆ.

ಈ ಮಾಡೆಲ್‌ಗಳನ್ನು ವಿಳಂಬವು ನೇರವಾಗಿ ಉತ್ಪನ್ನದ ಅನುಭವವನ್ನು ರೂಪಿಸುವ ಕಾರ್ಯಭಾರಗಳಿಗಾಗಿ ನಿರ್ಮಿಸಲಾಗಿದೆ: ತ್ವರಿತ ಪ್ರತಿಕ್ರಿಯೆ ನೀಡುವಂತೆ ಅನುಭವವಾಗಬೇಕಾದ ಕೋಡಿಂಗ್ ಸಹಾಯಕರು, ಬೆಂಬಲ ಕಾರ್ಯಗಳನ್ನು ಶೀಘ್ರವಾಗಿ ಪೂರ್ಣಗೊಳಿಸುವ ಉಪ-ಏಜೆಂಟ್‌ಗಳು, ಸ್ಕ್ರೀನ್‌ಶಾಟ್‌ಗಳನ್ನು ಸೆರೆಹಿಡಿದು ಅರ್ಥೈಸುವ ಕಂಪ್ಯೂಟರ್-ಬಳಕೆ ವ್ಯವಸ್ಥೆಗಳು ಮತ್ತು ಚಿತ್ರಗಳ ಮೇಲೆ ರಿಯಲ್-ಟೈಮ್‌ನಲ್ಲಿ ತರ್ಕಶೀಲವಾಗಿ ಚಿಂತನೆ ಮಾಡಬಲ್ಲ ಮಲ್ಟಿಮೋಡಲ್ ಅಪ್ಲಿಕೇಶನ್‌ಗಳು. ಈ ಪರಿಸರಗಳಲ್ಲಿ, ಅತ್ಯುತ್ತಮ ಮಾಡೆಲ್ ಅತಿದೊಡ್ಡದಾಗಿರುವುದಿಲ್ಲ—ಇದು ಶೀಘ್ರವಾಗಿ ಪ್ರತಿಕ್ರಿಯಿಸಬಲ್ಲದು, ಸಾಧನಗಳನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಬಳಸಬಲ್ಲದು ಮತ್ತು ಸಂಕೀರ್ಣ ವೃತ್ತಿಪರ ಕಾರ್ಯಗಳಲ್ಲಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸಬಲ್ಲದು.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 GPT‑5 ಮಿನಿಗೆ ಲಭ್ಯವಿರುವ ಗರಿಷ್ಠ ತಾರ್ಕಿಕ ಪ್ರಯತ್ನ 'ಹೈ' ಆಗಿದೆ.

GPT‑5.4 ಮಿನಿ ಮತ್ತು ನ್ಯಾನೋ ಅನ್ನು ಅವರ ವರ್ಕ್‌ಫ್ಲೋಗಳಲ್ಲಿ ಪರೀಕ್ಷಿಸಿದ ನಂತರ ನಮ್ಮ ಗ್ರಾಹಕರ ಅಭಿಪ್ರಾಯ ಇಲ್ಲಿದೆ:

"GPT-5.4 ಮಿನಿ ಈ ವರ್ಗದ ಮಾಡೆಲ್‌ಗೆ ಬಲವಾದ ಎಂಡ್-ಟು-ಎಂಡ್ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಒದಗಿಸುತ್ತದೆ. ನಮ್ಮ ಮೌಲ್ಯಮಾಪನಗಳಲ್ಲಿ ಇದು ಹಲವಾರು ಔಟ್‌ಪುಟ್ ಕಾರ್ಯಗಳು ಮತ್ತು ಉಲ್ಲೇಖ ಪುನಃಪ್ರಾಪ್ತಿಯಲ್ಲಿ ಬಹಳ ಕಡಿಮೆ ವೆಚ್ಚದಲ್ಲಿ ಸ್ಪರ್ಧಾತ್ಮಕ ಮಾಡೆಲ್‌ಗಳಿಗೆ ಸಮನಾಗಿತ್ತು ಅಥವಾ ಅದಕ್ಕಿಂತ ಉತ್ತಮವಾಗಿತ್ತು. ಇದು ದೊಡ್ಡ GPT-5.4 ಮಾಡೆಲ್‌ಗಿಂತಲೂ ಹೆಚ್ಚಿನ ಎಂಡ್-ಟು-ಎಂಡ್ ಪಾಸ್ ದರಗಳನ್ನು ಮತ್ತು ಹೆಚ್ಚು ಬಲವಾದ ಮೂಲ ಅಟ್ರಿಬ್ಯೂಷನ್ ಅನ್ನು ಸಾಧಿಸಿದೆ."
— ಆಭಾಸ್ ಶರ್ಮಾ, Hebbia ಯ CTO

ಕೋಡಿಂಗ್

GPT‑5.4 ಮಿನಿ ಮತ್ತು ನ್ಯಾನೋ ವೇಗವಾಗಿ ಪುನರಾವರ್ತಿಸಬಹುದಾದ ಪ್ರಕ್ರಿಯೆಯಿಂದ ಪ್ರಯೋಜನವಾಗುವ ಕೋಡಿಂಗ್ ವರ್ಕ್‌ಫ್ಲೋಗಳಲ್ಲಿ ವಿಶೇಷವಾಗಿ ಪರಿಣಾಮಕಾರಿ. ಮಾಡೆಲ್‌ಗಳು ಕಡಿಮೆ ವಿಳಂಬದೊಂದಿಗೆ ಟಾರ್ಗೆಟ್ ಮಾಡಿದ ಎಡಿಟ್‌ಗಳು, ಕೋಡ್‌ಬೇಸ್ ನ್ಯಾವಿಗೇಶನ್, ಫ್ರಂಟ್-ಎಂಡ್ ಜನರೇಷನ್ ಮತ್ತು ಡೀಬಗಿಂಗ್ ಲೂಪ್‌ಗಳನ್ನು ನಿರ್ವಹಿಸುತ್ತವೆ; ಇದರಿಂದ ವೇಗವಾಗಿ ಮತ್ತು ಕಡಿಮೆ ವೆಚ್ಚದಲ್ಲಿ ಪೂರ್ಣಗೊಳಿಸಬೇಕಾದ ಕೋಡಿಂಗ್ ಕಾರ್ಯಗಳಿಗೆ ಅವು ಉತ್ತಮ ಆಯ್ಕೆಯಾಗುತ್ತವೆ.

ಬೆಂಚ್‌ಮಾರ್ಕ್‌ಗಳಲ್ಲಿ, GPT‑5.4 ಮಿನಿ ಸಮಾನ ವಿಳಂಬಗಳಲ್ಲಿ GPT‑5‑ಮಿನಿಗಿಂತ ನಿರಂತರವಾಗಿ ಉತ್ತಮ ಪ್ರದರ್ಶನ ನೀಡುತ್ತದೆ ಮತ್ತು GPT‑5.4‑ಮಟ್ಟಕ್ಕೆ ಸಮೀಪಿಸುತ್ತದೆ ಬಹಳಷ್ಟು ವೇಗವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತಾ ಪಾಸ್ ದರಗಳನ್ನು ಕಾಯ್ದುಕೊಂಡು, ಕೋಡಿಂಗ್ ಕೆಲಸದ ಹರಿವಿಗೆ ಪರ್ಫಾರ್ಮೆನ್ಸ್-ಪ್ರತಿ-ಲ್ಯಾಟೆನ್ಸಿ ನಡುವೆ ಅತ್ಯಂತ ಶಕ್ತಿಶಾಲಿ ವಿನಿಮಯಗಳಲ್ಲಿ ಒಂದನ್ನು ಒದಗಿಸುತ್ತದೆ.

ನಾವು ನಮ್ಮ ಮಾಡೆಲ್‌ಗಳ ಉತ್ಪಾದನಾ ನಡವಳಿಕೆಯನ್ನು ನೋಡಿ ಮತ್ತು ಇದನ್ನು ಆಫ್‌ಲೈನ್‌ನಲ್ಲಿ ಸಿಮ್ಯುಲೇಟ್ ಮಾಡುವ ಮೂಲಕ ಲೇಟೆನ್ಸಿಯನ್ನು ಅಂದಾಜಿಸುತ್ತೇವೆ. ಲೇಟೆನ್ಸಿ ಅಂದಾಜು ಉಪಕರಣ ಕರೆ ಅವಧಿ (ಕೋಡ್ ಕಾರ್ಯಗತಗೊಳಿಸುವ ಸಮಯ), ಮಾದರಿಯಾಗಿಸಿದ ಟೋಕನ್‌ಗಳು ಮತ್ತು ಇನ್‌ಪುಟ್ ಟೋಕನ್‌ಗಳನ್ನು ಪರಿಗಣಿಸುತ್ತದೆ. ನೈಜ-ಪ್ರಪಂಚದ ಲೇಟೆನ್ಸಿ ಬಹಳ ಮಟ್ಟಿಗೆ ಬದಲಾಗಬಹುದು ಮತ್ತು ನಮ್ಮ ಅನುಕರಣೆಯಲ್ಲಿ ಸೆರೆಹಿಡಿಯದಿರುವ ಅನೇಕ ಅಂಶಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುತ್ತದೆ. ಅದೇ ರೀತಿ, ವೆಚ್ಚಗಳನ್ನು ಇದನ್ನು ಬರೆಯುವ ಸಮಯದಲ್ಲಿ ಈ ಮಾಡೆಲ್‌ಗಳ API ಬೆಲೆ ನಿಗದಿಯ ಆಧಾರದ ಮೇಲೆ ಅಂದಾಜಿಸಲಾಗಿದೆ. ಭವಿಷ್ಯದಲ್ಲಿ ವೆಚ್ಚಗಳು ಬದಲಾಗಬಹುದು. ರೀಜನಿಂಗ್ ಪ್ರಯತ್ನಗಳನ್ನು ಕಡಿಮೆ ಮಟ್ಟದಿಂದ xhigh ಮಟ್ಟಕ್ಕೆ ವರ್ಗಾಯಿಸಲಾಯಿತು.

ಉಪಏಜೆಂಟ್‌ಗಳು

GPT‑5.4 ಮಿನಿ ವಿಭಿನ್ನ ಗಾತ್ರಗಳ ಮಾಡೆಲ್‌ಗಳನ್ನು ಸಂಯೋಜಿಸುವ ಸಿಸ್ಟಮ್‌ಗಳಿಗೆ ಸಹ ಉತ್ತಮ ಹೊಂದಾಣಿಕೆಯಾಗಿದೆ. Codex ನಲ್ಲಿ, ಉದಾಹರಣೆಗೆ, GPT‑5.4 ನಂತಹ ದೊಡ್ಡ ಮಾಡೆಲ್ ಯೋಜನೆ, ಸಮನ್ವಯ ಮತ್ತು ಅಂತಿಮ ನಿರ್ಣಯವನ್ನು ನಿಭಾಯಿಸಬಹುದು, ಜೊತೆಗೆ ಸಮಾಂತರವಾಗಿ ಸೀಮಿತ ಉಪಕಾರ್ಯಗಳನ್ನು ನಿಭಾಯಿಸುವ GPT‑5.4 ಮಿನಿ ಉಪ ಏಜೆಂಟ್‌ಗಳಿಗೆ ವಹಿಸಿಕೊಡುತ್ತದೆ—ಉದಾಹರಣೆಗೆ ಕೋಡ್‌ಬೇಸ್ ಹುಡುಕುವುದು, ದೊಡ್ಡ ಫೈಲ್ ಅನ್ನು ವಿಮರ್ಶಿಸುವುದು ಅಥವಾ ಬೆಂಬಲ ದಾಖಲೆಗಳನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು. ಡಾಕ್ಸ್(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ನಲ್ಲಿ Codex ನಲ್ಲಿ ಸಬ್ಏಜೆಂಟ್ಸ್ ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ ಎಂಬುದನ್ನು ತಿಳಿಯಿರಿ.

ಚಿಕ್ಕ ಮಾಡೆಲ್‌ಗಳು ಹೆಚ್ಚು ವೇಗವಾಗಿ ಮತ್ತು ಹೆಚ್ಚು ಸಮರ್ಥವಾಗುತ್ತಾ ಬಂದಂತೆ, ಈ ಮಾದರಿಯು ಇನ್ನೂ ಹೆಚ್ಚು ಉಪಯುಕ್ತವಾಗುತ್ತದೆ. ಎಲ್ಲದರಿಗೂ ಒಂದೇ ಮಾಡೆಲ್ ಬಳಸುವುದರಿಂದ ಬದಲಾಗಿ, ಡೆವಲಪರ್‌ಗಳು ದೊಡ್ಡ ಮಾಡೆಲ್‌ಗಳು ಏನು ಮಾಡಬೇಕೆಂದು ನಿರ್ಧರಿಸುವ ಮತ್ತು ಸಣ್ಣ ಮಾಡೆಲ್‌ಗಳು ದೊಡ್ಡ ಪ್ರಮಾಣದಲ್ಲಿ ವೇಗವಾಗಿ ಕಾರ್ಯಗತಗೊಳಿಸುವ ವ್ಯವಸ್ಥೆಗಳನ್ನು ಸಂಯೋಜಿಸಬಹುದು. GPT‑5.4 mini ಆ ಶೈಲಿಯ ವರ್ಕ್‌ಫ್ಲೋಗೆ ಇದುವರೆಗಿನ ನಮ್ಮ ಅತ್ಯಂತ ಶಕ್ತಿಶಾಲಿ ಮಿನಿ ಮಾಡೆಲ್.

ಕಂಪ್ಯೂಟರ್ ಬಳಕೆ

GPT‑5.4 ಮಿನಿ ಬಹುಮಾಧ್ಯಮ ಕಾರ್ಯಗಳಲ್ಲಿ ಬಲವಾಗಿದೆ, ವಿಶೇಷವಾಗಿ ಕಂಪ್ಯೂಟರ್ ಬಳಕೆಗೆ ಸಂಬಂಧಿಸಿದ ಕಾರ್ಯಗಳಲ್ಲಿ. ಮಾಡೆಲ್ ದಟ್ಟ ಬಳಕೆದಾರ ಇಂಟರ್ಫೇಸ್‌ಗಳ ಸ್ಕ್ರೀನ್‌ಶಾಟ್‌ಗಳನ್ನು ತ್ವರಿತವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಿ ಮತ್ತು ವೇಗವಾಗಿ ಕಂಪ್ಯೂಟರ್ ಬಳಕೆ ಕಾರ್ಯಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಬಹುದು. OSWorld-Verified ನಲ್ಲಿ, GPT‑5.4 ಮಿನಿ GPT‑5.4 ಗೆ ಸಮೀಪಿಸುತ್ತದೆ ಮತ್ತು GPT‑5 ಮಿನಿ ಅನ್ನು ಗಮನಾರ್ಹವಾಗಿ ಮೀರಿಸುತ್ತದೆ.

ಲಭ್ಯತೆ ಮತ್ತು ಬೆಲೆ

GPT‑5.4 ಮಿನಿ ಇಂದು API, Codex ಮತ್ತು ChatGPT ನಲ್ಲಿ ಲಭ್ಯವಿದೆ.

API ಯಲ್ಲಿ, GPT‑5.4 ಮಿನಿ ಪಠ್ಯ ಮತ್ತು ಚಿತ್ರ ಇನ್‌ಪುಟ್‌ಗಳು, ಉಪಕರಣ ಬಳಕೆ, ಫಂಕ್ಷನ್ ಕಾಲಿಂಗ್, ವೆಬ್ ಹುಡುಕಾಟ, ಫೈಲ್ ಹುಡುಕಾಟ, ಕಂಪ್ಯೂಟರ್ ಬಳಕೆ ಮತ್ತು ಕೌಶಲ್ಯಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. ಇದಕ್ಕೆ 400k ಕಾನ್ಟೆಕ್ಸ್ಟ್ ವಿಂಡೋ ಇದೆ ಮತ್ತು ಪ್ರತಿ 1M ಇನ್‌ಪುಟ್ ಟೋಕನ್‌ಗಳಿಗೆ $0.75 ಮತ್ತು ಪ್ರತಿ 1M ಔಟ್‌ಪುಟ್ ಟೋಕನ್‌ಗಳಿಗೆ $4.50 ವೆಚ್ಚವಾಗುತ್ತದೆ.

Codex ನಲ್ಲಿ, GPT‑5.4 ಮಿನಿ Codex ಆ್ಯಪ್, CLI, IDE ಎಕ್ಸ್ಟೆನ್ಶನ್ ಮತ್ತು ವೆಬ್‌ನಾದ್ಯಂತ ಲಭ್ಯವಿದೆ. ಇದು GPT‑5.4 ನ 30% ಅನ್ನು ಮಾತ್ರ ಬಳಸುತ್ತದೆ ಕೋಟಾ, Codex ನಲ್ಲಿ ಡೆವಲಪರ್‌ಗಳಿಗೆ ಸರಳ ಕೋಡಿಂಗ್ ಕಾರ್ಯಗಳನ್ನು ತ್ವರಿತವಾಗಿ ನಿರ್ವಹಿಸಲು ನೆರವಾಗಿ, ಸುಮಾರು ಮೂರನೇ ಒಂದು ಭಾಗ ವೆಚ್ಚದಲ್ಲಿ. Codex ಕಡಿಮೆ ರೀಜನಿಂಗ್-ಇಂಟೆನ್ಸಿವ್ ಕೆಲಸವನ್ನು ಕಡಿಮೆ ವೆಚ್ಚದ ಮಾಡೆಲ್‌ನಲ್ಲಿ ನಡೆಯುವಂತೆ GPT‑5.4 ಮಿನಿ ಉಪ ಏಜೆಂಟ್‌ಗಳಿಗೆ ವಹಿಸಿಕೊಡಬಹುದು.

ChatGPT ನಲ್ಲಿ, GPT‑5.4 ಮಿನಿ “Thinking” ವೈಶಿಷ್ಟ್ಯದ ಮೂಲಕ + ಮೆನುದಲ್ಲಿ Free ಮತ್ತು Go ಬಳಕೆದಾರರಿಗೆ ಲಭ್ಯವಿದೆ. ಇತರ ಎಲ್ಲಾ ಬಳಕೆದಾರರಿಗಾಗಿ, GPT‑5.4 ಮಿನಿ ಅನ್ನು GPT‑5.4 Thinking ಗಾಗಿ ದರ ಮಿತಿಯಾಗಿ ಲಭ್ಯವಿದೆ.

GPT‑5.4 nano ಕೇವಲ API ಯಲ್ಲಿ ಮಾತ್ರ ಲಭ್ಯವಿದೆ ಮತ್ತು ಪ್ರತಿ 1M ಇನ್‌ಪುಟ್ ಟೋಕನ್‌ಗಳಿಗೆ $0.20 (0.20 ಡಾಲರ್) ಮತ್ತು ಪ್ರತಿ 1M ಔಟ್‌ಪುಟ್ ಟೋಕನ್‌ಗಳಿಗೆ $1.25 (1.25 ಡಾಲರ್) ವೆಚ್ಚವಾಗುತ್ತದೆ.

ಮಾಡೆಲ್‌ಗಳ ಸುರಕ್ಷತಾ ಕ್ರಮಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ, ದಯವಿಟ್ಟು ನಮ್ಮ ನಿಯೋಜನೆ ಸುರಕ್ಷತಾ ಕೇಂದ್ರ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ನಲ್ಲಿ ಇರುವ ಸಿಸ್ಟಮ್ ಕಾರ್ಡ್ ಅನುಬಂಧವನ್ನು ಪರಿಶೀಲಿಸಿ.

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 GPT‑5 ಮಿನಿಗೆ ಲಭ್ಯವಿರುವ ಗರಿಷ್ಠ ತಾರ್ಕಿಕ ಪ್ರಯತ್ನ 'ಹೈ' ಆಗಿದೆ.

2 ಒಟ್ಟು ಎಡಿಟ್ ಡಿಸ್ಟೆನ್ಸ್. OmniDocBench ಅನ್ನು 'ರೀಸನಿಂಗ್_ಶ್ರಮ' ಅನ್ನು 'ನನ್' ಎಂದು ಹೊಂದಿಸಿ ಚಾಲನೆಗೊಳಿಸಲಾಯಿತು, ಕಡಿಮೆ ವೆಚ್ಚದ, ಕಡಿಮೆ ಲೇಟೆನ್ಸಿಯ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಪ್ರತಿಬಿಂಬಿಸಲು.

ಲೇಖಕ

OpenAI