ಏಪ್ರಿಲ್ 24, 2026ರ ಅಪ್ಡೇಟ್: GPT‑5.5 ಮತ್ತು GPT‑5.5 Pro ಈಗ API ನಲ್ಲಿ ಲಭ್ಯವಿವೆ. ಸಿಸ್ಟಮ್ ಕಾರ್ಡ್ ಅನ್ವಯವಾಗುವ ಹೆಚ್ಚುವರಿ ಸುರಕ್ಷತಾ ಕ್ರಮಗಳನ್ನು ವಿವರಿಸಲು ಸಹ ನವೀಕರಿಸಲಾಗಿದೆ.
ನಾವು GPT‑5.5 ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡುತ್ತಿದ್ದೇವೆ, ಇದು ಇದುವರೆಗೆ ನಮ್ಮ ಅತ್ಯಂತ ಬುದ್ಧಿವಂತ ಮತ್ತು ಬಳಸಲು ಅತ್ಯಂತ ಸಹಜವಾದ ಮಾಡೆಲ್ ಆಗಿದ್ದು, ಕಂಪ್ಯೂಟರ್ನಲ್ಲಿ ಕೆಲಸಗಳನ್ನು ಮಾಡಲು ಹೊಸ ವಿಧಾನಕ್ಕೆ ಮುಂದಿನ ಹೆಜ್ಜೆಯಾಗಿದೆ.
GPT‑5.5 ನೀವು ಏನು ಮಾಡಲು ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದೀರಿ ಎಂಬುದನ್ನು ವೇಗವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುತ್ತದೆ ಮತ್ತು ಹೆಚ್ಚಿನ ಕೆಲಸವನ್ನು ಸ್ವತಃ ನಿರ್ವಹಿಸಬಹುದು. ಇದು ಕೋಡ್ ಬರೆಯುವುದು ಮತ್ತು ಡೀಬಗ್ ಮಾಡುವುದು, ಆನ್ಲೈನ್ನಲ್ಲಿ ಸಂಶೋಧನೆ ನಡೆಸುವುದು, ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸುವುದು, ಡಾಕ್ಯುಮೆಂಟ್ಗಳು ಮತ್ತು ಸ್ಪ್ರೆಡ್ಶೀಟ್ಗಳನ್ನು ರಚಿಸುವುದು, ಸಾಫ್ಟ್ವೇರ್ ಅನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸುವುದು ಮತ್ತು ಒಂದು ಕಾರ್ಯ ಪೂರ್ಣಗೊಳ್ಳುವವರೆಗೆ ವಿವಿಧ ಟೂಲ್ಗಳ ನಡುವೆ ಕಾರ್ಯನಿರ್ವಹಿಸುವುದರಲ್ಲಿ ಶ್ರೇಷ್ಠವಾಗಿದೆ. ಪ್ರತಿ ಹಂತವನ್ನೂ ಎಚ್ಚರಿಕೆಯಿಂದ ನಿರ್ವಹಿಸುವ ಬದಲು, ನೀವು GPT‑5.5 ಗೆ ಅವ್ಯವಸ್ಥಿತ, ಬಹು-ಭಾಗಗಳ ಕಾರ್ಯವನ್ನು ನೀಡಬಹುದು ಮತ್ತು ಅದು ಯೋಜಿಸಲು, ಸಾಧನಗಳನ್ನು ಬಳಸಲು, ತನ್ನ ಕೆಲಸವನ್ನು ಪರಿಶೀಲಿಸಲು, ಅಸ್ಪಷ್ಟತೆಯ ಮೂಲಕ ನ್ಯಾವಿಗೇಟ್ ಮಾಡಲು ಮತ್ತು ಮುಂದುವರಿಯಲು ಅದನ್ನು ನಂಬಬಹುದು.
ಕಾರ್ಯನಿರ್ವಹಣಾತ್ಮಕ ಕೋಡಿಂಗ್, ಕಂಪ್ಯೂಟರ್ ಬಳಕೆ, ಜ್ಞಾನಾಧಾರಿತ ಕೆಲಸ ಮತ್ತು ಆರಂಭಿಕ ವೈಜ್ಞಾನಿಕ ಸಂಶೋಧನೆಗಳಲ್ಲಿ ಸಾಧನೆಗಳು ವಿಶೇಷವಾಗಿ ಬಲವಾಗಿವೆ—ಸಂದರ್ಭಗಳಾದ್ಯಂತ ರೀಜನಿಂಗ್ ಮತ್ತು ಕಾಲಾನಂತರದಲ್ಲಿ ಕ್ರಮ ಕೈಗೊಳ್ಳುವಿಕೆಯಿಂದ ಪ್ರಗತಿ ಅವಲಂಬಿತವಾಗಿರುವ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ. GPT‑5.5 ವೇಗದಲ್ಲಿ ಯಾವುದೇ ರಾಜಿ ಮಾಡಿಕೊಳ್ಳದೆ ಬುದ್ಧಿವಂತಿಕೆಯಲ್ಲಿ ಈ ಹೆಚ್ಚಳವನ್ನು ಒದಗಿಸುತ್ತದೆ: ದೊಡ್ಡದು, ಹೆಚ್ಚು ಸಾಮರ್ಥ್ಯವಿರುವ ಮಾಡೆಲ್ಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಸೇವೆ ನೀಡಲು ನಿಧಾನವಾಗಿರುತ್ತವೆ, ಆದರೆ GPT‑5.5 ನೈಜ-ಜಗತ್ತಿನ ಸರ್ವಿಂಗ್ನಲ್ಲಿ GPT‑5.4 ರ ಪ್ರತಿ-ಟೋಕನ್ ಲ್ಯಾಟೆನ್ಸಿಗೆ ಸಮನಾಗಿದ್ದು, ಇನ್ನೂ ಬಹಳ ಉನ್ನತ ಮಟ್ಟದ ಬುದ್ಧಿವಂತಿಕೆಯಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಅದೇ Codex ಕಾರ್ಯಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಲು ಇದು ಗಮನಾರ್ಹವಾಗಿ ಕಡಿಮೆ ಟೋಕನ್ಗಳನ್ನು ಬಳಸುತ್ತದೆ, ಇದರಿಂದ ಇದು ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿ ಮತ್ತು ಹೆಚ್ಚು ಸಾಮರ್ಥ್ಯವುಳ್ಳದಾಗುತ್ತದೆ.
ನಾವು GPT‑5.5 ಅನ್ನು ಇದುವರೆಗೆ ನಮ್ಮ ಅತ್ಯಂತ ಬಲವಾದ ಸುರಕ್ಷತಾ ಕ್ರಮಗಳ ಸಮೂಹದೊಂದಿಗೆ ಬಿಡುಗಡೆ ಮಾಡುತ್ತಿದ್ದೇವೆ. ಇದು ದುರುಪಯೋಗವನ್ನು ಕಡಿಮೆ ಮಾಡುವಂತೆ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ ಮತ್ತು ಪ್ರಯೋಜನಕಾರಿ ಕೆಲಸಗಳಿಗೆ ಪ್ರವೇಶವನ್ನು ಉಳಿಸುತ್ತದೆ. ಬಿಡುಗಡೆಯ ಮೊದಲು, ನಾವು ಈ ಮಾಡೆಲ್ ಅನ್ನು ನಮ್ಮ ಸುರಕ್ಷತೆ ಮತ್ತು ಸನ್ನದ್ಧತೆ ಚೌಕಟ್ಟುಗಳ ಸಮಗ್ರ ಸಮೂಹದಲ್ಲಿ ಮೌಲ್ಯಮಾಪನ ಮಾಡಿದ್ದೇವೆ. ನಾವು ಆಂತರಿಕ ಮತ್ತು ಬಾಹ್ಯ ರೆಡ್ ಟೀಮರ್ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಿದ್ದೇವೆ, ಉನ್ನತ ಸೈಬರ್ಸುರಕ್ಷತೆ ಮತ್ತು ಜೈವಿಕ ಸಾಮರ್ಥ್ಯಗಳಿಗಾಗಿ ಉದ್ದೇಶಿತ ಪರೀಕ್ಷೆಗಳನ್ನು ಸೇರಿಸಿದ್ದೇವೆ, ಮತ್ತು ಸುಮಾರು 200 ವಿಶ್ವಾಸಾರ್ಹ ಆರಂಭಿಕ-ಪ್ರವೇಶ ಪಾಲುದಾರರಿಂದ ನೈಜ ಬಳಕೆ ಪ್ರಕರಣಗಳ ಕುರಿತು ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಸಂಗ್ರಹಿಸಿದ್ದೇವೆ.
ಇಂದು, GPT‑5.5 ಅನ್ನು ChatGPT ಮತ್ತು Codex ನಲ್ಲಿ Plus, Pro, Business ಮತ್ತು Enterprise ಬಳಕೆದಾರರಿಗೆ ರೋಲ್ಔಟ್ ಮಾಡಲಾಗುತ್ತಿದೆ, ಮತ್ತು GPT‑5.5 Pro ಅನ್ನು ChatGPT ನಲ್ಲಿ Pro, Business ಮತ್ತು Enterprise ಬಳಕೆದಾರರಿಗೆ ರೋಲ್ಔಟ್ ಮಾಡಲಾಗುತ್ತಿದೆ. API ನಿಯೋಜನೆಗಳಿಗೆ ವಿಭಿನ್ನ ಸುರಕ್ಷತಾ ಕ್ರಮಗಳು ಅಗತ್ಯವಿರುತ್ತವೆ ಮತ್ತು ಇದನ್ನು ದೊಡ್ಡ ಪ್ರಮಾಣದಲ್ಲಿ ಒದಗಿಸಲು ಬೇಕಾದ ಸುರಕ್ಷತೆ ಮತ್ತು ಭದ್ರತಾ ಅವಶ್ಯಕತೆಗಳ ಕುರಿತು ನಾವು ಪಾಲುದಾರರು ಮತ್ತು ಗ್ರಾಹಕರೊಂದಿಗೆ ನಿಕಟವಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತಿದ್ದೇವೆ. ನಾವು GPT‑5.5 ಮತ್ತು GPT‑5.5 Pro ಅನ್ನು ಶೀಘ್ರದಲ್ಲೇ API ಗೆ ತರುತ್ತೇವೆ.
GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro | |
ಟರ್ಮಿನಲ್-ಬೆಂಚ್ 2.0 | 82.7% | 75.1% | - | - | 69.4% | 68.5% |
ತಜ್ಞ-SWE (ಆಂತರಿಕ) | 73.1% | 68.5% | - | - | - | - |
GDPval (ಗೆಲುವುಗಳು ಅಥವಾ ಸಮನ್ವಯಗಳು) | 84.9% | 83.0% | 82.3% | 82.0% | 80.3% | 67.3% |
OSWorld-ಪ್ರಮಾಣಿತ | 78.7% | 75.0% | - | - | 78.0% | - |
Toolathlon | 55.6% | 54.6% | - | - | - | 48.8% |
BrowseComp | 84.4% | 82.7% | 90.1% | 89.3% | 79.3% | 85.9% |
FrontierMath ಮಟ್ಟ 1–3 | 51.7% | 47.6% | 52.4% | 50.0% | 43.8% | 36.9% |
FrontierMath ಮಟ್ಟ 4 | 35.4% | 27.1% | 39.6% | 38.0% | 22.9% | 16.7% |
CyberGym | 81.8% | 79.0% | - | - | 73.1% | - |
OpenAI ಏಜೆಂಟಿಕ್ AI ಗಾಗಿ ಜಾಗತಿಕ ಮೂಲಸೌಕರ್ಯವನ್ನು ನಿರ್ಮಿಸುತ್ತಿದ್ದು, ಇದರಿಂದ ಜಗತ್ತಿನಾದ್ಯಂತ ಜನರು ಮತ್ತು ವ್ಯವಹಾರಗಳು AI ಯೊಂದಿಗೆ ತಮ್ಮ ಕೆಲಸಗಳನ್ನು ಸುಲಭವಾಗಿ ಪೂರ್ಣಗೊಳಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ಕಳೆದ ಒಂದು ವರ್ಷದಲ್ಲಿ, ನಾವು AI ಸಾಫ್ಟ್ವೇರ್ ಎಂಜಿನಿಯರಿಂಗ್ ಅನ್ನು ಗಣನೀಯವಾಗಿ ವೇಗಗೊಳಿಸಿರುವುದನ್ನು ಗಮನಿಸಿದ್ದೇವೆ. Codex ಮತ್ತು ChatGPT ನಲ್ಲಿ GPT‑5.5 ನೊಂದಿಗೆ, ಅದೇ ಪರಿವರ್ತನೆ ಈಗ ವೈಜ್ಞಾನಿಕ ಸಂಶೋಧನೆಗೂ ಮತ್ತು ಜನರು ಕಂಪ್ಯೂಟರ್ಗಳಲ್ಲಿ ಮಾಡುವ ವ್ಯಾಪಕ ಕೆಲಸಕ್ಕೂ ವಿಸ್ತರಿಸುತ್ತಿದೆ.
ಈ ಕ್ಷೇತ್ರಗಳಾದ್ಯಂತ, GPT‑5.5 ಕೇವಲ ಹೆಚ್ಚು ಬುದ್ಧಿವಂತವಾಗಿದೆ ಮಾತ್ರವಲ್ಲ; ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸುವ ವಿಧಾನದಲ್ಲಿಯೂ ಇದು ಹೆಚ್ಚು ದಕ್ಷವಾಗಿದೆ ಮತ್ತು ಅನೇಕ ಸಂದರ್ಭಗಳಲ್ಲಿ ಕಡಿಮೆ ಟೋಕನ್ಗಳು ಹಾಗೂ ಕಡಿಮೆ ಮರುಪ್ರಯತ್ನಗಳೊಂದಿಗೆ ಹೆಚ್ಚಿನ ಗುಣಮಟ್ಟದ ಔಟ್ಪುಟ್ಗಳನ್ನು ತಲುಪುತ್ತದೆ. Artificial Analysis ನ Coding Index ನಲ್ಲಿ, GPT‑5.5 ಸ್ಪರ್ಧಾತ್ಮಕ ಅತ್ಯಾಧುನಿಕ ಕೋಡಿಂಗ್ ಮಾಡೆಲ್ಗಳಿಗಿಂತ ಅರ್ಧ ವೆಚ್ಚದಲ್ಲಿ ಅತ್ಯಾಧುನಿಕ ಬುದ್ಧಿಮತ್ತೆಯನ್ನು ಒದಗಿಸುತ್ತದೆ.
ಆರ್ಟಿಫಿಷಿಯಲ್ ಅನಾಲಿಸಿಸ್ ಇಂಟೆಲಿಜೆನ್ಸ್ ಇಂಡೆಕ್ಸ್(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಎಂಬುದು ಬಾಹ್ಯ ಪಕ್ಷವು ನಡೆಸಿದ 10 ಮೌಲ್ಯಮಾಪನಗಳ ಭಾರಿತ ಸರಾಸರಿಯಾಗಿದೆ: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.
GPT‑5.5 ಇದುವರೆಗೆ ನಮ್ಮ ಅತ್ಯಂತ ಬಲವಾದ ಏಜೆಂಟಿಕ್ ಕೋಡಿಂಗ್ ಮಾಡೆಲ್. ಯೋಜನೆ, ಪುನರಾವರ್ತನೆ ಮತ್ತು ಸಾಧನಗಳ ಸಮನ್ವಯವನ್ನು ಅಗತ್ಯವಿರುವ ಸಂಕೀರ್ಣ ಕಮಾಂಡ್-ಲೈನ್ ಕಾರ್ಯಪ್ರವಾಹಗಳನ್ನು ಪರೀಕ್ಷಿಸುವ ಟರ್ಮಿನಲ್-ಬೆಂಚ್ 2.0 ನಲ್ಲಿ, ಇದು 82.7% ರ ಅತ್ಯಾಧುನಿಕ ಮಟ್ಟದ ನಿಖರತೆಯನ್ನು ಸಾಧಿಸುತ್ತದೆ. ನೈಜ-ಜಗತ್ತಿನ GitHub ಸಮಸ್ಯೆಗಳ ಪರಿಹಾರವನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುವ SWE-Bench Pro ನಲ್ಲಿ, ಇದು 58.6% ತಲುಪುತ್ತದೆ ಮತ್ತು ಹಿಂದಿನ ಮಾಡೆಲ್ಗಳಿಗಿಂತ ಒಂದೇ ಪ್ರಯತ್ನದಲ್ಲಿ ಆರಂಭದಿಂದ ಅಂತ್ಯದವರೆಗೆ ಹೆಚ್ಚು ಕಾರ್ಯಗಳನ್ನು ಪರಿಹರಿಸುತ್ತದೆ. Expert-SWE ನಲ್ಲಿ, ಮಾನವರು ಪೂರ್ಣಗೊಳಿಸಲು ಅಂದಾಜಿಸಲಾದ ಮಧ್ಯಮ ಸಮಯ 20 ಗಂಟೆಗಳಿರುವ ದೀರ್ಘಾವಧಿಯ ಕೋಡಿಂಗ್ ಕಾರ್ಯಗಳಿಗಾಗಿ ನಮ್ಮ ಆಂತರಿಕ ಅತ್ಯಾಧುನಿಕ ಮೌಲ್ಯಮಾಪನದಲ್ಲಿ, GPT‑5.5 ಕೂಡ GPT‑5.4 ಅನ್ನು ಮೀರಿಸುತ್ತದೆ.
ಮೂರೂ ಮೌಲ್ಯಮಾಪನಗಳಾದ್ಯಂತ, GPT‑5.5 GPT‑5.4 ಗಿಂತ ಉತ್ತಮವಾಗಿ ಕಡಿಮೆ ಟೋಕನ್ಗಳನ್ನು ಬಳಸುತ್ತಾ ಅಂಕಗಳನ್ನು ಸಾಧಿಸುತ್ತದೆ.
ಮಾಡೆಲ್ನ ಕೋಡಿಂಗ್ ಸಾಮರ್ಥ್ಯಗಳು ವಿಶೇಷವಾಗಿ Codex ನಲ್ಲಿ ಸ್ಪಷ್ಟವಾಗಿ ಕಾಣಿಸುತ್ತವೆ, ಅಲ್ಲಿ ಅದು ಅಮಲೀಕರಣ ಮತ್ತು ರಿಫ್ಯಾಕ್ಟರ್ಗಳಿಂದ ಹಿಡಿದು ಡೀಬಗ್ಗಿಂಗ್, ಪರೀಕ್ಷೆ ಮತ್ತು ಮೌಲ್ಯೀಕರಣದವರೆಗೆ ಇರುವ ಎಂಜಿನಿಯರಿಂಗ್ ಕೆಲಸಗಳನ್ನು ನಿರ್ವಹಿಸಬಲ್ಲದು. ಆರಂಭಿಕ ಪರೀಕ್ಷೆಗಳು GPT‑5.5 ನಿಜವಾದ ಎಂಜಿನಿಯರಿಂಗ್ ಕೆಲಸ ಅವಲಂಬಿಸುವ ವರ್ತನೆಗಳಲ್ಲಿ ಹೆಚ್ಚು ಉತ್ತಮವಾಗಿದೆ ಎಂದು ಸೂಚಿಸುತ್ತವೆ — ಉದಾಹರಣೆಗೆ, ದೊಡ್ಡ ಸಿಸ್ಟಮ್ಗಳಾದ್ಯಂತ ಸಂದರ್ಭವನ್ನು ಕಾಪಾಡಿಕೊಳ್ಳುವುದು, ಅಸ್ಪಷ್ಟ ವೈಫಲ್ಯಗಳ ಮೂಲಕ ರೀಜನಿಂಗ್ ಮಾಡುವುದು, ಉಪಕರಣಗಳ ಸಹಾಯದಿಂದ ಊಹೆಗಳನ್ನು ಪರಿಶೀಲಿಸುವುದು ಮತ್ತು ಸುತ್ತಮುತ್ತಲಿನ ಕೋಡ್ಬೇಸ್ನಾದ್ಯಂತ ಬದಲಾವಣೆಗಳನ್ನು ಮುಂದುವರಿಸುವುದು.
ರೆಂಡರ್ ಮಾಡಿದ ಪಥವು ಓದುವ ಸುಲಭತೆಯನ್ನು ಹೆಚ್ಚಿಸಲು ಡಿಸ್ಪ್ಲೇ ಸ್ಕೇಲಿಂಗ್ ಅನ್ನು ಅನ್ವಯಿಸಿದ NASA/JPL Horizons ವೆಕ್ಟರ್ ಡೇಟಾವನ್ನು ಓರಿಯನ್, ಚಂದ್ರ ಮತ್ತು ಸೂರ್ಯಕ್ಕಾಗಿ ಬಳಸುತ್ತದೆ.
ಪ್ರಾಂಪ್ಟ್: [ಲಗತ್ತಿಸಲಾದ ಚಿತ್ರ] ಆರ್ಟೆಮಿಸ್ II ಮಿಷನ್ನಿಂದ ನೈಜ ಡೇಟಾವನ್ನು ಬಳಸಿಕೊಂಡು webgl ಮತ್ತು vite ಬಳಸಿಕೊಂಡು ಇದನ್ನು ಹೊಸ ಅಪ್ಲಿಕೇಶನ್ನಂತೆ ಕಾರ್ಯಗತಗೊಳಿಸಿ. ಆ್ಯಪ್ ಅನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ಪರೀಕ್ಷಿಸಿ; ಅದು ಸಂಪೂರ್ಣವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವವರೆಗೆ ಮತ್ತು ಚಿತ್ರದಲ್ಲಿರುವ ಆ್ಯಪ್ನಂತೆ ಕಾಣುವವರೆಗೆ ಪರೀಕ್ಷಿಸುತ್ತಿರುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ. ಗ್ರಹಗಳು ಮತ್ತು ಹಾರಾಟದ ಮಾರ್ಗಗಳ ರೆಂಡರಿಂಗ್ಗೆ ಗಮನವಿಟ್ಟು ನೋಡಿ. ನಾನು 3D ರೆಂಡರಿಂಗ್ ಜೊತೆ ಪರಸ್ಪರ ಕ್ರಿಯೆ ನಡೆಸಲು ಸಾಧ್ಯವಾಗಬೇಕು. ಇದರಲ್ಲಿ ವಾಸ್ತವಿಕ ಕಕ್ಷಾ ಯಾಂತ್ರಿಕತೆ ಇದೆ ಎಂದು ಖಚಿತಪಡಿಸಿ.
ಬೆಂಚ್ಮಾರ್ಕ್ಗಳನ್ನು ಮೀರಿ, ಆರಂಭಿಕ ಪರೀಕ್ಷಕರು GPT‑5.5 ಒಂದು ವ್ಯವಸ್ಥೆಯ ರಚನೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಲ್ಲಿ ಹೆಚ್ಚು ಬಲವಾದ ಸಾಮರ್ಥ್ಯವನ್ನು ತೋರಿಸುತ್ತದೆ ಎಂದು ಹೇಳಿದರು: ಯಾವುದೋ ಒಂದು ವಿಷಯ ಏಕೆ ವಿಫಲವಾಗುತ್ತಿದೆ, ಫಿಕ್ಸ್ ಅನ್ನು ಎಲ್ಲಿ ಅನ್ವಯಿಸಬೇಕು ಮತ್ತು ಕೋಡ್ಬೇಸ್ನಲ್ಲಿನ ಇನ್ನೇನು ಪರಿಣಾಮಗೊಳ್ಳುತ್ತದೆ ಎಂಬುದನ್ನು.

“ಗಂಭೀರ ಪರಿಕಲ್ಪನಾತ್ಮಕ ಸ್ಪಷ್ಟತೆಯನ್ನು ಹೊಂದಿರುವ ನಾನು ಬಳಸಿರುವ ಮೊದಲ ಕೋಡಿಂಗ್ ಮಾಡೆಲ್.”
ಡ್ಯಾನ್ ಶಿಪ್ಪರ್, Everyನ ಸ್ಥಾಪಕ ಮತ್ತು CEO, GPT‑5.5 ಅನ್ನು “ನಾನು ಬಳಸಿದ ಮೊದಲ ಕೋಡಿಂಗ್ ಮಾಡೆಲ್—ಇದಕ್ಕೆ ಗಂಭೀರವಾದ ಪರಿಕಲ್ಪನಾ ಸ್ಪಷ್ಟತೆ ಇದೆ” ಎಂದು ವರ್ಣಿಸಿದರು.
ಒಂದು ಆ್ಯಪ್ ಅನ್ನು ಪ್ರಾರಂಭಿಸಿದ ನಂತರ, ಅವರು ಪ್ರಾರಂಭದ ನಂತರದ ಸಮಸ್ಯೆಯನ್ನು ಡೀಬಗ್ ಮಾಡುವುದರಲ್ಲಿ ಹಲವು ದಿನಗಳನ್ನು ಕಳೆದರು. ನಂತರ, ವ್ಯವಸ್ಥೆಯ ಒಂದು ಭಾಗವನ್ನು ಮರುಬರೆಯಲು ತಮ್ಮ ಅತ್ಯುತ್ತಮ ಎಂಜಿನಿಯರ್ಗಳಲ್ಲಿ ಒಬ್ಬರನ್ನು ಕರೆತಂದರು. GPT‑5.5 ಅನ್ನು ಪರೀಕ್ಷಿಸಲು, ಅವರು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಕಾಲವನ್ನು ಹಿಂದಕ್ಕೆ ತಳ್ಳಿದರು: ಮಾಡೆಲ್ ದೋಷಗೊಂಡ ಸ್ಥಿತಿಯನ್ನು ನೋಡಿ ಎಂಜಿನಿಯರ್ ಅಂತಿಮವಾಗಿ ನಿರ್ಧರಿಸಿದ ಅದೇ ರೀತಿಯ ಮರುಬರಹವನ್ನು ರಚಿಸಬಹುದೇ? GPT‑5.4 ಗೆ ಸಾಧ್ಯವಾಗಲಿಲ್ಲ. GPT‑5.5 ಗೆ ಸಾಧ್ಯವಾಯಿತು.

"ನಾನು ನಿಜವಾಗಿಯೂ ಹೆಚ್ಚಿನ ಬುದ್ಧಿವಂತಿಕೆಯೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುತ್ತಿದ್ದೇನೆ ಎಂದು ಭಾಸವಾಗುತ್ತದೆ, ಮತ್ತು ಬಹುತೇಕ ಗೌರವದ ಭಾವನೆ ಇದೆ."
ಪಿಯೆಟ್ರೊ ಶಿರಾನೊ, MagicPathನ CEO, GPT‑5.5 ನೂರಾರು ಫ್ರಂಟ್ಎಂಡ್ ಮತ್ತು ರಿಫ್ಯಾಕ್ಟರ್ ಬದಲಾವಣೆಗಳಿದ್ದ ಒಂದು ಬ್ರಾಂಚ್ ಅನ್ನು ಸಾಕಷ್ಟು ಮಟ್ಟಿಗೆ ಬದಲಾಗಿದ್ದ ಮೇನ್ ಬ್ರಾಂಚ್ಗೆ ವಿಲೀನಗೊಳಿಸಿ, ಸುಮಾರು 20 ನಿಮಿಷಗಳಲ್ಲಿ ವನ್-ಶಾಟ್ ಆ ಕೆಲಸವನ್ನು ಪರಿಹರಿಸಿದಾಗ, ಇದೇ ರೀತಿಯ ಮಹತ್ವದ ಬದಲಾವಣೆಯನ್ನು ಕಂಡರು.
ಮಾಡೆಲ್ ಅನ್ನು ಪರೀಕ್ಷಿಸಿದ ಹಿರಿಯ ಇಂಜಿನಿಯರ್ಗಳು, GPT‑5.5 ರೀಜನಿಂಗ್ ಮತ್ತು ಸ್ವಾಯತ್ತತೆಯಲ್ಲಿ GPT‑5.4 ಮತ್ತು Claude Opus 4.7 ಗಿಂತ ಗಮನಾರ್ಹವಾಗಿ ಶಕ್ತಿಶಾಲಿಯಾಗಿತ್ತು ಎಂದು ಹೇಳಿದರು. ಇದು ಸಮಸ್ಯೆಗಳನ್ನು ಮುಂಚಿತವಾಗಿ ಗುರುತಿಸುವಲ್ಲಿ ಮತ್ತು ಸ್ಪಷ್ಟವಾದ ಪ್ರಾಂಪ್ಟಿಂಗ್ ಇಲ್ಲದೇ ಪರೀಕ್ಷೆ ಮತ್ತು ವಿಮರ್ಶೆಯ ಅಗತ್ಯಗಳನ್ನು ಊಹಿಸುವಲ್ಲಿ ಉತ್ತಮವಾಗಿತ್ತು. ಒಂದು ಸಂದರ್ಭದಲ್ಲಿ, ಒಬ್ಬ ಎಂಜಿನಿಯರ್ ಸಹಯೋಗಾತ್ಮಕ ಮಾರ್ಕ್ಡೌನ್ ಎಡಿಟರ್ನಲ್ಲಿನ ಕಾಮೆಂಟ್ ವ್ಯವಸ್ಥೆಯನ್ನು ಪುನರ್-ವಾಸ್ತುಶಿಲ್ಪಗೊಳಿಸಲು ಕೇಳಿದರು, ಮತ್ತು ಹಿಂತಿರುಗಿದಾಗ ಬಹುತೇಕ ಪೂರ್ಣಗೊಂಡಿದ್ದ 12-ಡಿಫ್ ಸ್ಟ್ಯಾಕ್ ಅವರನ್ನು ಎದುರಿಸಿತು. ಇತರರು ತಮಗೆ ಆಶ್ಚರ್ಯಕರವಾಗಿ ಬಹಳ ಕಡಿಮೆ ಅನುಷ್ಠಾನ ತಿದ್ದುಪಡಿ ಅಗತ್ಯವಿತ್ತು ಎಂದು ಹೇಳಿದರು ಮತ್ತು GPT‑5.4 ಗೆ ಹೋಲಿಸಿದರೆ GPT‑5.5 ರ ಯೋಜನೆಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚು ವಿಶ್ವಾಸ ಹೊಂದಿದ್ದರು.
ಮಾಡೆಲ್ಗೆ ಮುಂಚಿತ ಪ್ರವೇಶ ಹೊಂದಿದ್ದ NVIDIA ಯ ಒಬ್ಬ ಇಂಜಿನಿಯರ್ ಅವರ ಮಾತಿನಲ್ಲಿ, "GPT‑5.5 ಗೆ ಪ್ರವೇಶ ಕಳೆದುಕೊಳ್ಳುವುದು ನನ್ನ ಒಂದು ಅಂಗವನ್ನು ಕತ್ತರಿಸಿದಂತಿದೆ.”
“GPT-5.5, GPT-5.4 ಗಿಂತ ಗಮನಾರ್ಹವಾಗಿ ಹೆಚ್ಚು ಬುದ್ಧಿವಂತವಾಗಿದ್ದು, ಹೆಚ್ಚು ದೃಢತೆಯಿಂದ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ, ಹೆಚ್ಚು ಬಲವಾದ ಕೋಡಿಂಗ್ ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಹೆಚ್ಚು ವಿಶ್ವಾಸಾರ್ಹ ಸಾಧನ ಬಳಕೆಯೊಂದಿಗೆ. ಇದು ಮುಂಚಿತವಾಗಿ ನಿಲ್ಲದೆ ಗಮನಾರ್ಹವಾಗಿ ಹೆಚ್ಚು ಸಮಯ ಕಾರ್ಯದಲ್ಲಿ ತೊಡಗಿಸಿಕೊಂಡೇ ಇರುತ್ತದೆ. ಇದು ನಮ್ಮ ಬಳಕೆದಾರರು Cursor ಗೆ ಒಪ್ಪಿಸುವ ಸಂಕೀರ್ಣ, ದೀರ್ಘಕಾಲೀನ ಕೆಲಸಗಳಿಗೆ ಅತ್ಯಂತ ಮುಖ್ಯವಾಗಿದೆ."
GPT‑5.5 ಅನ್ನು ಕೋಡಿಂಗ್ನಲ್ಲಿ ಉತ್ತಮಗೊಳಿಸುವ ಅದೇ ಸಾಮರ್ಥ್ಯಗಳು ಕಂಪ್ಯೂಟರ್ನಲ್ಲಿ ದೈನಂದಿನ ಕೆಲಸಕ್ಕೂ ಅದನ್ನು ಶಕ್ತಿಯುತವಾಗಿಸುತ್ತದೆ. ಮಾದರಿಯು ಉದ್ದೇಶವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಲ್ಲಿ ಉತ್ತಮವಾಗಿರುವುದರಿಂದ, ಅದು ಜ್ಞಾನದ ಕೆಲಸದ ಸಂಪೂರ್ಣ ಲೂಪ್ ಮೂಲಕ ಹೆಚ್ಚು ಸ್ವಾಭಾವಿಕವಾಗಿ ಚಲಿಸಬಹುದು: ಮಾಹಿತಿಯನ್ನು ಕಂಡುಹಿಡಿಯುವುದು, ಮುಖ್ಯವಾದುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು, ಪರಿಕರಗಳನ್ನು ಬಳಸುವುದು, ಔಟ್ಪುಟ್ ಅನ್ನು ಪರಿಶೀಲಿಸುವುದು ಮತ್ತು ಕಚ್ಚಾ ವಸ್ತುಗಳನ್ನು ಉಪಯುಕ್ತವಾದ ವಸ್ತುವಾಗಿ ಪರಿವರ್ತಿಸುವುದು.
Codex ನಲ್ಲಿ, GPT‑5.5 ಡಾಕ್ಯುಮೆಂಟ್ಗಳು, ಸ್ಪ್ರೆಡ್ಶೀಟ್ಗಳು ಮತ್ತು ಸ್ಲೈಡ್ ಪ್ರಸ್ತುತಿಗಳನ್ನು ರಚಿಸುವಲ್ಲಿ GPT‑5.4 ಗಿಂತ ಉತ್ತಮವಾಗಿದೆ. ಆಲ್ಫಾ ಟೆಸ್ಟರ್ಗಳು ಕಾರ್ಯಾಚರಣಾ ಸಂಶೋಧನೆ, ಸ್ಪ್ರೆಡ್ಶೀಟ್ ಮಾಡೆಲಿಂಗ್ ಮತ್ತು ಅಸಂಘಟಿತ ವ್ಯವಹಾರ ಇನ್ಪುಟ್ಗಳನ್ನು ಯೋಜನೆಗಳಾಗಿ ಪರಿವರ್ತಿಸುವಂತಹ ಕೆಲಸಗಳಲ್ಲಿ ಇದು ಹಿಂದಿನ ಮಾಡೆಲ್ಗಳನ್ನು ಮೀರಿಸಿದೆ ಎಂದು ಹೇಳಿದರು. Codexನ ಕಂಪ್ಯೂಟರ್ ಬಳಕೆಯ ಕೌಶಲ್ಯಗಳೊಂದಿಗೆ ಸಂಯೋಜಿಸಿದಾಗ, GPT‑5.5 ಸ್ಕ್ರೀನ್ನಲ್ಲಿ ಏನಿದೆ ಎಂಬುದನ್ನು ನೋಡಿ, ಕ್ಲಿಕ್ ಮಾಡಿ, ಟೈಪ್ ಮಾಡಿ, ಇಂಟರ್ಫೇಸ್ಗಳಲ್ಲಿ ಸಂಚರಿಸಿ ಮತ್ತು ಟೂಲ್ಗಳ ನಡುವೆ ನಿಖರವಾಗಿ ಚಲಿಸುವ ಮೂಲಕ ಮಾಡೆಲ್ ನಿಜವಾಗಿಯೂ ನಿಮ್ಮೊಂದಿಗೆ ಕಂಪ್ಯೂಟರ್ ಅನ್ನು ಬಳಸಬಹುದು ಎಂಬ ಭಾವನೆಗೆ ನಮ್ಮನ್ನು ಇನ್ನಷ್ಟು ಹತ್ತಿರ ತರುತ್ತದೆ.
OpenAI ತಂಡಗಳು ಈಗಾಗಲೇ ಈ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ನೈಜ ವರ್ಕ್ಫ್ಲೋಗಳಲ್ಲಿ ಬಳಸುತ್ತಿವೆ. ಇಂದು, ಕಂಪನಿಯ 85% ಕ್ಕಿಂತ ಹೆಚ್ಚು ಮಂದಿ ಸಾಫ್ಟ್ವೇರ್ ಎಂಜಿನಿಯರಿಂಗ್, ಹಣಕಾಸು, ಸಂವಹನ, ಮಾರ್ಕೆಟಿಂಗ್, ಡೇಟಾ ಸೈನ್ಸ್ ಮತ್ತು ಉತ್ಪನ್ನ ನಿರ್ವಹಣೆ ಸೇರಿದಂತೆ ಪ್ರತಿ ವಾರ Codex ಅನ್ನು ಬಳಸುತ್ತಾರೆ. Comms ನಲ್ಲಿ, ತಂಡವು Codex ನಲ್ಲಿ GPT‑5.5 ಅನ್ನು ಬಳಸಿಕೊಂಡು ಆರು ತಿಂಗಳ ಸ್ಪೀಕಿಂಗ್ ವಿನಂತಿಗಳ ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸಿ, ಸ್ಕೋರಿಂಗ್ ಮತ್ತು ಅಪಾಯ ಚೌಕಟ್ಟನ್ನು ನಿರ್ಮಿಸಿ, ಹಾಗೂ ಸ್ವಯಂಚಾಲಿತ Slack ಏಜೆಂಟ್ ಅನ್ನು ಮಾನ್ಯಗೊಳಿಸಿತು. ಇದರಿಂದ ಕಡಿಮೆ ಅಪಾಯದ ವಿನಂತಿಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನಿರ್ವಹಿಸಬಹುದಾಗಿದೆ, ಆದರೆ ಹೆಚ್ಚಿನ ಅಪಾಯದ ವಿನಂತಿಗಳು ಇನ್ನೂ ಮಾನವ ಪರಿಶೀಲನೆಗೆ ಮಾರ್ಗಗೊಳ್ಳುತ್ತವೆ. ಹಣಕಾಸು ವಿಭಾಗದಲ್ಲಿ, ತಂಡವು ವೈಯಕ್ತಿಕ ಮಾಹಿತಿಯನ್ನು ಹೊರತುಪಡಿಸಿದ ವರ್ಕ್ಫ್ಲೋವನ್ನು ಬಳಸಿಕೊಂಡು ಒಟ್ಟು 71,637 ಪುಟಗಳ 24,771 K-1 ತೆರಿಗೆ ಫಾರ್ಮ್ಗಳನ್ನು ಪರಿಶೀಲಿಸಲು Codex ಅನ್ನು ಬಳಸಿತು. ಇದರಿಂದ ಹಿಂದಿನ ವರ್ಷದೊಂದಿಗೆ ಹೋಲಿಸಿದರೆ, ತಂಡವು ಈ ಕಾರ್ಯವನ್ನು ಎರಡು ವಾರಗಳಷ್ಟು ಬೇಗ ಪೂರ್ಣಗೊಳಿಸಲು ಸಹಾಯವಾಯಿತು. ಗೋ-ಟು-ಮಾರ್ಕೆಟ್ ತಂಡದಲ್ಲಿ, ಒಬ್ಬ ಉದ್ಯೋಗಿ ವಾರದ ವ್ಯವಹಾರ ವರದಿಗಳನ್ನು ರಚಿಸುವ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸಿ, ವಾರಕ್ಕೆ 5-10 ಗಂಟೆಗಳ ಉಳಿತಾಯವಾಗುವಂತೆ ಮಾಡಿದರು.
ChatGPT ನಲ್ಲಿ, GPT‑5.5 Thinking ಹೆಚ್ಚು ಕಠಿಣ ಸಮಸ್ಯೆಗಳಿಗೆ ವೇಗವಾದ ಸಹಾಯವನ್ನು ಒದಗಿಸುತ್ತದೆ, ಮತ್ತು ಹೆಚ್ಚು ಚತುರ ಹಾಗೂ ಸಂಕ್ಷಿಪ್ತ ಉತ್ತರಗಳೊಂದಿಗೆ ಸಂಕೀರ್ಣ ಕೆಲಸಗಳನ್ನು ನೀವು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಮುನ್ನಡೆಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಇದು ಕೋಡಿಂಗ್, ಸಂಶೋಧನೆ, ಮಾಹಿತಿ ಸಂಶ್ಲೇಷಣೆ ಮತ್ತು ವಿಶ್ಲೇಷಣೆ ಹಾಗೂ ಡಾಕ್ಯುಮೆಂಟ್-ಕೇಂದ್ರಿತ ಕಾರ್ಯಗಳಂತಹ ವೃತ್ತಿಪರ ಕೆಲಸಗಳಲ್ಲಿ ಶ್ರೇಷ್ಠವಾಗಿದೆ, ವಿಶೇಷವಾಗಿ ಪ್ಲಗಿನ್ಗಳನ್ನು ಬಳಸುವಾಗ.
GPT‑5.5 Pro ನಲ್ಲಿ, ಪ್ರಾರಂಭಿಕ ಪರೀಕ್ಷಕರು ChatGPT ಕೈಗೆತ್ತಿಕೊಳ್ಳಬಹುದಾದ ಕೆಲಸಗಳ ಸಂಕೀರ್ಣತೆ ಮತ್ತು ಗುಣಮಟ್ಟ ಎರಡರಲ್ಲೂ ಗಮನಾರ್ಹ ಏರಿಕೆಯನ್ನು ಕಾಣುತ್ತಿದ್ದಾರೆ. ಲೇಟೆನ್ಸಿಯಲ್ಲಿನ ಸುಧಾರಣೆಗಳು ಇದನ್ನು ಹೆಚ್ಚು ಬೇಡಿಕೆಯ ಕಾರ್ಯಗಳಿಗೆ ಇನ್ನಷ್ಟು ಪ್ರಾಯೋಗಿಕವಾಗಿಸುತ್ತವೆ. GPT‑5.4 Pro ಜೊತೆ ಹೋಲಿಸಿದರೆ, ಪರೀಕ್ಷಕರು GPT‑5.5 Pro ನ ಪ್ರತಿಕ್ರಿಯೆಗಳು ಗಮನಾರ್ಹವಾಗಿ ಹೆಚ್ಚು ಸಮಗ್ರ, ಉತ್ತಮವಾಗಿ ರಚನೆಯಾದ, ನಿಖರ, ಸಂಬಂಧಿತ ಮತ್ತು ಉಪಯುಕ್ತವಾಗಿವೆ ಎಂದು ಕಂಡುಹಿಡಿದರು. ವಿಶೇಷವಾಗಿ ವ್ಯವಹಾರ, ಕಾನೂನು, ಶಿಕ್ಷಣ ಮತ್ತು ಡೇಟಾ ಸೈನ್ಸ್ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಇದರ ಕಾರ್ಯಕ್ಷಮತೆ ಅತ್ಯಂತ ಉತ್ತಮವಾಗಿತ್ತು.
GPT‑5.5 ಈ ರೀತಿಯ ಕೆಲಸವನ್ನು ಪ್ರತಿಬಿಂಬಿಸುವ ಬಹು ಬೆಂಚ್ಮಾರ್ಕ್ಗಳಲ್ಲಿ ಅತ್ಯಾಧುನಿಕ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ತಲುಪುತ್ತದೆ. GDPval ನಲ್ಲಿ, 44 ವೃತ್ತಿಗಳನ್ನು ವ್ಯಾಪಿಸುವ ಉತ್ತಮವಾಗಿ ನಿರ್ದಿಷ್ಟಗೊಳಿಸಿದ ಜ್ಞಾನ ಕಾರ್ಯವನ್ನು ಉತ್ಪಾದಿಸುವ ಏಜೆಂಟ್ಗಳ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಪರೀಕ್ಷಿಸುವ ಮೌಲ್ಯಮಾಪನದಲ್ಲಿ, GPT‑5.5 84.9% ಅಂಕಗಳನ್ನು ಗಳಿಸಿದೆ. OSWorld-Verified ನಲ್ಲಿ, ಮಾಡೆಲ್ ತನ್ನದೇ ಆದ ರೀತಿಯಲ್ಲಿ ನೈಜ ಕಂಪ್ಯೂಟರ್ ಪರಿಸರಗಳಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸಬಹುದೇ ಎಂಬುದನ್ನು ಅಳೆಯುವಲ್ಲಿ, ಇದು 78.7% ತಲುಪುತ್ತದೆ. ಮತ್ತು ಸಂಕೀರ್ಣ ಗ್ರಾಹಕ-ಸೇವಾ ಕಾರ್ಯಪ್ರವಾಹಗಳನ್ನು ಪರೀಕ್ಷಿಸುವ Tau2-bench Telecom ನಲ್ಲಿ, ಇದು ಪ್ರಾಂಪ್ಟ್ ಟ್ಯೂನಿಂಗ್ ಇಲ್ಲದೆ 98.0% ತಲುಪುತ್ತದೆ. GPT‑5.5 ಇತರ ಜ್ಞಾನ ಕಾರ್ಯದ ಬೆಂಚ್ಮಾರ್ಕ್ಗಳಲ್ಲಿ ಬಲವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ: FinanceAgent ನಲ್ಲಿ 60.0%, ಆಂತರಿಕ ಹೂಡಿಕೆ-ಬ್ಯಾಂಕಿಂಗ್ ಮಾಡೆಲಿಂಗ್ ಕಾರ್ಯಗಳಲ್ಲಿ 88.5%, ಮತ್ತು OfficeQA Pro ನಲ್ಲಿ 54.1%.
Tau2-bench ಟೆಲಿಕಾಂ ಅನ್ನು ಪ್ರಾಂಪ್ಟ್ ಟ್ಯೂನಿಂಗ್ ಇಲ್ಲದೆ ನಡೆಸಲಾಯಿತು (ಮತ್ತು GPT‑4.1 ಅನ್ನು ಬಳಕೆದಾರ ಮಾಡೆಲ್ ಆಗಿ ಬಳಸಲಾಗಿದೆ). GPT‑5.5 ಕಾರ್ಯದ ಉದ್ದೇಶವನ್ನು ಉತ್ತಮವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುತ್ತದೆ ಮತ್ತು ಅದರ ಹಿಂದಿನ ಮಾದರಿಗಳಿಗಿಂತ ಹೆಚ್ಚು ಟೋಕನ್-ಕಾರ್ಯಕ್ಷಮವಾಗಿದೆ.
“GPT-5.5 ಕಾರ್ಯಗತಗೊಳಿಸುವಿಕೆ-ಭಾರೀ ಕೆಲಸಕ್ಕೆ ಅಗತ್ಯವಾದ ನಿರಂತರ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ನೀಡುತ್ತದೆ. NVIDIA GB200 NVL72 ಸಿಸ್ಟಮ್ಗಳಲ್ಲಿ ನಿರ್ಮಿಸಿ ಮತ್ತು ಸೇವೆ ನೀಡಲಾದ ಈ ಮಾಡೆಲ್, ನಮ್ಮ ತಂಡಗಳಿಗೆ ನೈಸರ್ಗಿಕ ಭಾಷೆಯ ಪ್ರಾಂಪ್ಟ್ಗಳಿಂದ ಅಂತ್ಯ-ತುದಿ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಒದಗಿಸಲು, ಡೀಬಗ್ ಸಮಯವನ್ನು ದಿನಗಳಿಂದ ಗಂಟೆಗಳ ಮಟ್ಟಿಗೆ ಕಡಿತಗೊಳಿಸಲು, ಮತ್ತು ಸಂಕೀರ್ಣ ಕೋಡ್ಬೇಸ್ಗಳಲ್ಲಿ ವಾರಗಳ ಪ್ರಯೋಗವನ್ನು ರಾತ್ರೋರಾತ್ರಿ ಪ್ರಗತಿಯಾಗಿ ಪರಿವರ್ತಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ಇದು ವೇಗವಾದ ಕೋಡಿಂಗ್ಗಿಂತ ಹೆಚ್ಚಿನದು—ಇದು ಜನರಿಗೆ ಮೂಲಭೂತವಾಗಿ ವಿಭಿನ್ನ ವೇಗದಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸಲು ಸಹಾಯ ಮಾಡುವ ಕೆಲಸ ಮಾಡುವ ಹೊಸ ವಿಧಾನ.”
GPT‑5.5 ವೈಜ್ಞಾನಿಕ ಮತ್ತು ತಾಂತ್ರಿಕ ಸಂಶೋಧನಾ ಕಾರ್ಯಪ್ರವಾಹಗಳಲ್ಲಿ ಸುಧಾರಣೆಯನ್ನು ತೋರಿಸುತ್ತದೆ, ಏಕೆಂದರೆ ಇವು ಕಠಿಣ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸುವುದಕ್ಕಿಂತ ಹೆಚ್ಚಿನ ಸಾಮರ್ಥ್ಯವನ್ನು ಅಗತ್ಯಪಡಿಸುತ್ತವೆ. ಸಂಶೋಧಕರು ಒಂದು ಆಲೋಚನೆಯನ್ನು ಅನ್ವೇಷಿಸಬೇಕು, ಸಾಕ್ಷ್ಯಗಳನ್ನು ಸಂಗ್ರಹಿಸಬೇಕು, ಊಹೆಗಳನ್ನು ಪರೀಕ್ಷಿಸಬೇಕು, ಫಲಿತಾಂಶಗಳನ್ನು ಅರ್ಥೈಸಬೇಕು ಮತ್ತು ಮುಂದಿನ ಪ್ರಯತ್ನವನ್ನು ನಿರ್ಧರಿಸಬೇಕು. GPT‑5.5 ಆ ಚಕ್ರದಲ್ಲಿ ನಿರಂತರವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವಲ್ಲಿ ಇತರ ಮಾಡೆಲ್ಗಳಿಗಿಂತ ಉತ್ತಮವಾಗಿದೆ.
ಗಮನಾರ್ಹವಾಗಿ, GPT‑5.5 GeneBench(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ನಲ್ಲಿ GPT‑5.4 ಹೋಲಿಸಿದರೆ ಸ್ಪಷ್ಟವಾದ ಸುಧಾರಣೆಯನ್ನು ತೋರಿಸುತ್ತದೆ. ಇದು ಜನಿತಶಾಸ್ತ್ರ ಮತ್ತು ಪರಿಮಾಣಾತ್ಮಕ ಜೀವಶಾಸ್ತ್ರದಲ್ಲಿನ ಬಹು-ಹಂತದ ವೈಜ್ಞಾನಿಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುವ ಹೊಸ ಮೌಲ್ಯಮಾಪನವಾಗಿದೆ. ಈ ಸಮಸ್ಯೆಗಳು ಮಾಡೆಲ್ಗಳು ಕನಿಷ್ಠ ಮೇಲ್ವಿಚಾರಣಾತ್ಮಕ ಮಾರ್ಗದರ್ಶನದೊಂದಿಗೆ ಅಸ್ಪಷ್ಟ ಅಥವಾ ದೋಷಪೂರಿತ ಡೇಟಾ ಬಗ್ಗೆ ತಾರ್ಕಿಕವಾಗಿ ಯೋಚಿಸಲು, ಅಡಗಿರುವ ಗೊಂದಲಕಾರಿ ಅಂಶಗಳು ಅಥವಾ QC ವೈಫಲ್ಯಗಳಂತಹ ಅಡೆತಡೆಗಳನ್ನು ಎದುರಿಸಲು, ಮತ್ತು ಆಧುನಿಕ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಧಾನಗಳನ್ನು ಸರಿಯಾಗಿ ಅನುಷ್ಠಾನಗೊಳಿಸಿ ಅರ್ಥೈಸಲು ಅಗತ್ಯವಿರುತ್ತದೆ. ಇಲ್ಲಿನ ಕಾರ್ಯಗಳು ಬಹು-ದಿನಗಳ ಯೋಜನೆಗಳಿಗೆ ವೈಜ್ಞಾನಿಕ ತಜ್ಞರಿಗೆ ಆಗಾಗ ಸಮನಾಗಿರುತ್ತವೆ ಎಂಬುದನ್ನು ಪರಿಗಣಿಸಿದರೆ, ಮಾಡೆಲ್ನ ಕಾರ್ಯಕ್ಷಮತೆ ಗಮನಾರ್ಹವಾಗಿದೆ.
ಅದೇ ರೀತಿಯಲ್ಲಿ, BixBench(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ನಲ್ಲಿ, ನೈಜ-ಜಗತ್ತಿನ ಜೈವಮಾಹಿತಿ ವಿಜ್ಞಾನ ಮತ್ತು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯನ್ನು ಆಧರಿಸಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಬೆಂಚ್ಮಾರ್ಕ್ ಆದ, GPT‑5.5 ಪ್ರಕಟಿತ ಅಂಕಗಳನ್ನು ಹೊಂದಿರುವ ಮಾಡೆಲ್ಗಳ ನಡುವೆ ಮುಂಚೂಣಿ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಸಾಧಿಸಿತು. ಮಾಡೆಲ್ನ ವೈಜ್ಞಾನಿಕ ಸಾಮರ್ಥ್ಯಗಳು ಈಗ ನಿಜವಾದ ಸಹ-ವಿಜ್ಞಾನಿಯಾಗಿ ಜೈವವೈದ್ಯಕೀಯ ಸಂಶೋಧನೆಯ ಅತ್ಯಾಧುನಿಕ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಪ್ರಗತಿಯನ್ನು ಅರ್ಥಪೂರ್ಣವಾಗಿ ವೇಗಗೊಳಿಸುವಷ್ಟು ಬಲವಾಗಿವೆ.
ಮತ್ತೊಂದು ಉದಾಹರಣೆಯಲ್ಲಿ, ಕಸ್ಟಮ್ ಹಾರ್ನೆಸ್ ಹೊಂದಿದ GPT‑5.5 ರ ಆಂತರಿಕ ಆವೃತ್ತಿಯೊಂದು ಕಾಂಬಿನೇಟೋರಿಕ್ಸ್ನಲ್ಲಿನ ಕೇಂದ್ರ ಪರಿಕಲ್ಪನೆಗಳಲ್ಲಿ ಒಂದಾದ ರಾಮ್ಸೆ ಸಂಖ್ಯೆಗಳ ಬಗ್ಗೆ ಹೊಸ ಪುರಾವೆಯನ್ನು(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಕಂಡುಹಿಡಿಯಲು ಸಹಾಯ ಮಾಡಿತು. ಸಂಯೋಜಿತಶಾಸ್ತ್ರವು ವಿಚ್ಛಿನ್ನ ವಸ್ತುಗಳು ಹೇಗೆ ಪರಸ್ಪರ ಹೊಂದಿಕೆಯಾಗುತ್ತವೆ ಎಂಬುದನ್ನು ಅಧ್ಯಯನ ಮಾಡುತ್ತದೆ: ಗ್ರಾಫ್ಗಳು, ಜಾಲಗಳು, ಸಮೂಹಗಳು ಮತ್ತು ಮಾದರಿಗಳು. ರಾಮ್ಸೆ ಸಂಖ್ಯೆಗಳು, ಸರಿಸುಮಾರು ಹೇಳುವುದಾದರೆ, ಯಾವುದೋ ರೀತಿಯ ಕ್ರಮವು ಖಚಿತವಾಗಿ ಕಾಣಿಸಿಕೊಳ್ಳುವ ಮೊದಲು ಒಂದು ಜಾಲವು ಎಷ್ಟು ದೊಡ್ಡದಾಗಿರಬೇಕು ಎಂದು ಕೇಳುತ್ತವೆ. ಈ ಕ್ಷೇತ್ರದಲ್ಲಿ ಫಲಿತಾಂಶಗಳು ಅಪರೂಪವಾಗಿವೆ ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ ತಾಂತ್ರಿಕವಾಗಿ ಕಷ್ಟಕರವಾಗಿರುತ್ತವೆ. ಇಲ್ಲಿ, GPT‑5.5 ಆಫ್-ಡಯಾಗನಲ್ ರಾಮ್ಸೇ ಸಂಖ್ಯೆಗಳ ಬಗ್ಗೆ ದೀರ್ಘಕಾಲದಿಂದ ತಿಳಿದಿದ್ದ ಒಂದು ಅಸಿಂಪ್ಟೋಟಿಕ್ ಸತ್ಯದ ಸಾಬೀತನ್ನು ಕಂಡುಹಿಡಿದಿತು, ನಂತರ ಅದನ್ನು Lean ನಲ್ಲಿ ಪರಿಶೀಲಿಸಲಾಯಿತು. ಈ ಫಲಿತಾಂಶವು GPT‑5.5 ಕೇವಲ ಕೋಡ್ ಅಥವಾ ವಿವರಣೆಯಷ್ಟೇ ಅಲ್ಲ, ಮೂಲ ಸಂಶೋಧನಾ ಕ್ಷೇತ್ರದಲ್ಲಿ ಆಶ್ಚರ್ಯಕರ ಮತ್ತು ಉಪಯುಕ್ತ ಗಣಿತೀಯ ವಾದಕ್ಕೂ ಕೊಡುಗೆ ನೀಡಿದ ಸ್ಪಷ್ಟ ಉದಾಹರಣೆಯಾಗಿದೆ.
ಆರಂಭಿಕ ಪರೀಕ್ಷಕರು ChatGPT ಯಲ್ಲಿ GPT‑5.5 Pro ಅನ್ನು ಒಂದು-ಶಾಟ್ ಉತ್ತರ ಎಂಜಿನ್ನಂತೆ ಬಳಸುತ್ತಿರಲಿಲ್ಲ ಮತ್ತು ಸಂಶೋಧನಾ ಪಾಲುದಾರನಂತೆ ಬಳಸುತ್ತಿದ್ದರು: ಬಹು ಪಾಸ್ಗಳ ಮೇಲೆ ಹಸ್ತಪ್ರತಿಗಳನ್ನು ಟೀಕಿಸುವುದು, ಒತ್ತಡ-ಪರೀಕ್ಷೆಯ ತಾಂತ್ರಿಕ ವಾದಗಳು, ವಿಶ್ಲೇಷಣೆಗಳನ್ನು ಪ್ರಸ್ತಾಪಿಸುವುದು ಮತ್ತು ಕೋಡ್, ಟಿಪ್ಪಣಿಗಳು ಮತ್ತು PDF ಸಂದರ್ಭದೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವುದು. ಸಾಮಾನ್ಯವಾದ ಅಂಶವೆಂದರೆ GPT‑5.5 ಸಂಶೋಧಕರಿಗೆ ಪ್ರಶ್ನೆಯಿಂದ ಪ್ರಯೋಗಕ್ಕೆ ಔಟ್ಪುಟ್ಗೆ ಚಲಿಸಲು ಸಹಾಯ ಮಾಡುವಲ್ಲಿ ಉತ್ತಮವಾಗಿದೆ.
ಡೆರಿಯಾ ಉನುಟ್ಮಾಜ್, ಜಾಕ್ಸನ್ ಲ್ಯಾಬೊರೇಟರಿ ಫಾರ್ ಜೀನೋಮಿಕ್ ಮೆಡಿಸಿನ್ನ ಇಮ್ಯುನಾಲಜಿ ಪ್ರಾಧ್ಯಾಪಕ ಮತ್ತು ಸಂಶೋಧಕರಾದ ಅವರು, 62 ಮಾದರಿಗಳು ಮತ್ತು ಸುಮಾರು 28,000 ಜೀನ್ಗಳನ್ನು ಒಳಗೊಂಡ ಜೀನ್-ಅಭಿವ್ಯಕ್ತಿ ಡೇಟಾಸೆಟ್ ಅನ್ನು ವಿಶ್ಲೇಷಿಸಲು GPT‑5.5 Pro ಅನ್ನು ಬಳಸಿದರು. ಇದರಿಂದ ಕಂಡುಹಿಡಿಕೆಗಳನ್ನು ಸಂಕ್ಷೇಪಿಸುವುದಷ್ಟೇ ಅಲ್ಲದೆ, ಪ್ರಮುಖ ಪ್ರಶ್ನೆಗಳು ಮತ್ತು ಒಳನೋಟಗಳನ್ನು ಹೊರತಂದ ವಿವರವಾದ ಸಂಶೋಧನಾ ವರದಿ ಸಿದ್ಧವಾಯಿತು—ಈ ಕೆಲಸಕ್ಕೆ ಅವರ ತಂಡಕ್ಕೆ ಹಲವಾರು ತಿಂಗಳುಗಳು ಬೇಕಾಗುತ್ತಿತ್ತೆಂದು ಅವರು ಹೇಳಿದರು.
ಬಾರ್ಟೋಸ್ ನಸ್ಕ್ರಿಕಿ, ಪೋಲ್ಯಾಂಡ್ನ ಪೊಝ್ನಾನ್ನ ಆಡಮ್ ಮಿಕಿವಿಚ್ ವಿಶ್ವವಿದ್ಯಾಲಯದ ಗಣಿತಶಾಸ್ತ್ರದ ಸಹಾಯಕ ಪ್ರಾಧ್ಯಾಪಕರು, 11 ನಿಮಿಷಗಳಲ್ಲಿ ಒಂದೇ ಪ್ರಾಂಪ್ಟ್ನಿಂದ ಬೀಜಗಣಿತೀಯ ಜ್ಯಾಮಿತಿ ಆ್ಯಪ್ ಅನ್ನು ನಿರ್ಮಿಸಲು Codex ನಲ್ಲಿ GPT‑5.5 ಅನ್ನು ಬಳಸಿದರು. ಇದರಲ್ಲಿ ದ್ವಿಘಾತ ಮೇಲ್ಮೈಗಳ ಛೇದನವನ್ನು ದೃಶ್ಯೀಕರಿಸಿ, ಅದರ ಫಲವಾಗಿ ದೊರಕಿದ ವಕ್ರವನ್ನು ವೈಯರ್ಸ್ಟ್ರಾಸ್ ಮಾಡೆಲ್ಗೆ ಪರಿವರ್ತಿಸಲಾಯಿತು.
ನಂತರ ಅವರು ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಹೆಚ್ಚು ಸ್ಥಿರವಾದ ಸಿಂಗ್ಯುಲಾರಿಟಿ ದೃಶ್ಯೀಕರಣ ಮತ್ತು ಮುಂದಿನ ಕೆಲಸದಲ್ಲಿ ಮರುಬಳಕೆ ಮಾಡಬಹುದಾದ ನಿಖರ ಗುಣಾಂಕಗಳೊಂದಿಗೆ ವಿಸ್ತರಿಸಿದರು. ಅವರ ದೃಷ್ಟಿಯಲ್ಲಿ, ದೊಡ್ಡ ಬದಲಾವಣೆ ಎಂದರೆ, ಈ ಹಿಂದೆ ವಿಶೇಷ ಸಾಧನಗಳ ಅಗತ್ಯವಿದ್ದ ಕಸ್ಟಮ್ ಗಣಿತೀಯ ದೃಶ್ಯೀಕರಣ ಮತ್ತು ಕಂಪ್ಯೂಟರ್ ಬೀಜಗಣಿತ ವರ್ಕ್ಫ್ಲೋಗಳನ್ನು ಅನುಷ್ಠಾನಗೊಳಿಸಲು Codex ಈಗ ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಒಟ್ಟಾಗಿ, ಈ ಉದಾಹರಣೆಗಳು GPT‑5.5 ತಜ್ಞರ ಉದ್ದೇಶವನ್ನು ಕಾರ್ಯನಿರ್ವಹಿಸುವ ಸಂಶೋಧನಾ ಸಾಧನಗಳು ಮತ್ತು ವಿಶ್ಲೇಷಣೆಗಳಾಗಿ ಪರಿವರ್ತಿಸುವುದನ್ನು ತೋರಿಸುತ್ತವೆ.

ಕ್ರೆಡಿಟ್: ಬಾರ್ಟೋಸ್ ನಸ್ಕ್ರಿಕಿ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ)
ಪ್ರಾಂಪ್ಟ್: # ಬೀಜಗಣಿತೀಯ ಜ್ಯಾಮಿತಿ ಮೇಲ್ಮೈ ಛೇದನ
ಎರಡು ದ್ವಿಘಾತ ಮೇಲ್ಮೈಗಳನ್ನು ಚಿತ್ರಿಸಿ ಮತ್ತು ಅವುಗಳ ಛೇದನ ವಕ್ರವನ್ನು ಕೆಂಪು ಬಣ್ಣದಲ್ಲಿ ಬಣ್ಣಿಸುವ ಅಪ್ಲಿಕೇಶನ್ ರಚಿಸಿ. ಇದನ್ನು ವೈಯರ್ಸ್ಟ್ರಾಸ್ ವಕ್ರವಾಗಿ ಪರಿವರ್ತಿಸಲು ಗಣನಾತ್ಮಕ ರೀಮನ್-ರೋಕ್ ತೀಯೋರೆಮ್ ಅನ್ನು ಬಳಸಿ.
## ಮುಖ್ಯ ಕಿಟಕಿ
ಸ್ವಲ್ಪ ಪಾರದರ್ಶಕ ಛಾಯಾಂಕನ ಹೊಂದಿರುವ ಎರಡು ಬಣ್ಣದ ಛಾಯೆಯ ಮೇಲ್ಮೈಗಳು, ಉನ್ನತ ಗುಣಮಟ್ಟದ ರೆಂಡರಿಂಗ್ನಲ್ಲಿ ಕೆಂಪು ಬಣ್ಣದ ಬೀಜಗಣಿತೀಯ ವಕ್ರರೇಖೆಯುದ್ದಕ್ಕೂ ಛೇದಿಸುತ್ತವೆ
ಎರಡೂ ದಿಕ್ಕುಗಳಲ್ಲಿ ಮೌಸ್ ತಿರುಗಿಸುವಿಕೆ, ಜೂಮ್ ಮಾಡಲು ಸಂಪೂರ್ಣ ಪಿಂಚ್ ವಿಧಾನ, ಪ್ರತಿಯೊಂದು ಮೇಲ್ಮೈಯ ಗುಣಾಂಕಗಳನ್ನು ಬದಲಾಯಿಸಲು ಸ್ಲೈಡರ್ಗಳಿರುವ ಸಣ್ಣ ಮೆನು ತೋರಿಸಲು ಹ್ಯಾಪ್ಟಿಕ್ ಪ್ರೆಸ್ (ಸ್ಪರ್ಶದ ಪ್ರತಿಕ್ರಿಯೆ); Z-ಬಫರ್ ಮಟ್ಟದ ಮೂಲಕ ಪತ್ತೆಹಚ್ಚುವಿಕೆ
ಬಲಭಾಗದ ಕಿಟಕಿ
ಪರಿಣಾಮಕಾರಿ ರೀಮನ್–ರೋಚ್ ಪ್ರಮೇಯದ ಸೂತ್ರಗಳ ಮೂಲಕ (Q ಅಥವಾ ದ್ವಿಘಾತ ಕ್ಷೇತ್ರ ವಿಸ್ತರಣೆಯ) ಮೇಲೆ ಸಂಕ್ಷಿಪ್ತ ವೈಯರ್ಸ್ಟ್ರಾಸ್ ಸಮೀಕರಣವನ್ನು Go ಮೂಲಕ ಗಣನೆ ಮಾಡಲಾಗಿದೆ
## ಎಲ್ಲಾ ನಿಯಂತ್ರಣಗಳನ್ನು ಮರೆಮಾಡಲಾಗಿರುವ ಮತ್ತು ಬಳಕೆದಾರರು ಆಕಾರಗಳ ಸೌಂದರ್ಯವನ್ನು ಆಸ್ವಾದಿಸಬಹುದಾದ ಆಂಬಿಯೆಂಟ್ ಮೋಡ್
## ವೈಶಿಷ್ಟ್ಯಗಳು
ಆ್ಯಪ್ ಬ್ರೌಸರ್ನಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ—ಇದು ಹಗುರವಾದ ಇಂಪ್ಲಿಮೆಂಟೇಶನ್; ಇತ್ತೀಚಿನ ಫುಲ್-ಸ್ಟ್ಯಾಕ್ ಲೈಬ್ರರಿಗಳೊಂದಿಗೆ, ಪೋರ್ಟಬಲ್ ಮತ್ತು ಸುಲಭವಾಗಿ ಡಿಪ್ಲಾಯ್ ಮಾಡಬಹುದಾದದು
## ಡಾಕ್ಯುಮೆಂಟ್ಗಳು
Git ರೆಪೊ, ಜರ್ನಲ್, ಯೋಜನೆ (ಗುರುತಿಸಿದ ಫೈಲ್ಗಳು)
“ನಮ್ಮ ಹಾರ್ನೆಸ್ನಲ್ಲಿ OpenAI ಯ ಹೊಸ GPT-5.5 ಮಾಡೆಲ್ ಅನ್ನು ಬಳಸುವುದು, ಅದು ಬೃಹತ್ ಜೈವರಾಸಾಯನಿಕ ಡೇಟಾಸೆಟ್ಗಳ ಮೇಲೆ ತರ್ಕಿಸಿ ಮಾನವರ ಔಷಧ ಫಲಿತಾಂಶಗಳನ್ನು ಊಹಿಸುತ್ತದೆ ಮತ್ತು ನಂತರ ನಮ್ಮ ಅತ್ಯಂತ ಕಠಿಣ ಔಷಧ ಅನ್ವೇಷಣಾ ಮೌಲ್ಯಮಾಪನಗಳಲ್ಲಿ ಗಮನಾರ್ಹ ನಿಖರತೆಯನ್ನು ತರುತ್ತದೆ ಎಂಬುದು ಅತ್ಯಂತ ಉತ್ಸಾಹಭರಿತವಾಗಿದೆ. OpenAI ಈ ರೀತಿಯ ವೇಗವನ್ನು ಮುಂದುವರಿಸಿದರೆ, ವರ್ಷಾಂತ್ಯದೊಳಗೆ ಔಷಧ ಅನ್ವೇಷಣೆಯ ಅಡಿಪಾಯವೇ ಬದಲಾಗುತ್ತದೆ."
GPT‑5.4 ಲೇಟೆನ್ಸಿಯಲ್ಲಿ GPT‑5.5 ಅನ್ನು ಪೂರೈಸಲು ಪ್ರತ್ಯೇಕವಾದ ಆಪ್ಟಿಮೈಸೇಶನ್ಗಳ ಗುಂಪಾಗಿ ಅಲ್ಲ, ಬದಲಾಗಿ ಸಂಯೋಜಿತ ವ್ಯವಸ್ಥೆಯಾಗಿ ಅನುಮಾನವನ್ನು ಪುನರ್ವಿಮರ್ಶಿಸುವ ಅಗತ್ಯವಿದೆ. GPT‑5.5 ಅನ್ನು NVIDIA GB200 ಮತ್ತು GB300 NVL72 ಸಿಸ್ಟಮ್ಗಳಲ್ಲಿ ಸಹ-ವಿನ್ಯಾಸಗೊಳಿಸಲಾಯಿತು, ತರಬೇತಿ ನೀಡಲಾಯಿತು ಮತ್ತು ಸೇವೆ ನೀಡಲಾಯಿತು. Codex ಮತ್ತು GPT‑5.5 ನಮ್ಮ ಕಾರ್ಯಕ್ಷಮತೆಯ ಗುರಿಗಳನ್ನು ಸಾಧಿಸಲು ಪ್ರಮುಖ ಪಾತ್ರ ವಹಿಸಿದವು. Codex ತಂಡವು ಕಲ್ಪನೆಯಿಂದ ಮಾನದಂಡಗತ ಕಾರ್ಯಗತಗೊಳಿಸುವಿಕೆಗೆ ವೇಗವಾಗಿ ಸಾಗಲು ಸಹಾಯ ಮಾಡಿತು, ವಿಧಾನಗಳ ರೂಪರೇಖೆಗಳನ್ನು ಸಿದ್ಧಪಡಿಸಿ, ಪ್ರಯೋಗಗಳನ್ನು ಜೋಡಿಸಿ, ಮತ್ತು ಯಾವ ಆಪ್ಟಿಮೈಜೇಶನ್ಗಳಲ್ಲಿ ಹೆಚ್ಚಿನ ಹೂಡಿಕೆ ಮಾಡುವುದು ಸೂಕ್ತ ಎಂಬುದನ್ನು ಗುರುತಿಸಲು ಸಹಾಯ ಮಾಡಿತು. GPT‑5.5 ಸ್ಟ್ಯಾಕ್ನಲ್ಲಿಯೇ ಪ್ರಮುಖ ಸುಧಾರಣೆಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಮತ್ತು ಕಾರ್ಯಗತಗೊಳಿಸಲು ಸಹಾಯ ಮಾಡಿತು. ಸರಳವಾಗಿ ಹೇಳುವುದಾದರೆ, ಮಾಡೆಲ್ ತನ್ನ ಸೇವೆಗೆ ಅಗತ್ಯವಿರುವ ಮೂಲಸೌಕರ್ಯವನ್ನು ಸುಧಾರಿಸಲು ಸಹಾಯ ಮಾಡಿತು.
ಅಂತಹ ಒಂದು ಸುಧಾರಣೆ ಲೋಡ್ ಬ್ಯಾಲೆನ್ಸಿಂಗ್ ಮತ್ತು ವಿಭಜನೆ ಹ್ಯೂರಿಸ್ಟಿಕ್ಗಳಲ್ಲಿ ಕಂಡುಬಂತು. GPT‑5.5 ಕ್ಕಿಂತ ಮೊದಲು, ಕಂಪ್ಯೂಟಿಂಗ್ ಕೋರ್ಗಳಾದ್ಯಂತ ಕೆಲಸವನ್ನು ಸಮತೋಲನಗೊಳಿಸಲು, ನಾವು ಆಕ್ಸಿಲರೇಟರ್ನಲ್ಲಿನ ವಿನಂತಿಗಳನ್ನು ನಿಗದಿತ ಸಂಖ್ಯೆಯ ಭಾಗಗಳಾಗಿ ವಿಭಜಿಸಿದ್ದೆವು. ಇದರಿಂದ ದೊಡ್ಡ ಮತ್ತು ಸಣ್ಣ ವಿನಂತಿಗಳು ಒಂದೇ GPU ನಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸಬಹುದಾಗಿತ್ತು. ಆದಾಗ್ಯೂ, ಪೂರ್ವನಿರ್ಧರಿತ ಸಂಖ್ಯೆಯ ಸ್ಥಿರ ಭಾಗಗಳು ಎಲ್ಲಾ ಟ್ರಾಫಿಕ್ ಮಾದರಿಗಳಿಗೆ ಸೂಕ್ತವಾಗಿರುವುದಿಲ್ಲ. GPUಗಳನ್ನು ಉತ್ತಮವಾಗಿ ಬಳಸಲು, Codex ಹಲವಾರು ವಾರಗಳ ಉತ್ಪಾದನಾ ಟ್ರಾಫಿಕ್ ಮಾದರಿಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಿ, ಕೆಲಸವನ್ನು ಸಮತೋಲನಗೊಳಿಸಲು ಮತ್ತು ವಿಭಜಿಸಲು ಕಸ್ಟಮ್ ಹ್ಯೂರಿಸ್ಟಿಕ್ ಅಲ್ಗೋರಿದಮ್ಗಳನ್ನು ರಚಿಸಿತು. ಆ ಪ್ರಯತ್ನವು ಅಪಾರ ಪರಿಣಾಮ ಬೀರಿತು, ಟೋಕನ್ ರಚನೆಯ ವೇಗವನ್ನು 20% ಕ್ಕಿಂತ ಹೆಚ್ಚು ಹೆಚ್ಚಿಸಿತು.
ಭದ್ರತಾ ದುರ್ಬಲತೆಗಳನ್ನು ಕಂಡುಹಿಡಿದು ಅವುಗಳಿಗೆ ಪರಿಹಾರ ಒದಗಿಸುವಲ್ಲಿ ಅತ್ಯಂತ ಪರಿಣತಿ ಹೊಂದಿರುವ ಮಾಡೆಲ್ಗಳಿಗೆ ಜಗತ್ತನ್ನು ಸಿದ್ಧಗೊಳಿಸುವುದು ತಂಡದ ಕೆಲಸವಾಗಿದೆ ಮತ್ತು ಸೈಬರ್ ರಕ್ಷಣೆಯ ಮುಂದಿನ ಯುಗಕ್ಕಾಗಿ ಪ್ರಜಾತಂತ್ರೀಕೃತ ಮಾಡೆಲ್ ಪ್ರವೇಶ ಮತ್ತು ಹಂತ ಹಂತವಾಗಿ ಅನ್ವಯಿಸುವಿಕೆಯೊಂದಿಗೆ ಸ್ಥಿತಿಸ್ಥಾಪಕತೆಯನ್ನು ನಿರ್ಮಿಸಲು ಸಂಪೂರ್ಣ ಪರಿಸರ ವ್ಯವಸ್ಥೆಯು ಕಠಿಣವಾಗಿ ಕೆಲಸ ಮಾಡಬೇಕಾಗುತ್ತದೆ.
ಅತ್ಯಾಧುನಿಕ ಮಾಡೆಲ್ಗಳು ಸೈಬರ್ಸುರಕ್ಷತೆಯಲ್ಲಿ ಹೆಚ್ಚು ಹೆಚ್ಚು ಸಾಮರ್ಥ್ಯ ಹೊಂದುತ್ತಿವೆ. ಆ ಸಾಮರ್ಥ್ಯಗಳು ವ್ಯಾಪಕವಾಗಿ ಹರಡಲಿವೆ ಮತ್ತು ಸೈಬರ್ ರಕ್ಷಣೆಯನ್ನು ವೇಗಗೊಳಿಸಲು ಹಾಗೂ ಪರಿಸರವ್ಯವಸ್ಥೆಯನ್ನು ಬಲಪಡಿಸಲು ಅವುಗಳನ್ನು ಬಳಸಬಹುದೆಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳುವುದೇ ಮುಂದಿನ ಅತ್ಯುತ್ತಮ ಮಾರ್ಗವೆಂದು ನಾವು ನಂಬುತ್ತೇವೆ.
GPT‑5.5 ಎಂಬುದು ಸೈಬರ್ಸುರಕ್ಷತೆಯಂತಹ ವಿಶ್ವದ ಅತ್ಯಂತ ಕಠಿಣ ಸವಾಲುಗಳನ್ನು ಪರಿಹರಿಸಲು ಸಹಾಯ ಮಾಡುವ AI ಕಡೆಗೆ ಕ್ರಮೇಣವಾದರೂ ಮಹತ್ವದ ಹೆಜ್ಜೆಯಾಗಿದೆ. ಡಿಸೆಂಬರ್ನಲ್ಲಿ GPT‑5.2 ಜೊತೆಗೆ, ನಮ್ಮ ಮಾಡೆಲ್ಗಳೊಂದಿಗೆ ಸಂಭವನೀಯ ಸೈಬರ್ ದುರುಪಯೋಗವನ್ನು ಮಿತಿಗೊಳಿಸಲು ಅಗತ್ಯವಾದ ಸೈಬರ್ ರಕ್ಷಣೆಗಳನ್ನು ನಾವು ಪೂರ್ವಸಕ್ರಿಯವಾಗಿ ನಿಯೋಜಿಸಿದ್ದೇವೆ; ಈಗ GPT‑5.5 ಜೊತೆಗೆ, ಸಂಭವನೀಯ ಸೈಬರ್ ಅಪಾಯಕ್ಕಾಗಿ ನಾವು ಇನ್ನಷ್ಟು ಕಠಿಣವಾದ ವರ್ಗೀಕರಕಗಳನ್ನು ನಿಯೋಜಿಸುತ್ತಿದ್ದೇವೆ, ಅವನ್ನು ಕಾಲಕ್ರಮೇಣ ಹೊಂದಿಸುತ್ತಿರುವಂತೆ ಕೆಲವು ಬಳಕೆದಾರರಿಗೆ ಆರಂಭದಲ್ಲಿ ಕಿರಿಕಿರಿಯಾಗಿ ಅನಿಸಬಹುದು.
ಅರ್ಥಪೂರ್ಣ ಸೈಬರ್ಸುರಕ್ಷತಾ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಹೊಂದಿರುವ ಮಾಡೆಲ್ಗಳನ್ನು ಜವಾಬ್ದಾರಿಯುತವಾಗಿ ಬಿಡುಗಡೆ ಮಾಡಲು ಸಾಧ್ಯವಾಗುವಂತೆ, ನಮ್ಮ ಮಾಡೆಲ್ಗಳು ಕ್ರಮೇಣ ಸುಧಾರಿಸುತ್ತಿರುವಂತೆ ಮತ್ತು ನಾವು ತಗ್ಗಿಸುವಿಕೆಗಳನ್ನು ಪುನರಾವರ್ತಿತವಾಗಿ ಅಭಿವೃದ್ಧಿಪಡಿಸಿ ಮಾಪನಾಂಕಗೊಳಿಸುತ್ತಿರುವಾಗ, ಹಲವು ವರ್ಷಗಳಿಂದ ನಮ್ಮ ಪ್ರಿಪೇರ್ಡ್ನೆಸ್ ಫ್ರೇಮ್ವರ್ಕ್(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ನಲ್ಲಿ ಸೈಬರ್ಸುರಕ್ಷತೆಯನ್ನು ಒಂದು ವರ್ಗವಾಗಿ ಗುರುತಿಸಿದ್ದೇವೆ.
- ಈ ಮಟ್ಟದ ಸೈಬರ್ ಸಾಮರ್ಥ್ಯಕ್ಕಾಗಿ ನಾವು ಉದ್ಯಮದ ಮುಂಚೂಣಿಯ ರಕ್ಷಣೆಗಳನ್ನು ಜಾರಿಗೆ ತರುತ್ತಿದ್ದೇವೆ. ಕಳೆದ ವರ್ಷ ನಾವು GPT‑5.2(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಜೊತೆಗೆ ಸೈಬರ್-ನಿರ್ದಿಷ್ಟ ರಕ್ಷಣೆಗಳನ್ನು ಮೊದಲಿಗೆ ಪರಿಚಯಿಸಿದ್ದೇವೆ, ಮತ್ತು ನಂತರದ ನಿಯೋಜನೆಗಳಲ್ಲಿ ಅವನ್ನು ಪರೀಕ್ಷಿಸಿ, ಪರಿಷ್ಕರಿಸಿ ಮತ್ತು ಮತ್ತಷ್ಟು ಅಭಿವೃದ್ಧಿಪಡಿಸುತ್ತ ಬಂದಿದ್ದೇವೆ. GPT‑5.5 ಗಾಗಿ, ನಾವು ಹೆಚ್ಚಿನ ಅಪಾಯದ ಚಟುವಟಿಕೆ, ಸೂಕ್ಷ್ಮ ಸೈಬರ್ ವಿನಂತಿಗಳು ಮತ್ತು ಪುನರಾವರ್ತಿತ ದುರುಪಯೋಗದ ವಿರುದ್ಧ ಹೆಚ್ಚುವರಿ ರಕ್ಷಣೆಗಳೊಂದಿಗೆ ಕಟ್ಟುನಿಟ್ಟಿನ ನಿಯಂತ್ರಣಗಳನ್ನು ವಿನ್ಯಾಸಗೊಳಿಸಿದ್ದೇವೆ. ಮಾಡೆಲ್ ಸುರಕ್ಷತೆ, ದೃಢೀಕರಿಸಲಾದ ಬಳಕೆ ಮತ್ತು ಅನುಮತಿಸದ ಬಳಕೆಯ ಮೇಲ್ವಿಚಾರಣೆಯ ಮೇಲಿನ ನಮ್ಮ ಹೂಡಿಕೆಗಳ ಮೂಲಕ ವ್ಯಾಪಕ ಪ್ರವೇಶವನ್ನು ಸಾಧ್ಯವಾಗಿಸಲಾಗಿದೆ. ಈ ಭದ್ರತಾ ಕ್ರಮಗಳ ದೃಢತೆಯನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು, ಪರೀಕ್ಷಿಸಲು ಮತ್ತು ಪುನರಾವರ್ತಿಸಲು ನಾವು ತಿಂಗಳುಗಳಿಂದ ಬಾಹ್ಯ ತಜ್ಞರೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುತ್ತಿದ್ದೇವೆ. GPT‑5.5 ನೊಂದಿಗೆ, ಡೆವಲಪರ್ಗಳು ತಮ್ಮ ಕೋಡ್ ಅನ್ನು ಸುಲಭವಾಗಿ ಸುರಕ್ಷಿತಗೊಳಿಸಬಹುದು ಎಂಬುದನ್ನು ನಾವು ಖಚಿತಪಡಿಸುತ್ತಿದ್ದೇವೆ, ಜೊತೆಗೆ ದುರುದ್ದೇಶಿ ವ್ಯಕ್ತಿಗಳಿಂದ ಹಾನಿ ಉಂಟುಮಾಡುವ ಸಾಧ್ಯತೆ ಇರುವ ಸೈಬರ್ ವರ್ಕ್ಫ್ಲೋಗಳ ಮೇಲೆ ಬಲವಾದ ನಿಯಂತ್ರಣಗಳನ್ನು ಜಾರಿಗೊಳಿಸುತ್ತಿದ್ದೇವೆ.
- ಪ್ರತಿ ಹಂತದಲ್ಲಿ ಸೈಬರ್ ರಕ್ಷಣೆಯನ್ನು ವೇಗಗೊಳಿಸಲು ನಾವು ಪ್ರವೇಶವನ್ನು ವಿಸ್ತರಿಸುತ್ತಿದ್ದೇವೆ. ನಾವು ನಮ್ಮ ಸೈಬರ್-ಪರವಾನಗಿ ಮಾಡೆಲ್ಗಳನ್ನು ಸೈಬರ್ಗಾಗಿ ವಿಶ್ವಾಸಾರ್ಹ ಪ್ರವೇಶ ಮೂಲಕ ಲಭ್ಯವಾಗುವಂತೆ ಮಾಡುತ್ತಿದ್ದೇವೆ. ಇದು Codexನಿಂದ ಪ್ರಾರಂಭವಾಗುತ್ತದೆ ಮತ್ತು GPT‑5.5 ನ ಸುಧಾರಿತ ಸೈಬರ್ಸುರಕ್ಷತಾ ಸಾಮರ್ಥ್ಯಗಳಿಗೆ ವಿಸ್ತೃತ ಪ್ರವೇಶವನ್ನು ಒದಗಿಸುತ್ತದೆ, ಪ್ರಾರಂಭದಲ್ಲಿ ಕೆಲವು ವಿಶ್ವಾಸಾರ್ಹ ಸಂಕೇತಗಳನ್ನು(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಪೂರೈಸುವ ಪರಿಶೀಲಿತ ಬಳಕೆದಾರರಿಗೆ ಕಡಿಮೆ ನಿರ್ಬಂಧಗಳೊಂದಿಗೆ. ಮಹತ್ವದ ಮೂಲಸೌಕರ್ಯವನ್ನು ರಕ್ಷಿಸುವ ಜವಾಬ್ದಾರಿ ಹೊಂದಿರುವ ಸಂಸ್ಥೆಗಳು GPT‑5.4‑Cyber ಮಾಡೆಲ್ಗಳಿಗೆ ಪ್ರವೇಶ ಪಡೆಯಲು ಅರ್ಜಿ ಸಲ್ಲಿಸಬಹುದು, ಮತ್ತು ತಮ್ಮ ಆಂತರಿಕ ವ್ಯವಸ್ಥೆಗಳನ್ನು ಸುರಕ್ಷಿತಗೊಳಿಸಲು ಈ ಮಾಡೆಲ್ಗಳನ್ನು ಬಳಸಲು ಕಠಿಣ ಭದ್ರತಾ ಅವಶ್ಯಕತೆಗಳನ್ನು ಪೂರೈಸಬೇಕು. ಇದು ವ್ಯಾಪಕ ಶ್ರೇಣಿಯ ಪರಿಶೀಲಿಸಿದ ರಕ್ಷಕರಿಗೆ ಕಾನೂನುಬದ್ಧ ಭದ್ರತಾ ಕೆಲಸಕ್ಕಾಗಿ ಹೆಚ್ಚು ಸಮರ್ಥ ಸಾಧನಗಳನ್ನು ನೀಡುತ್ತದೆ, ಇದು ಕಡಿಮೆ ಅನಗತ್ಯ ಘರ್ಷಣೆಯೊಂದಿಗೆ ನಾವು ಪ್ರಮುಖ ರಕ್ಷಣಾತ್ಮಕ ಸಾಮರ್ಥ್ಯಗಳಿಗೆ ಪ್ರವೇಶವನ್ನು ಪ್ರಜಾಪ್ರಭುತ್ವಗೊಳಿಸುತ್ತೇವೆ ಎಂದು ಖಚಿತಪಡಿಸುತ್ತದೆ. ಬಳಕೆದಾರರು ಪರಿಶೀಲಿತ ರಕ್ಷಣಾತ್ಮಕ ಕೆಲಸಕ್ಕಾಗಿ GPT‑5.5 ಅನ್ನು ಬಳಸುವಾಗ ಅನಗತ್ಯ ನಿರಾಕರಣೆಗಳನ್ನು ಕಡಿಮೆ ಮಾಡಲು chatgpt.com/cyber(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ನಲ್ಲಿ ವಿಶ್ವಾಸಾರ್ಹ ಪ್ರವೇಶಕ್ಕೆ ಅರ್ಜಿ ಸಲ್ಲಿಸಬಹುದು.
- ಸಾರ್ವಜನಿಕರಿಗೆ ನಿರ್ಣಾಯಕ ಮೂಲಸೌಕರ್ಯಗಳನ್ನು ರಕ್ಷಿಸಲು ನಾವು ಸರ್ಕಾರಿ ಪಾಲುದಾರರೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುತ್ತಿದ್ದೇವೆ. ಒಟ್ಟಾಗಿ, ಪ್ರಮುಖ ತೆರಿಗೆದಾರರ ಡೇಟಾವನ್ನು ಸುರಕ್ಷಿತಗೊಳಿಸುವ ಡಿಜಿಟಲ್ ವ್ಯವಸ್ಥೆಗಳಿಂದ ಹಿಡಿದು ಸ್ಥಳೀಯ ಸಮುದಾಯಗಳ ವಿದ್ಯುತ್ ಜಾಲ ಮತ್ತು ನೀರಿನ ಸರಬರಾಜುವರೆಗೆ, ಜನರು ಅವಲಂಬಿಸಿರುವ ವ್ಯವಸ್ಥೆಗಳ ಜವಾಬ್ದಾರಿ ಹೊಂದಿರುವ ವಿಶ್ವಾಸಾರ್ಹ ಅಧಿಕಾರಿಗಳ ರಕ್ಷಣಾತ್ಮಕ ಕಾರ್ಯಕ್ಕೆ ಸುಧಾರಿತ AI ಹೇಗೆ ಬೆಂಬಲ ನೀಡಬಹುದು ಎಂಬುದನ್ನು ನಾವು ಅನ್ವೇಷಿಸುತ್ತಿದ್ದೇವೆ.
ನಾವು ನಮ್ಮ ಪ್ರಿಪೇರ್ಡ್ನೆಸ್ ಫ್ರೇಮ್ವರ್ಕ್(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಅಡಿಯಲ್ಲಿ GPT‑5.5 ರ ಜೈವಿಕ/ರಾಸಾಯನಿಕ ಮತ್ತು ಸೈಬರ್ಸುರಕ್ಷತಾ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಹೈ ಎಂದು ಪರಿಗಣಿಸುತ್ತಿದ್ದೇವೆ. GPT‑5.5 ನಿರ್ಣಾಯಕ ಸೈಬರ್ಸುರಕ್ಷತಾ ಸಾಮರ್ಥ್ಯದ ಮಟ್ಟವನ್ನು ತಲುಪದಿದ್ದರೂ, ನಮ್ಮ ಮೌಲ್ಯಮಾಪನಗಳು ಮತ್ತು ಪರೀಕ್ಷೆಗಳು ಅದರ ಸೈಬರ್ಸುರಕ್ಷತಾ ಸಾಮರ್ಥ್ಯಗಳು GPT‑5.4 ಗೆ ಹೋಲಿಸಿದರೆ ಒಂದು ಹಂತ ಮೇಲಿವೆ ಎಂದು ತೋರಿಸಿವೆ.
ಇದರ ಜೊತೆಗೆ, GPT‑5.5 ಅನ್ನು ಬಿಡುಗಡೆಗೆ ಮುನ್ನ ನಮ್ಮ ಸಂಪೂರ್ಣ ಸುರಕ್ಷತೆ ಮತ್ತು ಆಡಳಿತ ಪ್ರಕ್ರಿಯೆಯ ಮೂಲಕ ನಡೆಸಲಾಯಿತು, ಇದರಲ್ಲಿ ಸನ್ನದ್ಧತೆ ಮೌಲ್ಯಮಾಪನಗಳು, ಕ್ಷೇತ್ರ-ನಿರ್ದಿಷ್ಟ ಪರೀಕ್ಷೆಗಳು, ಸುಧಾರಿತ ಜೀವಶಾಸ್ತ್ರ ಮತ್ತು ಸೈಬರ್ಸುರಕ್ಷತಾ ಸಾಮರ್ಥ್ಯಗಳಿಗಾಗಿ ಹೊಸ ಗುರಿನಿರ್ದಿಷ್ಟ ಮೌಲ್ಯಮಾಪನಗಳು ಮತ್ತು ಬಾಹ್ಯ ತಜ್ಞರೊಂದಿಗೆ ದೃಢವಾದ ಪರೀಕ್ಷೆಗಳು ಸೇರಿದ್ದವು. ನಾವು GPT‑5.5 ಸಿಸ್ಟಮ್ ಕಾರ್ಡ್ನಲ್ಲಿ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಹೆಚ್ಚಿನ ವಿವರಗಳನ್ನು ಹಂಚಿಕೊಳ್ಳುತ್ತೇವೆ.
ಈ ಕೆಲಸವು AI ಸ್ಥಿತಿಸ್ಥಾಪಕತೆಯ ಕುರಿತ ನಮ್ಮ ವ್ಯಾಪಕ ವಿಧಾನವನ್ನು ಪ್ರತಿಬಿಂಬಿಸುತ್ತದೆ ಮತ್ತು ಮಾಡೆಲ್ ಸಾಮರ್ಥ್ಯಗಳು ಮುಂದುವರಿದಂತೆ ಇದು ಅಗತ್ಯವೆಂದು ನಾವು ನಂಬುತ್ತೇವೆ. ವ್ಯವಸ್ಥೆಗಳು, ಸಂಸ್ಥೆಗಳು ಮತ್ತು ಸಾರ್ವಜನಿಕರನ್ನು ರಕ್ಷಿಸಲು ಅದನ್ನು ಬಳಸುವ ಜನರಿಗೆ ಶಕ್ತಿಶಾಲಿ AI ಲಭ್ಯವಾಗಿರಲೆಂದು ನಾವು ಬಯಸುತ್ತೇವೆ. ಕಾರ್ಯಸಾಧ್ಯವಾದ ಮಾರ್ಗವೆಂದರೆ ನಂಬಿಕಸ್ಥ ಪ್ರವೇಶ, ಸಾಮರ್ಥ್ಯಕ್ಕೆ ಅನುಗುಣವಾಗಿ ವಿಸ್ತರಿಸುವ ದೃಢವಾದ ರಕ್ಷಣಾತ್ಮಕ ಕ್ರಮಗಳು ಮತ್ತು ಗಂಭೀರ ದುರುಪಯೋಗವನ್ನು ಪತ್ತೆಹಚ್ಚಿ ಅದಕ್ಕೆ ಪ್ರತಿಕ್ರಿಯಿಸುವ ಕಾರ್ಯಾಚರಣಾ ಸಾಮರ್ಥ್ಯ.
ಇಂದು, GPT‑5.5 ಅನ್ನು ChatGPT ಮತ್ತು Codex ನಲ್ಲಿ Plus, Pro, Business ಮತ್ತು Enterprise ಬಳಕೆದಾರರಿಗೆ ರೋಲ್ಔಟ್ ಮಾಡಲಾಗುತ್ತಿದೆ, ಮತ್ತು GPT‑5.5 Pro ಅನ್ನು ChatGPT ನಲ್ಲಿ Pro, Business ಮತ್ತು Enterprise ಬಳಕೆದಾರರಿಗೆ ರೋಲ್ಔಟ್ ಮಾಡಲಾಗುತ್ತಿದೆ. ನಾವು GPT‑5.5 ಮತ್ತು GPT‑5.5 Pro ಅನ್ನು ಶೀಘ್ರದಲ್ಲೇ API ಗೆ ತರುತ್ತೇವೆ.
ChatGPT ನಲ್ಲಿ, GPT‑5.5 Thinking Plus, Pro, Business ಮತ್ತು Enterprise ಬಳಕೆದಾರರಿಗೆ ಲಭ್ಯವಿದೆ. ಇನ್ನಷ್ಟು ಕಠಿಣ ಪ್ರಶ್ನೆಗಳು ಮತ್ತು ಹೆಚ್ಚಿನ ನಿಖರತೆಯ ಕೆಲಸಕ್ಕಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ GPT‑5.5 Pro, Pro, Business ಮತ್ತು Enterprise ಬಳಕೆದಾರರಿಗೆ ಲಭ್ಯವಿದೆ.
Codex ನಲ್ಲಿ, GPT‑5.5 Plus, Pro, Business, Enterprise, Edu ಮತ್ತು Go ಪ್ಲಾನ್ಗಳಿಗೆ 400,000 ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋದೊಂದಿಗೆ ಲಭ್ಯವಿದೆ. GPT‑5.5 ಫಾಸ್ಟ್ ಮೋಡ್ ನಲ್ಲಿ ಸಹ ಲಭ್ಯವಿದೆ, 2.5x ವೆಚ್ಚದಲ್ಲಿ 1.5x ವೇಗದಲ್ಲಿ ಟೋಕನ್ಗಳನ್ನು ರಚಿಸುತ್ತದೆ.
API ಡೆವಲಪರ್ಗಳಿಗಾಗಿ, gpt-5.5 ಶೀಘ್ರದಲ್ಲೇ Responses ಮತ್ತು ಚಾಟ್ ಕಂಪ್ಲೀಷನ್ಸ್ API ಗಳಲ್ಲಿ ಲಭ್ಯವಾಗಲಿದೆ. ಇದರ ದರ ಪ್ರತಿ 1M ಇನ್ಪುಟ್ ಟೋಕನ್ಗಳಿಗೆ $5 ಮತ್ತು ಪ್ರತಿ 1M ಔಟ್ಪುಟ್ ಟೋಕನ್ಗಳಿಗೆ $30 ಆಗಿದ್ದು, 1M ಕಾನ್ಟೆಕ್ಸ್ಟ್ ವಿಂಡೋ ಹೊಂದಿದೆ. ಬ್ಯಾಚ್ ಮತ್ತು ಫ್ಲೆಕ್ಸ್ ಪ್ರೈಸಿಂಗ್ ಸ್ಟ್ಯಾಂಡರ್ಡ್ API ದರದ ಅರ್ಧದಷ್ಟು ದರದಲ್ಲಿ ಲಭ್ಯವಿದೆ, ಆದರೆ ಪ್ರಾಥಮಿಕ ಪ್ರೊಸೆಸಿಂಗ್ ಸ್ಟ್ಯಾಂಡರ್ಡ್ ದರದ 2.5 ಪಟ್ಟು ದರದಲ್ಲಿ ಲಭ್ಯವಿದೆ. ಇನ್ನಷ್ಟು ಹೆಚ್ಚಿನ ನಿಖರತೆಗೆ, ನಾವು API ಯಲ್ಲಿ gpt-5.5-pro ಅನ್ನು ಸಹ ಬಿಡುಗಡೆ ಮಾಡುತ್ತೇವೆ, ಇದರ ದರ ಪ್ರತಿ 1M ಇನ್ಪುಟ್ ಟೋಕನ್ಗಳಿಗೆ $30 ಮತ್ತು ಪ್ರತಿ 1M ಔಟ್ಪುಟ್ ಟೋಕನ್ಗಳಿಗೆ $180 ಆಗಿರುತ್ತದೆ. ಸಂಪೂರ್ಣ ವಿವರಗಳಿಗಾಗಿ ಬೆಲೆ ನಿಗದಿ ಪುಟ ನೋಡಿ.
GPT‑5.5 ನ ಬೆಲೆ GPT‑5.4 ಗಿಂತ ಹೆಚ್ಚಾಗಿದ್ದರೂ, ಇದು ಹೆಚ್ಚು ಬುದ್ಧಿವಂತವೂ ಆಗಿದೆ ಮತ್ತು ಟೋಕನ್ ಬಳಕೆಯಲ್ಲಿ ಬಹಳ ಹೆಚ್ಚು ಕಾರ್ಯಕ್ಷಮವೂ ಆಗಿದೆ. Codexನಲ್ಲಿ, ಹೆಚ್ಚಿನ ಬಳಕೆದಾರರಿಗಾಗಿ GPT‑5.5ವು GPT‑5.4ಗಿಂತ ಕಡಿಮೆ ಟೋಕನ್ಗಳೊಂದಿಗೆ ಉತ್ತಮ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡುವಂತೆ ನಾವು ಅನುಭವವನ್ನು ಸೂಕ್ಷ್ಮವಾಗಿ ಸರಿಹೊಂದಿಸಿದ್ದೇವೆ; ಜೊತೆಗೆ ಚಂದಾದಾರಿಕೆ ಮಟ್ಟಗಳಾದ್ಯಂತ ಉದಾರ ಬಳಕೆಯನ್ನು ಮುಂದುವರಿಸುತ್ತಿದ್ದೇವೆ.
ಕೋಡಿಂಗ್
ಮೌಲ್ಯಮಾಪನ | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | ಜಿಪಿಟಿ-5.4 ಪ್ರೊ | Claude Opus 4.7 | Gemini 3.1 Pro |
SWE-Bench Pro (ಸಾರ್ವಜನಿಕ) * | 58.6% | 57.7% | - | - | 64.3% | 54.2% |
ಟರ್ಮಿನಲ್-ಬೆಂಚ್ 2.0 | 82.7% | 75.1% | - | - | 69.4% | 68.5% |
ತಜ್ಞ-SWE (ಆಂತರಿಕ) | 73.1% | 68.5% | - | - | - | - |
*ಲ್ಯಾಬ್ಗಳು ಕಂಠಪಾಠದ ಸಾಕ್ಷ್ಯವನ್ನು(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಈ ಮೌಲ್ಯಮಾಪನದಲ್ಲಿ ಗುರುತಿಸಿವೆ
ಪ್ರೊಫೆಷನಲ್
ಮೌಲ್ಯಮಾಪನ | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | ಜಿಪಿಟಿ-5.4 ಪ್ರೊ | Claude Opus 4.7 | Gemini 3.1 Pro |
GDPval (ಗೆಲುವುಗಳು ಅಥವಾ ಸಮನ್ವಯಗಳು) | 84.9% | 83.0% | 82.3% | 82.0% | 80.3% | 67.3% |
FinanceAgent v1.1 | 60.0% | 56.0% | - | 61.5% | 64.4% | 59.7% |
ಇನ್ವೆಸ್ಟ್ಮೆಂಟ್ ಬ್ಯಾಂಕಿಂಗ್ ಮಾಡೆಲಿಂಗ್ ಕಾರ್ಯಗಳು (ಆಂತರಿಕ) | 88.5% | 87.3% | 88.6% | 83.6% | - | - |
OfficeQA Pro | 54.1% | 53.2% | - | - | 43.6% | 18.1% |
ಕಂಪ್ಯೂಟರ್ ಬಳಕೆ ಮತ್ತು ದೃಷ್ಟಿ
ಮೌಲ್ಯಮಾಪನ | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | ಜಿಪಿಟಿ-5.4 ಪ್ರೊ | Claude Opus 4.7 | Gemini 3.1 Pro |
OSWorld-ಪ್ರಮಾಣಿತ | 78.7% | 75.0% | - | - | 78.0% | - |
MMMU Pro (ಉಪಕರಣಗಳಿಲ್ಲ) | 81.2% | 81.2% | - | - | - | 80.5% |
MMMU Pro (ಉಪಕರಣಗಳೊಂದಿಗೆ) | 83.2% | 82.1% | - | - | - | - |
ಟೂಲ್ ಬಳಕೆ
ಮೌಲ್ಯಮಾಪನ | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | ಜಿಪಿಟಿ-5.4 ಪ್ರೊ | Claude Opus 4.7 | Gemini 3.1 Pro |
BrowseComp | 84.4% | 82.7% | 90.1% | 89.3% | 79.3% | 85.9% |
MCP Atlas** | 75.3% | 70.6% | - | - | 79.1% | 78.2% |
Toolathlon | 55.6% | 54.6% | - | - | - | 48.8% |
Tau2-bench ಟೆಲಿಕಾಂ*** | 98.0% | 92.8% | - | - | - | - |
** MCP Atlas: ಇತ್ತೀಚಿನ 2026 ಏಪ್ರಿಲ್ ಅಪ್ಡೇಟ್ನ ನಂತರದ Scale AI ಫಲಿತಾಂಶಗಳು.
*** Tau2-bench ಟೆಲಿಕಾಂ: ಮೂಲ ಪ್ರಾಂಪ್ಟ್ಗಳೊಂದಿಗೆ 5.5 ಮತ್ತು 5.4 ರ ಫಲಿತಾಂಶಗಳು, ಅಂದರೆ ಪ್ರಾಂಪ್ಟ್ನಲ್ಲಿ ಯಾವುದೇ ಹೊಂದಾಣಿಕೆ ಇಲ್ಲ. ಇದು ಪ್ರಾಂಪ್ಟ್ ಹೊಂದಾಣಿಕೆಗಳೊಂದಿಗೆ ಮೌಲ್ಯಮಾಪನಗೊಂಡ ಇತರ ಲ್ಯಾಬ್ಗಳ ಫಲಿತಾಂಶಗಳನ್ನು ಹೊರತುಪಡಿಸುತ್ತದೆ.
ಅಕಾಡೆಮಿಕ್
ಮೌಲ್ಯಮಾಪನ | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | ಜಿಪಿಟಿ-5.4 ಪ್ರೊ | Claude Opus 4.7 | Gemini 3.1 Pro |
GeneBench | 25.0% | 19.0% | 33.2% | 25.6% | - | - |
FrontierMath ಮಟ್ಟ 1–3 | 51.7% | 47.6% | 52.4% | 50.0% | 43.8% | 36.9% |
FrontierMath ಮಟ್ಟ 4 | 35.4% | 27.1% | 39.6% | 38.0% | 22.9% | 16.7% |
BixBench | 80.5% | 74.0% | - | - | - | - |
GPQA ಡೈಮಂಡ್ | 93.6% | 92.8% | - | 94.4% | 94.2% | 94.3% |
ಮಾನವೀಯತೆಯ ಕೊನೆಯ ಪರೀಕ್ಷೆ (ಯಾವುದೇ ಸಾಧನಗಳಿಲ್ಲ) | 41.4% | 39.8% | 43.1% | 42.7% | 46.9% | 44.4% |
ಮಾನವೀಯತೆಯ ಕೊನೆಯ ಪರೀಕ್ಷೆ (ಉಪಕರಣಗಳೊಂದಿಗೆ) | 52.2% | 52.1% | 57.2% | 58.7% | 54.7% | 51.4% |
ಸೈಬರ್ಸುರಕ್ಷತೆ
ಮೌಲ್ಯಮಾಪನ | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | ಜಿಪಿಟಿ-5.4 ಪ್ರೊ | Claude Opus 4.7 | Gemini 3.1 Pro |
Capture-the-Flag (CTF) ಸವಾಲಿನ ಕಾರ್ಯಗಳು (ಆಂತರಿಕ)**** | 88.1% | 83.7% | - | - | - | - |
CyberGym | 81.8% | 79.0% | - | - | 73.1% | - |
**** ಸಿಸ್ಟಮ್ ಕಾರ್ಡ್ಗಳಲ್ಲಿ ಬಳಸಲಾದ ಅತ್ಯಂತ ಕಠಿಣ CTF ಗಳ ವಿಸ್ತರಣೆ, ಇದರಲ್ಲಿ ಹೆಚ್ಚುವರಿ ಕಠಿಣ ಸವಾಲುಗಳಿವೆ.
ದೀರ್ಘ ಸಂದರ್ಭ
ಮೌಲ್ಯಮಾಪನ | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | ಜಿಪಿಟಿ-5.4 ಪ್ರೊ | Claude Opus 4.7 | Gemini 3.1 Pro |
Graphwalks BFS 256K f1 | 73.7% | 62.5% | - | - | 76.9% | - |
Graphwalks BFS 1mil f1 | 45.4% | 9.4% | - | - | 41.2% (Opus 4.6) | - |
Graphwalks ಪೇರೆಂಟ್ಸ್ (ಮೂಲಕ ಸಂಬಂಧಿತ ನೋಡಿದವರು) 256K f1 | 90.1% | 82.8% | - | - | 93.6% | - |
Graphwalks ಪೇರೆಂಟ್ಸ್ 1 ಮಿಲ್ f1 | 58.5% | 44.4% | - | - | 72.0% (Opus 4.6) | - |
OpenAI MRCR v2 8-needle 4K-8K | 98.1% | 97.3% | - | - | - | - |
OpenAI MRCR v2 8-needle 8K-16K | 93.0% | 91.4% | - | - | - | - |
OpenAI MRCR v2 8-needle 16K-32K | 96.5% | 97.2% | - | - | - | - |
OpenAI MRCR v2 8-needle 32K-64K | 90.0% | 90.5% | - | - | - | - |
OpenAI MRCR v2 8-needle 64K-128K | 83.1% | 86.0% | - | - | - | - |
OpenAI MRCR v2 8-needle 128K-256K | 87.5% | 79.3% | - | - | 59.2% | - |
OpenAI MRCR v2 8-needle 256K-512K | 81.5% | 57.5% | - | - | - | - |
OpenAI MRCR v2 8-needle 512K-1M | 74.0% | 36.6% | - | - | 32.2% | - |
ಅಮೂರ್ತ ತಾರ್ಕಿಕತೆ
ಮೌಲ್ಯಮಾಪನ | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | ಜಿಪಿಟಿ-5.4 ಪ್ರೊ | Claude Opus 4.7 | Gemini 3.1 Pro |
ARC-AGI-1 (ಪರಿಶೀಲಿಸಲಾಗಿದೆ) | 95.0% | 93.7% | - | 94.5% | 93.5% | 98.0% |
ARC-AGI-2 (ಪರಿಶೀಲಿಸಲಾಗಿದೆ) | 85.0% | 73.3% | - | 83.3% | 75.8% | 77.1% |
GPT ಯ ಎವಾಲ್ಸ್ ಅನ್ನು xhigh ರೀಜನಿಂಗ್ ಎಫರ್ಟ್ಗೆ ಸೆಟ್ ಮಾಡಿ ರನ್ ಮಾಡಲಾಯಿತು ಮತ್ತು ಸಂಶೋಧನಾ ಪರಿಸರದಲ್ಲಿ ನಡೆಸಲಾಯಿತು, ಇದು ಕೆಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ ಉತ್ಪಾದನಾ ChatGPT ನಿಂದ ಸ್ವಲ್ಪ ವಿಭಿನ್ನ ಔಟ್ಪುಟ್ ಅನ್ನು ಒದಗಿಸಬಹುದು.








