ਅਸੀਂ ਇੱਕ ਨਵਾਂ ਮਾਡਲ ਪੇਸ਼ ਕਰ ਰਹੇ ਹਾਂ ਜੋ Codex ਕੀ ਕਰ ਸਕਦਾ ਹੈ, ਉਸ ਨੂੰ ਹੋਰ ਵੀ ਖੋਲ੍ਹਦਾ ਹੈ: GPT‑5.3‑Codex, ਅੱਜ ਤੱਕ ਦਾ ਸਭ ਤੋਂ ਸਮਰੱਥ ਏਜੰਟਿਕ ਕੋਡਿੰਗ ਮਾਡਲ. ਇਹ ਮਾਡਲ GPT‑5.2‑Codex ਦੀ ਅਤਿ-ਆਧੁਨਿਕ ਕੋਡਿੰਗ ਕਾਰਗੁਜ਼ਾਰੀ ਅਤੇ GPT‑5.2 ਦੀ ਰੀਜ਼ਨਿੰਗ ਅਤੇ ਪੇਸ਼ੇਵਰ ਗਿਆਨ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਇੱਕੋ ਮਾਡਲ ਵਿੱਚ ਅੱਗੇ ਲੈ ਜਾਂਦਾ ਹੈ, ਅਤੇ ਇਹ 25% ਤੇਜ਼ ਵੀ ਹੈ. ਇਸ ਨਾਲ ਇਹ ਲੰਬੇ ਸਮੇਂ ਚੱਲਣ ਵਾਲੇ ਉਹ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਖੋਜ, ਟੂਲ ਦੀ ਵਰਤੋਂ ਅਤੇ ਜਟਿਲ ਐਗਜ਼ੀਕਿਊਸ਼ਨ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ. ਬਿਲਕੁਲ ਇੱਕ ਸਹਿਕਰਮੀ ਵਾਂਗ, ਤੁਸੀਂ GPT‑5.3‑Codex ਨਾਲ ਉਸ ਦੇ ਕੰਮ ਦੌਰਾਨ ਦਿਸ਼ਾ ਦੇ ਸਕਦੇ ਹੋ ਅਤੇ ਸੰਚਾਰ ਕਰ ਸਕਦੇ ਹੋ, ਬਿਨਾਂ ਸੰਦਰਭ ਗੁਆਏ.
GPT‑5.3‑Codex ਸਾਡਾ ਪਹਿਲਾ ਮਾਡਲ ਹੈ ਜਿਸ ਨੇ ਆਪਣੇ ਆਪ ਨੂੰ ਬਣਾਉਣ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਭੂਮਿਕਾ ਨਿਭਾਈ. Codex ਟੀਮ ਨੇ ਸ਼ੁਰੂਆਤੀ ਵਰਜਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਉਸ ਦੀ ਆਪਣੀ ਟ੍ਰੇਨਿੰਗ ਡੀਬੱਗ ਕੀਤੀ, ਆਪਣੀ ਡਿਪਲੌਇਮੈਂਟ ਸੰਭਾਲੀ, ਅਤੇ ਟੈਸਟ ਨਤੀਜਿਆਂ ਅਤੇ ਮੁਲਾਂਕਣਾਂ ਦੀ ਪੜਤਾਲ ਕੀਤੀ—ਸਾਡੀ ਟੀਮ ਇਸ ਗੱਲ ਤੋਂ ਹੈਰਾਨ ਰਹਿ ਗਈ ਕਿ Codex ਆਪਣੀ ਹੀ ਵਿਕਾਸ ਗਤੀ ਨੂੰ ਕਿੰਨਾ ਤੇਜ਼ ਕਰ ਸਕਿਆ.
GPT‑5.3‑Codex ਨਾਲ, Codex ਇੱਕ ਅਜੇਹੇ ਏਜੰਟ ਤੋਂ ਜੋ ਕੋਡ ਲਿਖ ਅਤੇ ਸਮੀਖਿਆ ਕਰ ਸਕਦਾ ਹੈ, ਇੱਕ ਅਜੇਹੇ ਏਜੰਟ ਵੱਲ ਜਾਂਦਾ ਹੈ ਜੋ ਲਗਭਗ ਉਹ ਸਭ ਕੁਝ ਕਰ ਸਕਦਾ ਹੈ ਜੋ ਡਿਵੈਲਪਰ ਅਤੇ ਪੇਸ਼ੇਵਰ ਕੰਪਿਊਟਰ 'ਤੇ ਕਰ ਸਕਦੇ ਹਨ.
GPT‑5.3‑Codex SWE-Bench Pro ਅਤੇ Terminal-Bench 'ਤੇ ਉਦਯੋਗ ਦਾ ਨਵਾਂ ਉੱਚ ਦਰਜਾ ਸਥਾਪਤ ਕਰਦਾ ਹੈ, ਅਤੇ OSWorld ਅਤੇ GDPval 'ਤੇ ਮਜ਼ਬੂਤ ਪ੍ਰਦਰਸ਼ਨ ਦਿਖਾਉਂਦਾ ਹੈ. ਇਹ ਚਾਰ benchmark ਹਨ ਜਿਨ੍ਹਾਂ ਦੀ ਵਰਤੋਂ ਅਸੀਂ ਕੋਡਿੰਗ, ਏਜੰਟਿਕ ਅਤੇ ਅਸਲ-ਦੁਨੀਆ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਮਾਪਣ ਲਈ ਕਰਦੇ ਹਾਂ.
GPT‑5.3‑Codex SWE-Bench Pro 'ਤੇ state-of-the-art ਪ੍ਰਦਰਸ਼ਨ ਹਾਸਲ ਕਰਦਾ ਹੈ, ਜੋ ਅਸਲ-ਦੁਨੀਆ ਸਾਫਟਵੇਅਰ ਇੰਜੀਨੀਅਰਿੰਗ ਦਾ ਕੜਾ ਮੁਲਾਂਕਣ ਹੈ. ਜਿੱਥੇ SWE‑bench Verified ਸਿਰਫ Python ਦੀ ਜਾਂਚ ਕਰਦਾ ਹੈ, ਉੱਥੇ SWE‑Bench Pro ਚਾਰ ਭਾਸ਼ਾਵਾਂ 'ਤੇ ਫੈਲਦਾ ਹੈ ਅਤੇ contamination‑resistant, challenging, diverse ਅਤੇ industry-relevant ਹੋਣ ਵਿੱਚ ਹੋਰ ਮਜ਼ਬੂਤ ਹੈ. ਇਹ Terminal-Bench 2.0 'ਤੇ ਵੀ ਪਿਛਲੇ state-of-the-art ਪ੍ਰਦਰਸ਼ਨ ਤੋਂ ਕਾਫ਼ੀ ਅੱਗੇ ਨਿਕਲਦਾ ਹੈ, ਜੋ ਉਹ terminal ਹੁਨਰ ਮਾਪਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਦੀ Codex ਵਰਗੇ ਕੋਡਿੰਗ ਏਜੰਟ ਨੂੰ ਲੋੜ ਹੁੰਦੀ ਹੈ. ਖ਼ਾਸ ਤੌਰ 'ਤੇ, GPT‑5.3‑Codex ਇਹ ਸਭ ਕਿਸੇ ਵੀ ਪਿਛਲੇ ਮਾਡਲ ਨਾਲੋਂ ਘੱਟ ਟੋਕਨ ਨਾਲ ਕਰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਯੂਜ਼ਰ ਹੋਰ ਵੱਧ ਤਿਆਰ ਕਰ ਸਕਦੇ ਹਨ.
ਅਤਿ-ਆਧੁਨਿਕ ਕੋਡਿੰਗ ਸਮਰੱਥਾਵਾਂ, aesthetics ਵਿੱਚ ਸੁਧਾਰ, ਅਤੇ compaction ਦਾ ਮਿਲਾਪ ਇੱਕ ਅਜੇਹਾ ਮਾਡਲ ਬਣਾਉਂਦਾ ਹੈ ਜੋ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ ਦਿਨਾਂ ਦੇ ਦੌਰਾਨ ਸ਼ੁਰੂ ਤੋਂ ਹੀ ਬਹੁਤ ਕਾਰਗਰ ਜਟਿਲ ਗੇਮਾਂ ਅਤੇ ਐਪ ਬਣਾਉਂਦਾ ਹੈ. ਮਾਡਲ ਦੀ ਵੈੱਬ ਵਿਕਾਸ ਅਤੇ ਲੰਬੇ ਸਮੇਂ ਚੱਲਣ ਵਾਲੀ ਏਜੰਟਿਕ ਸਮਰੱਥਾ ਦੀ ਜਾਂਚ ਲਈ, ਅਸੀਂ GPT‑5.3‑Codex ਨੂੰ ਸਾਡੇ ਲਈ ਦੋ ਗੇਮ ਬਣਾਉਣ ਲਈ ਕਿਹਾ: Codex ਐਪ ਲਾਂਚ ਤੋਂ ਰੇਸਿੰਗ ਗੇਮ ਦਾ ਵਰਜਨ ਦੋ, ਅਤੇ ਇੱਕ ਡਾਈਵਿੰਗ ਗੇਮ. develop web game skill ਅਤੇ ਪਹਿਲਾਂ ਤੋਂ ਚੁਣੇ ਗਏ ਆਮ follow-up ਪ੍ਰੌੰਪਟ ਜਿਵੇਂ ਕਿ "bug ਠੀਕ ਕਰੋ" ਜਾਂ "game ਸੁਧਾਰੋ" ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, GPT‑5.3‑Codex ਨੇ ਲੱਖਾਂ ਟੋਕਨ ਦੌਰਾਨ ਗੇਮਾਂ 'ਤੇ ਖੁਦਮੁਖਤਿਆਰ ਤਰੀਕੇ ਨਾਲ iteration ਕੀਤੀ. ਟ੍ਰੇਲਰ ਦੇਖੋ ਅਤੇ ਗੇਮਾਂ ਖੁਦ ਖੇਡੋ ਤਾਂ ਜੋ ਵੇਖ ਸਕੋ ਕਿ Codex ਕੀ ਕਰ ਸਕਦਾ ਹੈ.
ਇੱਕ ਰੇਸਿੰਗ ਗੇਮ, ਜਿਸ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਰੇਸਰ, ਅੱਠ ਮੈਪ, ਅਤੇ space bar ਨਾਲ ਵਰਤਣ ਲਈ ਆਈਟਮ ਵੀ ਹਨ. ਇਸਨੂੰ ਖੁਦ ਇੱਥੇ ਖੇਡੋ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ)!
ਇੱਕ ਡਾਈਵਿੰਗ ਗੇਮ ਜਿਸ ਵਿੱਚ ਤੁਸੀਂ ਵੱਖ-ਵੱਖ ਰੀਫ਼ਾਂ ਦੀ ਖੋਜ ਕਰਦੇ ਹੋ, ਆਪਣਾ fish codex ਪੂਰਾ ਕਰਨ ਲਈ ਸਭ ਇਕੱਠਾ ਕਰਦੇ ਹੋ, ਅਤੇ ਇਸ ਦੌਰਾਨ ਆਕਸੀਜਨ, ਦਬਾਅ ਅਤੇ ਖ਼ਤਰਿਆਂ ਦਾ ਪ੍ਰਬੰਧ ਕਰਦੇ ਹੋ. ਇਸਨੂੰ ਖੁਦ ਇੱਥੇ ਖੇਡੋ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ)!
GPT‑5.3‑Codex, GPT‑5.2‑Codex ਦੇ ਮੁਕਾਬਲੇ, ਇਹ ਵੀ ਵਧੀਆ ਤਰੀਕੇ ਨਾਲ ਸਮਝਦਾ ਹੈ ਕਿ ਜਦੋਂ ਤੁਸੀਂ ਉਸ ਨੂੰ ਦਿਨ-प्रतਿਦਿਨ ਵਾਲੀਆਂ ਵੈੱਬਸਾਈਟਾਂ ਬਣਾਉਣ ਲਈ ਕਹਿੰਦੇ ਹੋ ਤਾਂ ਤੁਹਾਡਾ ਮਤਲਬ ਕੀ ਹੈ. ਸਧਾਰਣ ਜਾਂ ਅਧੂਰੇ ਪ੍ਰੌੰਪਟ ਹੁਣ ਮੂਲ ਰੂਪ ਵਿੱਚ ਹੋਰ functionality ਅਤੇ ਸਮਝਦਾਰ defaults ਵਾਲੀਆਂ ਸਾਈਟਾਂ ਵੱਲ ਜਾਂਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਤੁਹਾਨੂੰ ਆਪਣੀਆਂ ਧਾਰਣਾਵਾਂ ਨੂੰ ਜੀਵੰਤ ਕਰਨ ਲਈ ਹੋਰ ਮਜ਼ਬੂਤ ਸ਼ੁਰੂਆਤੀ canvas ਮਿਲਦਾ ਹੈ.
ਉਦਾਹਰਨ ਵਜੋਂ, ਅਸੀਂ GPT‑5.3‑Codex ਅਤੇ GPT‑5.2‑Codex ਨੂੰ ਹੇਠਾਂ ਦੋ landing pages ਬਣਾਉਣ ਲਈ ਕਿਹਾ. GPT‑5.3‑Codex ਨੇ ਆਪੇ ਹੀ yearly plan ਨੂੰ discounted monthly price ਵਜੋਂ ਦਿਖਾਇਆ, ਜਿਸ ਨਾਲ ਛੂਟ ਸਪੱਸ਼ਟ ਅਤੇ ਸੋਚੀ-ਸਮਝੀ ਲੱਗੀ, ਸਾਲਾਨਾ ਕੁੱਲ ਨੂੰ ਗੁਣਾ ਕਰਨ ਦੀ ਬਜਾਏ. ਇਸ ਨੇ ਇੱਕ ਦੀ ਥਾਂ ਤਿੰਨ ਵੱਖ-ਵੱਖ ਯੂਜ਼ਰ quotes ਵਾਲਾ ਆਪਣੇ ਆਪ ਬਦਲਦਾ testimonial carousel ਵੀ ਬਣਾਇਆ, ਜਿਸ ਨਾਲ ਪੇਜ ਮੂਲ ਰੂਪ ਵਿੱਚ ਹੋਰ ਪੂਰਾ ਅਤੇ production-ready ਮਹਿਸੂਸ ਹੁੰਦਾ ਹੈ.
ਪ੍ਰੌੰਪਟ: Quiet KPI ਲਈ ਇੱਕ ਲੈਂਡਿੰਗ ਪੇਜ ਬਣਾਓ, ਜੋ ਫਾਊਂਡਰ-ਫ੍ਰੈਂਡਲੀ ਸਾਪਤਾਹਿਕ ਮੈਟਰਿਕ ਡਾਈਜੈਸਟ ਹੈ. ਸੌੰਦਰਯ soft SaaS ਹੋਵੇ, glassy cards, lavender ਤੋਂ blue gradient, subtle blur. ਸੈਕਸ਼ਨ: email capture ਵਾਲਾ hero, sample report cards grid, integrations row, testimonial carousel, pricing toggle monthly yearly, FAQ, footer.
- Typeface Satoshi ਜਾਂ ਇਸ ਵਰਗਾ geometric sans.
- Buttons ਨਰਮ ਕੋਨੇ, 14px radius, ਮਜ਼ਬੂਤ focus states.
- ਇੱਕ ਸੁਚੱਜਾ scroll based reveal ਸ਼ਾਮਲ ਕਰੋ.
ਸਾਫਟਵੇਅਰ ਇੰਜੀਨੀਅਰ, ਡਿਜ਼ਾਈਨਰ, ਪ੍ਰੋਡਕਟ ਮੈਨੇਜਰ ਅਤੇ ਡਾਟਾ ਸਾਇੰਟਿਸਟ ਸਿਰਫ ਕੋਡ ਬਣਾਉਣ ਨਾਲੋਂ ਕਿਤੇ ਵੱਧ ਕੰਮ ਕਰਦੇ ਹਨ. GPT‑5.3‑Codex ਸਾਫਟਵੇਅਰ lifecycle ਦੇ ਸਾਰੇ ਕੰਮ ਲਈ ਸਹਾਇਤਾ ਦੇਣ ਵਾਸਤੇ ਬਣਾਇਆ ਗਿਆ ਹੈ—debugging, deploying, monitoring, PRD ਲਿਖਣ, copy ਸੋਧਣ, user research, tests, metrics ਅਤੇ ਹੋਰ ਬਹੁਤ ਕੁਝ. ਇਸ ਦੀਆਂ ਏਜੰਟਿਕ ਸਮਰੱਥਾਵਾਂ ਸਾਫਟਵੇਅਰ ਤੋਂ ਪਰੇ ਜਾਂਦੀਆਂ ਹਨ, ਤੁਹਾਨੂੰ ਜੋ ਵੀ ਬਣਾਉਣਾ ਹੋਵੇ ਉਹ ਬਣਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਦੀਆਂ ਹਨ—ਚਾਹੇ ਉਹ slide decks ਹੋਣ ਜਾਂ sheets ਵਿੱਚ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ.
ਸਾਡੇ ਪਿਛਲੇ GDPval ਨਤੀਜਿਆਂ ਲਈ ਵਰਤੀਆਂ custom skills ਵਰਗੀਆਂ skills ਨਾਲ, GPT‑5.3‑Codex ਪੇਸ਼ੇਵਰ ਗਿਆਨ-ਕੰਮ 'ਤੇ ਵੀ ਮਜ਼ਬੂਤ ਪ੍ਰਦਰਸ਼ਨ ਦਿਖਾਉਂਦਾ ਹੈ, ਜਿਵੇਂ GDPval ਦੁਆਰਾ ਮਾਪਿਆ ਜਾਂਦਾ ਹੈ, ਅਤੇ GPT‑5.2 ਦੇ ਬਰਾਬਰ ਹੈ. GDPval ਉਹ ਮੁਲਾਂਕਣ ਹੈ ਜੋ OpenAI ਨੇ 2025 ਵਿੱਚ ਜਾਰੀ ਕੀਤਾ ਸੀ ਅਤੇ ਜੋ 44 ਪੇਸ਼ਾਵਾਂ ਵਿੱਚ ਚੰਗੀ ਤਰ੍ਹਾਂ ਨਿਰਧਾਰਤ ਗਿਆਨ-ਕੰਮ ਟਾਸਕਾਂ 'ਤੇ ਮਾਡਲ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਮਾਪਦਾ ਹੈ. ਇਨ੍ਹਾਂ ਟਾਸਕਾਂ ਵਿੱਚ ਪ੍ਰੇਜ਼ੈਂਟੇਸ਼ਨ, ਸਪ੍ਰੈਡਸ਼ੀਟ ਅਤੇ ਹੋਰ ਕੰਮ-ਉਤਪਾਦ ਬਣਾਉਣ ਵਰਗੀਆਂ ਚੀਜ਼ਾਂ ਸ਼ਾਮਲ ਹਨ.
ਹੇਠਾਂ ਏਜੰਟ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੇ ਕੰਮ ਦੇ ਕੁਝ ਉਦਾਹਰਨ ਹਨ.
ਪ੍ਰੌੰਪਟ + ਕਾਰਜ ਸੰਦਰਭ
GPT-5.3-Codex output

OSWorld ਇੱਕ ਏਜੰਟਿਕ ਕੰਪਿਊਟਰ-ਵਰਤੋਂ benchmark ਹੈ, ਜਿਸ ਵਿੱਚ ਏਜੰਟ ਨੂੰ ਇੱਕ visual desktop ਕੰਪਿਊਟਰ ਮਾਹੌਲ ਵਿੱਚ ਉਤਪਾਦਕਤਾ ਵਾਲੇ ਕੰਮ ਪੂਰੇ ਕਰਨੇ ਹੁੰਦੇ ਹਨ. GPT‑5.3‑Codex ਪਿਛਲੇ GPT ਮਾਡਲਾਂ ਨਾਲੋਂ ਕਾਫ਼ੀ ਮਜ਼ਬੂਤ ਕੰਪਿਊਟਰ-ਵਰਤੋਂ ਸਮਰੱਥਾਵਾਂ ਦਿਖਾਉਂਦਾ ਹੈ.
OSWorld-Verified ਵਿੱਚ, ਮਾਡਲ vision ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਵੱਖ-ਵੱਖ ਕੰਪਿਊਟਰ ਕੰਮ ਪੂਰੇ ਕਰਦੇ ਹਨ. ਮਨੁੱਖ ਲਗਭਗ 72% ਸਕੋਰ ਕਰਦੇ ਹਨ.
ਕੋਡਿੰਗ, frontend, ਕੰਪਿਊਟਰ-ਵਰਤੋਂ ਅਤੇ ਅਸਲ-ਦੁਨੀਆ ਦੇ ਕੰਮਾਂ ਵਿੱਚ ਮਿਲੇ ਇਹ ਨਤੀਜੇ ਇਕੱਠੇ ਮਿਲ ਕੇ ਦਿਖਾਉਂਦੇ ਹਨ ਕਿ GPT‑5.3‑Codex ਸਿਰਫ ਵੱਖ-ਵੱਖ ਕੰਮਾਂ ਵਿੱਚ ਹੀ ਬਿਹਤਰ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਇੱਕ ਅਜੇਹੇ ਇਕੱਲੇ, ਸਾਰਵਭੌਮ ਏਜੰਟ ਵੱਲ ਇੱਕ ਵੱਡਾ ਕਦਮ ਹੈ ਜੋ ਅਸਲ-ਦੁਨੀਆ ਦੇ ਤਕਨੀਕੀ ਕੰਮ ਦੇ ਪੂਰੇ ਖੇਤਰ ਵਿੱਚ ਰੀਜ਼ਨ ਕਰ ਸਕਦਾ ਹੈ, ਬਣਾਉ ਸਕਦਾ ਹੈ ਅਤੇ ਐਗਜ਼ੀਕਿਊਟ ਕਰ ਸਕਦਾ ਹੈ.
ਜਿਵੇਂ ਮਾਡਲ ਸਮਰੱਥਾਵਾਂ ਹੋਰ ਤਾਕਤਵਰ ਹੁੰਦੀਆਂ ਜਾਂਦੀਆਂ ਹਨ, ਧਿਆਨ ਇਸ ਗੱਲ ਤੋਂ ਹਟ ਕੇ ਕਿ ਏਜੰਟ ਕੀ ਕਰ ਸਕਦੇ ਹਨ, ਇਸ ਵੱਲ ਜਾਂਦਾ ਹੈ ਕਿ ਮਨੁੱਖ ਕਿੰਨੀ ਆਸਾਨੀ ਨਾਲ ਉਹਨਾਂ ਨਾਲ ਸੰਚਾਰ ਕਰ ਸਕਦੇ ਹਨ, ਉਹਨਾਂ ਨੂੰ ਦਿਸ਼ਾ ਦੇ ਸਕਦੇ ਹਨ ਅਤੇ ਸਮਾਂਤਰ ਤੌਰ 'ਤੇ ਕੰਮ ਕਰ ਰਹੇ ਕਈ ਏਜੰਟਾਂ ਦੀ ਦੇਖਭਾਲ ਕਰ ਸਕਦੇ ਹਨ. Codex ਐਪ ਏਜੰਟਾਂ ਨੂੰ ਮੈਨੇਜ ਕਰਨਾ ਅਤੇ ਦਿਸ਼ਾ ਦੇਣਾ ਕਾਫ਼ੀ ਆਸਾਨ ਬਣਾਉਂਦੀ ਹੈ, ਅਤੇ ਹੁਣ GPT‑5.3‑Codex ਨਾਲ ਇਹ ਹੋਰ ਇੰਟਰੈਕਟਿਵ ਹੈ. ਨਵੇਂ ਮਾਡਲ ਨਾਲ, Codex ਵਾਰ-ਵਾਰ ਅੱਪਡੇਟ ਦਿੰਦਾ ਹੈ ਤਾਂ ਜੋ ਤੁਸੀਂ ਇਸ ਦੇ ਕੰਮ ਦੌਰਾਨ ਮੁੱਖ ਫੈਸਲਿਆਂ ਅਤੇ ਤਰੱਕੀ ਤੋਂ ਅਗਾਹ ਰਹੋ. ਅੰਤਿਮ ਆਉਟਪੁੱਟ ਦੀ ਉਡੀਕ ਕਰਨ ਦੀ ਬਜਾਏ, ਤੁਸੀਂ real time ਵਿੱਚ ਸੰਚਾਰ ਕਰ ਸਕਦੇ ਹੋ—ਸਵਾਲ ਪੁੱਛੋ, ਤਰੀਕਿਆਂ 'ਤੇ ਚਰਚਾ ਕਰੋ, ਅਤੇ ਹੱਲ ਵੱਲ ਦਿਸ਼ਾ ਦਿਓ. GPT‑5.3‑Codex ਦੱਸਦਾ ਰਹਿੰਦਾ ਹੈ ਕਿ ਉਹ ਕੀ ਕਰ ਰਿਹਾ ਹੈ, feedback ਦਾ ਜਵਾਬ ਦਿੰਦਾ ਹੈ, ਅਤੇ ਸ਼ੁਰੂ ਤੋਂ ਅੰਤ ਤੱਕ ਤੁਹਾਨੂੰ loop ਵਿੱਚ ਰੱਖਦਾ ਹੈ.
Settings > General > Follow-up behavior ਵਿੱਚ ਐਪ ਵਿੱਚ ਮਾਡਲ ਦੇ ਕੰਮ ਦੌਰਾਨ steering ਯੋਗ ਕਰੋ.
Codex ਵਿੱਚ ਹਾਲੀਆ ਤੇਜ਼ ਸੁਧਾਰ OpenAI ਦੇ ਹਰ ਹਿੱਸੇ ਵਿੱਚ ਮਹੀਨਿਆਂ ਜਾਂ ਸਾਲਾਂ ਤੱਕ ਚਲੇ ਖੋਜ ਪ੍ਰਾਜੈਕਟਾਂ ਦੇ ਨਤੀਜਿਆਂ 'ਤੇ ਅਧਾਰਿਤ ਹਨ. Codex ਇਨ੍ਹਾਂ ਖੋਜ ਪ੍ਰਾਜੈਕਟਾਂ ਨੂੰ ਹੋਰ ਤੇਜ਼ ਕਰ ਰਿਹਾ ਹੈ, ਅਤੇ OpenAI ਦੇ ਕਈ ਖੋਜਕਰਤਾ ਅਤੇ ਇੰਜੀਨੀਅਰ ਅੱਜ ਆਪਣੀ ਨੌਕਰੀ ਨੂੰ ਦੋ ਮਹੀਨੇ ਪਹਿਲਾਂ ਨਾਲੋਂ ਬੁਨਿਆਦੀ ਤੌਰ 'ਤੇ ਵੱਖਰਾ ਦੱਸਦੇ ਹਨ. GPT‑5.3‑Codex ਦੇ ਸ਼ੁਰੂਆਤੀ ਵਰਜਨਾਂ ਨੇ ਵੀ ਅਸਾਧਾਰਣ ਸਮਰੱਥਾਵਾਂ ਦਿਖਾਈਆਂ, ਜਿਸ ਨਾਲ ਸਾਡੀ ਟੀਮ ਨੇ ਉਨ੍ਹਾਂ ਪਹਿਲਾਂ ਦੇ ਵਰਜਨਾਂ ਨਾਲ ਕੰਮ ਕਰਕੇ ਟ੍ਰੇਨਿੰਗ ਸੁਧਾਰੀ ਅਤੇ ਬਾਅਦ ਦੇ ਵਰਜਨਾਂ ਦੀ ਡਿਪਲੌਇਮੈਂਟ ਨੂੰ ਸਹਾਇਤਾ ਦਿੱਤੀ.
Codex ਬਹੁਤ ਵਿਸ਼ਾਲ ਕੰਮ-ਖੇਤਰ ਲਈ ਲਾਭਕਾਰੀ ਹੈ, ਇਸ ਲਈ ਇਹ ਪੂਰੀ ਤਰ੍ਹਾਂ ਗਿਣਨਾ ਕਰਨੀ ਮੁਸ਼ਕਲ ਹੈ ਕਿ ਇਹ ਸਾਡੀਆਂ ਟੀਮਾਂ ਦੀ ਕਿਹੜੇ-ਕਿਹੜੇ ਤਰੀਕਿਆਂ ਨਾਲ ਮਦਦ ਕਰਦਾ ਹੈ. ਕੁਝ ਉਦਾਹਰਨਾਂ ਵਜੋਂ, ਖੋਜ ਟੀਮ ਨੇ ਇਸ ਰਿਲੀਜ਼ ਲਈ ਟ੍ਰੇਨਿੰਗ run ਨੂੰ monitor ਅਤੇ debug ਕਰਨ ਲਈ Codex ਦੀ ਵਰਤੋਂ ਕੀਤੀ. ਇਸ ਨੇ ਕੇਵਲ infrastructure ਸਮੱਸਿਆਵਾਂ ਦੀ debugging ਹੀ ਨਹੀਂ, ਖੋਜ ਨੂੰ ਹੋਰ ਤੇਜ਼ ਕੀਤਾ: ਇਸ ਨੇ ਟ੍ਰੇਨਿੰਗ ਦੌਰਾਨ patterns ਨੂੰ track ਕਰਨ ਵਿੱਚ ਮਦਦ ਕੀਤੀ, interaction quality ਦੀ ਡੂੰਘੀ ਵਿਸ਼ਲੇਸ਼ਣ ਦਿੱਤੀ, fixes ਸੁਝਾਏ ਅਤੇ ਮਨੁੱਖੀ ਖੋਜਕਰਤਿਆਂ ਲਈ ਸਮਰੱਥ ਐਪ ਬਣਾਈਆਂ ਤਾਂ ਜੋ ਉਹ ਸਹੀ ਤਰ੍ਹਾਂ ਸਮਝ ਸਕਣ ਕਿ ਮਾਡਲ ਦਾ ਵਿਹਾਰ ਪਿਛਲੇ ਮਾਡਲਾਂ ਨਾਲੋਂ ਕਿਵੇਂ ਵੱਖਰਾ ਸੀ.
ਇੰਜੀਨੀਅਰਿੰਗ ਟੀਮ ਨੇ GPT‑5.3‑Codex ਲਈ harness ਨੂੰ optimize ਅਤੇ adapt ਕਰਨ ਲਈ Codex ਦੀ ਵਰਤੋਂ ਕੀਤੀ. ਜਦੋਂ ਅਸੀਂ ਅਜਿਹੇ ਅਜੀਬ edge cases ਦੇਖਣ ਲੱਗੇ ਜੋ ਯੂਜ਼ਰਾਂ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰ ਰਹੇ ਸਨ, ਟੀਮ ਮੈਂਬਰਾਂ ਨੇ Codex ਦੀ ਵਰਤੋਂ ਕਰਕੇ context rendering bugs ਦੀ ਪਛਾਣ ਕੀਤੀ ਅਤੇ low cache hit rates ਦੇ root cause ਲੱਭੇ. GPT‑5.3‑Codex ਲਾਂਚ ਦੌਰਾਨ ਵੀ ਟੀਮ ਦੀ ਮਦਦ ਕਰਦਾ ਰਹਿਾ ਹੈ, traffic surges ਦੇ ਅਨੁਸਾਰ GPU clusters ਨੂੰ dynamically scale ਕਰਕੇ ਅਤੇ latency ਨੂੰ ਸਥਿਰ ਰੱਖ ਕੇ.
ਅਲਫ਼ਾ ਟੈਸਟਿੰਗ ਦੌਰਾਨ, ਇੱਕ ਖੋਜਕਰਤਾ ਸਮਝਣਾ ਚਾਹੁੰਦਾ ਸੀ ਕਿ GPT‑5.3‑Codex ਹਰ turn ਵਿੱਚ ਕਿੰਨਾ ਵਾਧੂ ਕੰਮ ਕਰ ਰਿਹਾ ਸੀ ਅਤੇ ਇਸ ਨਾਲ ਉਤਪਾਦਕਤਾ ਵਿੱਚ ਕੀ ਫਰਕ ਪੈ ਰਿਹਾ ਸੀ. GPT‑5.3‑Codex ਨੇ ਸਪਸ਼ਟੀਕਰਨਾਂ ਦੀ ਆਵ੍ਰਿਤੀ, ਸਕਾਰਾਤਮਕ ਅਤੇ ਨਕਾਰਾਤਮਕ ਯੂਜ਼ਰ ਜਵਾਬਾਂ, ਕੰਮ 'ਤੇ ਤਰੱਕੀ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਲਈ ਕੁਝ ਸਧਾਰਣ regex classifiers ਬਣਾਏ, ਫਿਰ ਉਹਨਾਂ ਨੂੰ scalable ਤਰੀਕੇ ਨਾਲ ਸਾਰੇ session logs 'ਤੇ ਚਲਾਇਆ ਅਤੇ ਆਪਣੇ ਨਤੀਜੇ ਨਾਲ ਇੱਕ ਰਿਪੋਰਟ ਤਿਆਰ ਕੀਤੀ. Codex ਨਾਲ ਕੰਮ ਕਰ ਰਹੇ ਲੋਕ ਹੋਰ ਖੁਸ਼ ਸਨ ਕਿਉਂਕਿ ਏਜੰਟ ਉਹਨਾਂ ਦੇ ਇਰਾਦੇ ਨੂੰ ਹੋਰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਸਮਝ ਰਿਹਾ ਸੀ ਅਤੇ ਹਰ turn ਵਿੱਚ ਹੋਰ ਤਰੱਕੀ ਕਰ ਰਿਹਾ ਸੀ, ਘੱਟ ਸਪਸ਼ਟੀਕਰਨ ਵਾਲੇ ਸਵਾਲਾਂ ਨਾਲ.
ਕਿਉਂਕਿ GPT‑5.3‑Codex ਆਪਣੇ ਪੂਰਵਰਤੀਆਂ ਨਾਲੋਂ ਕਾਫ਼ੀ ਵੱਖਰਾ ਸੀ, ਅਲਫ਼ਾ ਟੈਸਟਿੰਗ ਦਾ ਡਾਟਾ ਕਈ ਅਸਾਧਾਰਣ ਅਤੇ ਉਲਟ ਲੱਗਣ ਵਾਲੇ ਨਤੀਜੇ ਦਿਖਾ ਰਿਹਾ ਸੀ. ਟੀਮ ਦੇ ਇੱਕ ਡਾਟਾ ਸਾਇੰਟਿਸਟ ਨੇ GPT‑5.3‑Codex ਨਾਲ ਮਿਲ ਕੇ ਨਵੀਆਂ data pipelines ਬਣਾਈਆਂ ਅਤੇ ਨਤੀਜਿਆਂ ਨੂੰ ਸਾਡੇ ਸਟੈਂਡਰਡ dashboarding tools ਨਾਲੋਂ ਕਾਫ਼ੀ ਹੋਰ ਸਮਰੱਥ ਤਰੀਕੇ ਨਾਲ visualise ਕੀਤਾ. Codex ਨਾਲ ਮਿਲ ਕੇ ਇਨ੍ਹਾਂ ਨਤੀਜਿਆਂ ਦਾ ਸਾਂਝਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ ਗਿਆ, ਜਿਸ ਨੇ ਤਿੰਨ ਮਿੰਟ ਤੋਂ ਘੱਟ ਸਮੇਂ ਵਿੱਚ ਹਜ਼ਾਰਾਂ ਡਾਟਾ ਪੁਆਇੰਟਾਂ ਤੋਂ ਮੁੱਖ insights ਸੰਖੇਪ ਵਿੱਚ ਪੇਸ਼ ਕੀਤੀਆਂ.
ਅਲੱਗ-ਅਲੱਗ ਤੌਰ 'ਤੇ, ਇਹ ਸਾਰੇ ਕੰਮ ਦਿਲਚਸਪ ਉਦਾਹਰਨਾਂ ਹਨ ਕਿ Codex ਖੋਜਕਰਤਿਆਂ ਅਤੇ ਪ੍ਰੋਡਕਟ ਬਣਾਉਣ ਵਾਲਿਆਂ ਦੀ ਕਿਵੇਂ ਮਦਦ ਕਰ ਸਕਦਾ ਹੈ. ਇਕੱਠੇ ਵੇਖਿਆਂ, ਸਾਨੂੰ ਮਿਲਿਆ ਕਿ ਇਨ੍ਹਾਂ ਨਵੀਆਂ ਸਮਰੱਥਾਵਾਂ ਨੇ ਸਾਡੀਆਂ ਖੋਜ, ਇੰਜੀਨੀਅਰਿੰਗ ਅਤੇ ਪ੍ਰੋਡਕਟ ਟੀਮਾਂ ਨੂੰ ਤਾਕਤਵਰ ਗਤੀ ਦਿੱਤੀ.
ਹਾਲੀਆ ਮਹੀਨਿਆਂ ਵਿੱਚ, ਅਸੀਂ ਸਾਇਬਰਸੁਰੱਖਿਆ ਕੰਮਾਂ 'ਤੇ ਮਾਡਲ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਵਾਧੇ ਵੇਖੇ ਹਨ, ਜੋ ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਸੁਰੱਖਿਆ ਪੇਸ਼ੇਵਰਾਂ ਦੋਵਾਂ ਨੂੰ ਲਾਭ ਪਹੁੰਚਾਉਂਦੇ ਹਨ. ਇਸ ਦੇ ਨਾਲ-ਨਾਲ, ਅਸੀਂ ਰੱਖਿਆਤਮਕ ਵਰਤੋਂ ਅਤੇ ਵਿਆਪਕ ecosystem resilience ਨੂੰ ਸਹਾਇਤਾ ਦੇਣ ਲਈ ਮਜ਼ਬੂਤ ਕੀਤੀਆਂ ਸਾਇਬਰ ਸੁਰੱਖਿਆਵਾਂ ਦੀ ਤਿਆਰੀ ਕਰ ਰਹੇ ਹਾਂ.
GPT‑5.3‑Codex ਪਹਿਲਾ ਮਾਡਲ ਹੈ ਜਿਸ ਨੂੰ ਅਸੀਂ ਆਪਣੇ ਪ੍ਰਿਪੇਅਰਡਨੈਸ ਫ੍ਰੇਮਵਰਕ ਅਧੀਨ ਸਾਇਬਰਸੁਰੱਖਿਆ-ਸਬੰਧਤ ਕੰਮਾਂ ਲਈ High capability ਵਜੋਂ ਵਰਗੀਕ੍ਰਿਤ ਕਰਦੇ ਹਾਂ, ਅਤੇ ਇਹ ਪਹਿਲਾ ਮਾਡਲ ਹੈ ਜਿਸ ਨੂੰ ਅਸੀਂ ਸਿੱਧੇ ਤੌਰ 'ਤੇ software vulnerabilities ਦੀ ਪਛਾਣ ਕਰਨ ਲਈ ਟ੍ਰੇਨ ਕੀਤਾ ਹੈ. ਭਾਵੇਂ ਸਾਡੇ ਕੋਲ ਇਹ ਨਿਸ਼ਚਿਤ ਸਬੂਤ ਨਹੀਂ ਕਿ ਇਹ end-to-end ਸਾਇਬਰ ਹਮਲੇ ਆਟੋਮੇਟ ਕਰ ਸਕਦਾ ਹੈ, ਅਸੀਂ ਸਾਵਧਾਨੀਪੂਰਵਕ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਅਪਣਾ ਰਹੇ ਹਾਂ ਅਤੇ ਅੱਜ ਤੱਕ ਦਾ ਸਭ ਤੋਂ ਵਿਆਪਕ ਸਾਇਬਰਸੁਰੱਖਿਆ safety stack ਡਿਪਲੌਇ ਕਰ ਰਹੇ ਹਾਂ. ਸਾਡੀਆਂ mitigation ਵਿੱਚ safety training, automated monitoring, advanced capabilities ਲਈ trusted access, ਅਤੇ threat intelligence ਸਮੇਤ enforcement pipelines ਸ਼ਾਮਲ ਹਨ.
ਕਿਉਂਕਿ ਸਾਇਬਰਸੁਰੱਖਿਆ ਮੂਲ ਤੌਰ 'ਤੇ dual-use ਹੈ, ਅਸੀਂ ਸਬੂਤ-ਆਧਾਰਿਤ, iterative ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਅਪਣਾ ਰਹੇ ਹਾਂ ਜੋ defenders ਦੀ vulnerabilities ਲੱਭਣ ਅਤੇ ਠੀਕ ਕਰਨ ਦੀ ਯੋਗਤਾ ਤੇਜ਼ ਕਰਦਾ ਹੈ ਅਤੇ misuse ਨੂੰ ਹੌਲਾ ਕਰਦਾ ਹੈ. ਇਸ ਦੇ ਹਿੱਸੇ ਵਜੋਂ, ਅਸੀਂ ਸਾਇਬਰ ਡਿਫੈਂਸ ਖੋਜ ਨੂੰ ਤੇਜ਼ ਕਰਨ ਲਈ Trusted Access for Cyber ਸ਼ੁਰੂ ਕਰ ਰਹੇ ਹਾਂ, ਜੋ ਇੱਕ pilot program ਹੈ.
misuse ਨੂੰ ਰੋਕਣ ਵਿੱਚ ਮਦਦ ਲਈ, ਕੁਝ ਬੇਨਤੀਆਂ ਜਿਨ੍ਹਾਂ ਨੂੰ ਸਾਡੇ ਸਿਸਟਮ ਉੱਚ ਸਾਇਬਰ ਜੋਖ਼ਮ ਵਾਲੀਆਂ ਮੰਨਦੇ ਹਨ, ਆਪਣੇ ਆਪ GPT‑5.3‑Codex ਤੋਂ GPT‑5.2 ਵੱਲ reroute ਕੀਤੀਆਂ ਜਾ ਸਕਦੀਆਂ ਹਨ. ਅਸੀਂ ਇਨ੍ਹਾਂ ਸੁਰੱਖਿਆਵਾਂ ਨੂੰ ਹੋਰ ਨਿਖਾਰ ਰਹੇ ਹਾਂ. ਜਿਹੜੇ ਡਿਵੈਲਪਰ security research ਕਰ ਰਹੇ ਹਨ ਜਾਂ ਮੰਨਦੇ ਹਨ ਕਿ ਉਹਨਾਂ ਦੀਆਂ ਬੇਨਤੀਆਂ ਗਲਤ ਵਰਗੀਕ੍ਰਿਤ ਹੋਈਆਂ ਹਨ, ਉਹ ਸਾਡੇ Trusted Access for Cyber program ਰਾਹੀਂ ਪੂਰੀ ਪਹੁੰਚ ਲਈ ਅਰਜ਼ੀ ਦੇ ਸਕਦੇ ਹਨ ਜਾਂ /feedback command ਰਾਹੀਂ ਸਮੱਸਿਆ ਰਿਪੋਰਟ ਕਰ ਸਕਦੇ ਹਨ.
ਅਸੀਂ ecosystem safeguards ਵਿੱਚ ਨਿਵੇਸ਼ ਕਰ ਰਹੇ ਹਾਂ, ਜਿਵੇਂ ਕਿ Aardvark ਦੀ private beta ਦਾ ਵਿਸਥਾਰ. ਇਹ ਸਾਡੇ Codex Security products ਅਤੇ tools ਦੇ suite ਵਿੱਚ ਪਹਿਲੀ ਪੇਸ਼ਕਸ਼ ਵਜੋਂ ਸਾਡਾ security research ਏਜੰਟ ਹੈ. ਅਸੀਂ open-source maintainers ਨਾਲ ਭਾਈਵਾਲੀ ਵੀ ਕਰ ਰਹੇ ਹਾਂ ਤਾਂ ਜੋ Next.js ਵਰਗੇ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਵਰਤੇ ਜਾਂਦੇ ਪ੍ਰਾਜੈਕਟਾਂ ਲਈ ਮੁਫ਼ਤ codebase scanning ਦਿੱਤੀ ਜਾ ਸਕੇ—ਜਿੱਥੇ ਇੱਕ security researcher ਨੇ Codex ਦੀ ਵਰਤੋਂ ਕਰਕੇ vulnerabilities ਲੱਭੀਆਂ ਜੋ ਪਿਛਲੇ ਹਫ਼ਤੇ disclosed(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਕੀਤੀਆਂ ਗਈਆਂ ਸਨ.
2023 ਵਿੱਚ ਸ਼ੁਰੂ ਕੀਤੇ ਸਾਡੇ $1M Cybersecurity Grant Program ਦੇ ਅਧਾਰ 'ਤੇ, ਅਸੀਂ ਸਾਇਬਰ ਡਿਫੈਂਸ ਨੂੰ ਆਪਣੇ ਸਭ ਤੋਂ ਸਮਰੱਥ ਮਾਡਲਾਂ ਨਾਲ ਤੇਜ਼ ਕਰਨ ਲਈ API credits ਵਿੱਚ $10M ਦੇਣ ਦਾ ਵੀ ਵਚਨ ਦੇ ਰਹੇ ਹਾਂ, ਖ਼ਾਸ ਕਰਕੇ open source software ਅਤੇ critical infrastructure systems ਲਈ. ਚੰਗੀ ਨੀਅਤ ਨਾਲ security research ਕਰ ਰਹੀਆਂ ਸੰਸਥਾਵਾਂ ਸਾਡੇ Cybersecurity Grant Program ਰਾਹੀਂ API credits ਅਤੇ ਸਹਾਇਤਾ ਲਈ ਅਰਜ਼ੀ ਦੇ ਸਕਦੀਆਂ ਹਨ.
GPT‑5.3‑Codex ਭੁਗਤਾਨੀ ChatGPT plans ਨਾਲ ਉਪਲਬਧ ਹੈ, ਹਰ ਉਸ ਥਾਂ ਜਿੱਥੇ ਤੁਸੀਂ Codex ਵਰਤ ਸਕਦੇ ਹੋ: ਐਪ, CLI, IDE extension ਅਤੇ web. ਅਸੀਂ ਜਲਦੀ ਹੀ API access ਨੂੰ ਸੁਰੱਖਿਅਤ ਢੰਗ ਨਾਲ ਯੋਗ ਕਰਨ 'ਤੇ ਕੰਮ ਕਰ ਰਹੇ ਹਾਂ.
ਇਸ ਅੱਪਡੇਟ ਨਾਲ, ਅਸੀਂ ਹੁਣ Codex ਯੂਜ਼ਰਾਂ ਲਈ GPT‑5.3‑Codex ਨੂੰ 25% ਤੇਜ਼ ਚਲਾ ਰਹੇ ਹਾਂ, ਸਾਡੇ infrastructure ਅਤੇ inference stack ਵਿੱਚ ਸੁਧਾਰਾਂ ਕਰਕੇ, ਜਿਸ ਨਾਲ ਤੇਜ਼ interactions ਅਤੇ ਤੇਜ਼ ਨਤੀਜੇ ਮਿਲਦੇ ਹਨ.
GPT‑5.3‑Codex ਨੂੰ NVIDIA GB200 NVL72 systems ਲਈ ਸਾਂਝੇ ਤੌਰ 'ਤੇ ਡਿਜ਼ਾਇਨ ਕੀਤਾ ਗਿਆ, ਨਾਲ ਟ੍ਰੇਨ ਕੀਤਾ ਗਿਆ, ਅਤੇ ਉੱਥੇ ਹੀ ਸਰਵ ਕੀਤਾ ਗਿਆ. ਅਸੀਂ NVIDIA ਨਾਲ ਉਹਨਾਂ ਦੀ ਭਾਈਵਾਲੀ ਲਈ ਆਭਾਰੀ ਹਾਂ.
GPT‑5.3‑Codex ਨਾਲ, Codex ਕੋਡ ਲਿਖਣ ਤੋਂ ਅੱਗੇ ਵਧ ਕੇ ਇਸਨੂੰ ਇੱਕ ਟੂਲ ਵਜੋਂ ਵਰਤਦਾ ਹੈ ਤਾਂ ਜੋ ਕੰਪਿਊਟਰ ਚਲਾ ਸਕੇ ਅਤੇ ਕੰਮ ਨੂੰ end to end ਪੂਰਾ ਕਰ ਸਕੇ. ਇੱਕ ਕੋਡਿੰਗ ਏਜੰਟ ਕੀ ਕਰ ਸਕਦਾ ਹੈ ਉਸ ਦੀ ਅਤਿ-ਆਧੁਨਿਕ ਹੱਦ ਨੂੰ ਅੱਗੇ ਧੱਕ ਕੇ, ਅਸੀਂ ਗਿਆਨ-ਕੰਮ ਦੀ ਇੱਕ ਹੋਰ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨੂੰ ਵੀ ਖੋਲ੍ਹ ਰਹੇ ਹਾਂ—ਸਾਫਟਵੇਅਰ ਬਣਾਉਣ ਅਤੇ ਡਿਪਲੌਇ ਕਰਨ ਤੋਂ ਲੈ ਕੇ ਖੋਜ, ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਜਟਿਲ ਕੰਮਾਂ ਨੂੰ ਐਗਜ਼ੀਕਿਊਟ ਕਰਨ ਤੱਕ. ਜੋ ਕੁਝ ਸਭ ਤੋਂ ਵਧੀਆ ਕੋਡਿੰਗ ਏਜੰਟ ਬਣਨ 'ਤੇ ਕੇਂਦ੍ਰਿਤ ਹੋ ਕੇ ਸ਼ੁਰੂ ਹੋਇਆ ਸੀ, ਉਹ ਹੁਣ ਕੰਪਿਊਟਰ 'ਤੇ ਇੱਕ ਹੋਰ ਆਮ ਸਹਿਯੋਗੀ ਦੀ ਬੁਨਿਆਦ ਬਣ ਗਿਆ ਹੈ, ਇਹ ਵਿਸਥਾਰ ਕਰਦੇ ਹੋਏ ਕਿ ਕੌਣ ਬਣਾਉ ਸਕਦਾ ਹੈ ਅਤੇ Codex ਨਾਲ ਕੀ ਸੰਭਵ ਹੈ.
GPT‑5.3‑Codex (xhigh) | GPT‑5.2‑Codex (xhigh) | GPT‑5.2 (xhigh) | |
SWE-Bench Pro (ਪਬਲਿਕ) | 56.8% | 56.4% | 55.6% |
ਟਰਮੀਨਲ-ਬੈਂਚ 2.0 | 77.3% | 64.0% | 62.2% |
OSWorld-Verified | 64.7% | 38.2% | 37.9% |
GDPval (ਜਿੱਤਾਂ ਜਾਂ ਬਰਾਬਰੀ) | 70.9% | - | 70.9% (high) |
Cybersecurity Capture The Flag Challenges | 77.6% | 67.4% | 67.7% |
SWE-Lancer IC Diamond | 81.4% | 76.0% | 74.6% |


