ਮੁੱਖ ਸਮੱਗਰੀ 'ਤੇ ਜਾਓ
OpenAI

19 ਨਵੰਬਰ 2025

ਉਤਪਾਦਰਿਲੀਜ਼

GPT‑5.1‑Codex‑Max ਨਾਲ ਹੋਰ ਬਣਾਓ

$ npm i -g @openai/codex
ਲੋਡ ਹੋ ਰਿਹਾ ਹੈ…

ਪਰਿਚਯ

ਅਸੀਂ GPT‑5.1‑Codex‑Max ਪੇਸ਼ ਕਰ ਰਹੇ ਹਾਂ, ਸਾਡਾ ਨਵਾਂ ਅਤਿ-ਆਧੁਨਿਕ ਏਜੰਟਿਕ ਕੋਡਿੰਗ ਮਾਡਲ, ਜੋ ਅੱਜ Codex ਵਿੱਚ ਉਪਲਬਧ ਹੈ. GPT‑5.1‑Codex‑Max ਸਾਡੇ ਬੁਨਿਆਦੀ ਰੀਜ਼ਨਿੰਗ ਮਾਡਲ ਦੇ ਇਕ ਅਪਡੇਟ 'ਤੇ ਬਣਿਆ ਹੈ, ਜਿਸ ਨੂੰ ਸਾਫਟਵੇਅਰ ਇੰਜੀਨੀਅਰਿੰਗ, ਗਣਿਤ, ਰਿਸਰਚ ਅਤੇ ਹੋਰ ਖੇਤਰਾਂ ਵਿੱਚ ਏਜੰਟਿਕ ਕੰਮਾਂ 'ਤੇ ਟ੍ਰੇਨ ਕੀਤਾ ਗਿਆ ਹੈ. GPT‑5.1‑Codex‑Max ਡਿਵੈਲਪਮੈਂਟ ਸਾਈਕਲ ਦੇ ਹਰ ਪੜਾਅ 'ਤੇ ਹੋਰ ਤੇਜ਼, ਹੋਰ ਬੁੱਧਿਮਾਨ ਅਤੇ ਹੋਰ ਟੋਕਨ-ਕੁਸ਼ਲ ਹੈ, ਅਤੇ ਇੱਕ ਭਰੋਸੇਯੋਗ ਕੋਡਿੰਗ ਸਾਥੀ ਬਣਨ ਵੱਲ ਨਵਾਂ ਕਦਮ ਹੈ.

GPT‑5.1‑Codex‑Max ਲੰਬੇ ਸਮੇਂ ਚੱਲਣ ਵਾਲੇ, ਵਿਸਤ੍ਰਿਤ ਕੰਮ ਲਈ ਬਣਾਇਆ ਗਿਆ ਹੈ. ਇਹ ਸਾਡਾ ਪਹਿਲਾ ਮਾਡਲ ਹੈ ਜਿਸ ਨੂੰ compaction ਨਾਮਕ ਪ੍ਰਕਿਰਿਆ ਰਾਹੀਂ ਕਈ context windows ਵਿੱਚ ਮੂਲ ਤੌਰ 'ਤੇ ਕੰਮ ਕਰਨ ਲਈ ਟ੍ਰੇਨ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਇੱਕੋ ਕੰਮ ਵਿੱਚ ਮਿਲੀਅਨਾਂ ਟੋਕਨਾਂ 'ਤੇ ਸੰਗਠਿਤ ਢੰਗ ਨਾਲ ਕੰਮ ਕਰਦਾ ਹੈ. ਇਸ ਨਾਲ ਪ੍ਰੋਜੈਕਟ-ਪੱਧਰੀ ਰੀਫੈਕਟਰ, ਡੂੰਘੀਆਂ ਡੀਬੱਗਿੰਗ ਸੈਸ਼ਨਾਂ ਅਤੇ ਕਈ ਘੰਟਿਆਂ ਵਾਲੇ ਏਜੰਟ ਲੂਪ ਸੰਭਵ ਹੁੰਦੇ ਹਨ.

GPT‑5.1‑Codex‑Max ਅੱਜ Codex ਵਿੱਚ CLI, IDE extension, cloud ਅਤੇ code review ਲਈ ਉਪਲਬਧ ਹੈ, ਅਤੇ API ਐਕਸੈੱਸ ਜਲਦੀ ਆ ਰਹੀ ਹੈ.

ਅਤਿ-ਆਧੁਨਿਕ ਕੋਡਿੰਗ ਸਮਰੱਥਾਵਾਂ

GPT‑5.1‑Codex‑Max ਨੂੰ PR ਬਣਾਉਣ, code review, frontend coding, ਅਤੇ Q&A ਵਰਗੇ ਅਸਲੀ ਦੁਨੀਆ ਦੇ ਸਾਫਟਵੇਅਰ ਇੰਜੀਨੀਅਰਿੰਗ ਕੰਮਾਂ 'ਤੇ ਟ੍ਰੇਨ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ ਇਹ ਕਈ ਅਤਿ-ਆਧੁਨਿਕ ਕੋਡਿੰਗ ਮੁਲਾਂਕਣਾਂ ਵਿੱਚ ਸਾਡੇ ਪਿਛਲੇ ਮਾਡਲਾਂ ਤੋਂ ਬਿਹਤਰ ਹੈ. ਬੈਂਚਮਾਰਕਾਂ 'ਤੇ ਮਾਡਲ ਦੇ ਸੁਧਾਰ ਅਸਲੀ ਵਰਤੋਂ ਵਿੱਚ ਵੀ ਨਜ਼ਰ ਆਉਂਦੇ ਹਨ: GPT‑5.1‑Codex‑Max ਸਾਡਾ ਪਹਿਲਾ ਮਾਡਲ ਹੈ ਜਿਸ ਨੂੰ Windows environments ਵਿੱਚ ਕੰਮ ਕਰਨ ਲਈ ਟ੍ਰੇਨ ਕੀਤਾ ਗਿਆ ਹੈ, ਅਤੇ ਹੁਣ ਮਾਡਲ ਦੀ ਟ੍ਰੇਨਿੰਗ ਵਿੱਚ ਇਸ ਨੂੰ Codex CLI ਵਿੱਚ ਹੋਰ ਵਧੀਆ ਸਹਿਯੋਗੀ ਬਣਾਉਣ ਲਈ ਤਿਆਰ ਕੀਤੇ ਕੰਮ ਵੀ ਸ਼ਾਮਲ ਹਨ.

* ਸਾਰੇ evals Extra High reasoning effort 'ਤੇ compaction enabled ਨਾਲ ਚਲਾਏ ਗਏ ਸਨ.
* Terminal-Bench2.0
Laude Institute Harbor harness(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵਿੱਚ Codex CLI ਨਾਲ ਚਲਾਇਆ ਗਿਆ ਸੀ.

ਗਤੀ ਅਤੇ ਲਾਗਤ

GPT‑5.1‑Codex‑Max ਹੋਰ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਰੀਜ਼ਨਿੰਗ ਕਾਰਨ ਟੋਕਨ ਕੁਸ਼ਲਤਾ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਦਿਖਾਉਂਦਾ ਹੈ. SWE-bench Verified 'ਤੇ, ‘medium’ ਰੀਜ਼ਨਿੰਗ effort ਨਾਲ GPT‑5.1‑Codex‑Max ਉਹੀ ਰੀਜ਼ਨਿੰਗ effort ਵਾਲੇ GPT‑5.1‑Codex ਨਾਲੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ, ਜਦਕਿ 30% ਘੱਟ thinking tokens ਵਰਤਦਾ ਹੈ. ਉਹਨਾਂ ਕੰਮਾਂ ਲਈ ਜੋ latency-sensitive ਨਹੀਂ ਹਨ, ਅਸੀਂ ਇੱਕ ਨਵਾਂ Extra High (‘xhigh’) ਰੀਜ਼ਨਿੰਗ effort ਵੀ ਪੇਸ਼ ਕਰ ਰਹੇ ਹਾਂ, ਜੋ ਹੋਰ ਵਧੀਆ ਜਵਾਬ ਲਈ ਹੋਰ ਲੰਮੇ ਸਮੇਂ ਤੱਕ ਸੋਚਦਾ ਹੈ. ਫਿਰ ਵੀ, ਅਸੀਂ ਜ਼ਿਆਦਾਤਰ ਕੰਮਾਂ ਲਈ medium ਨੂੰ ਰੋਜ਼ਾਨਾ ਵਰਤੋਂ ਲਈ ਸਿਫਾਰਸ਼ ਕਰਦੇ ਹਾਂ.

ਸਾਨੂੰ ਉਮੀਦ ਹੈ ਕਿ ਟੋਕਨ ਕੁਸ਼ਲਤਾ ਦੇ ਇਹ ਸੁਧਾਰ ਡਿਵੈਲਪਰਾਂ ਲਈ ਅਸਲੀ ਬਚਤ ਵਿੱਚ ਬਦਲਣਗੇ.

ਉਦਾਹਰਨ ਲਈ, GPT‑5.1‑Codex‑Max ਸਮਾਨ ਫੰਕਸ਼ਨਾਲਿਟੀ ਅਤੇ ਸੁੰਦਰਤਾ ਨਾਲ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ frontend designs ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ, ਪਰ GPT‑5.1‑Codex ਨਾਲੋਂ ਕਾਫ਼ੀ ਘੱਟ ਲਾਗਤ 'ਤੇ.

ਪ੍ਰੌੰਪਟ: ਇੱਕ ਇਕੱਲਾ self-contained ਬ੍ਰਾਊਜ਼ਰ ਐਪ ਬਣਾਓ ਜੋ canvas graphics, ਇੱਕ tiny policy-gradient controller, metrics, ਅਤੇ ਇੱਕ SVG network visualizer ਨਾਲ ਇੱਕ ਇੰਟਰਐਕਟਿਵ CartPole RL sandbox ਰੈਂਡਰ ਕਰੇ.

ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ

  • ਅਸਲ ਵਿੱਚ policy ਨੂੰ train ਕਰ ਸਕੇ ਤਾਂ ਜੋ ਮਾਡਲ cart pole 'ਤੇ ਬਿਹਤਰ ਹੋਵੇ.
  • ਜਦੋਂ ਮਾਡਲ training ਕਰ ਰਿਹਾ ਹੋਵੇ ਜਾਂ inference 'ਤੇ ਹੋਵੇ, activations/weights ਲਈ visualizer.
  • ਇਸ episode ਵਿੱਚ steps, rewards.
  • steps ਵਿੱਚ last survival time ਅਤੇ best survival time.

index.html ਵਿੱਚ ਸੰਭਾਲੋ.

ਲੰਬੇ ਸਮੇਂ ਚੱਲਣ ਵਾਲੇ ਕੰਮ

Compaction GPT‑5.1‑Codex‑Max ਨੂੰ ਉਹ ਕੰਮ ਪੂਰੇ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ ਜੋ ਪਹਿਲਾਂ context-window ਸੀਮਾਵਾਂ ਕਾਰਨ ਅਸਫਲ ਹੋ ਜਾਂਦੇ ਸਨ, ਜਿਵੇਂ ਕਿ ਜਟਿਲ ਰੀਫੈਕਟਰ ਅਤੇ ਲੰਬੇ ਸਮੇਂ ਚੱਲਣ ਵਾਲੇ ਏਜੰਟ ਲੂਪ, ਕਿਉਂਕਿ ਇਹ ਆਪਣੇ ਇਤਿਹਾਸ ਨੂੰ ਛਾਂਟਦਿਆਂ ਲੰਬੇ ਅੰਤਰਾਲਾਂ ਵਿੱਚ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਸੰਦਰਭ ਨੂੰ ਸੰਭਾਲਦਾ ਹੈ. Codex ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ, GPT‑5.1‑Codex‑Max ਆਪਣੀ context window ਸੀਮਾ ਦੇ ਨੇੜੇ ਪਹੁੰਚਣ 'ਤੇ ਆਪਣੇ ਸੈਸ਼ਨ ਨੂੰ ਆਪਣੇ ਆਪ ਸੰਕੁਚਿਤ ਕਰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਇਸ ਨੂੰ ਇੱਕ ਨਵੀਂ context window ਮਿਲਦੀ ਹੈ. ਇਹ ਇਸ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਤਦ ਤੱਕ ਦੁਹਰਾਉਂਦਾ ਹੈ ਜਦ ਤੱਕ ਕੰਮ ਪੂਰਾ ਨਹੀਂ ਹੋ ਜਾਂਦਾ.

ਲੰਬੇ ਅੰਤਰਾਲਾਂ ਵਿੱਚ ਸੰਗਠਿਤ ਕੰਮ ਕਾਇਮ ਰੱਖਣ ਦੀ ਸਮਰੱਥਾ, ਹੋਰ ਆਮ ਅਤੇ ਭਰੋਸੇਯੋਗ AI ਸਿਸਟਮਾਂ ਵੱਲ ਜਾਣ ਦੇ ਰਸਤੇ 'ਤੇ ਇਕ ਬੁਨਿਆਦੀ ਸਮਰੱਥਾ ਹੈ. GPT‑5.1‑Codex‑Max ਘੰਟਿਆਂ ਤੱਕ ਖੁਦਮੁਖਤਿਆਰ ਢੰਗ ਨਾਲ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ. ਸਾਡੇ ਅੰਦਰੂਨੀ ਮੁਲਾਂਕਣਾਂ ਵਿੱਚ, ਅਸੀਂ GPT‑5.1‑Codex‑Max ਨੂੰ 24 ਘੰਟਿਆਂ ਤੋਂ ਵੱਧ ਸਮੇਂ ਲਈ ਕੰਮ ਕਰਦੇ ਦੇਖਿਆ ਹੈ. ਇਹ ਆਪਣੇ implementation 'ਤੇ ਲਗਾਤਾਰ ਦੁਹਰਾਵਾ ਕਰੇਗਾ, test failures ਠੀਕ ਕਰੇਗਾ, ਅਤੇ ਆਖਿਰਕਾਰ ਸਫਲ ਨਤੀਜਾ ਦੇਵੇਗਾ.

ਇਸ ਉਦਾਹਰਨ ਵਿੱਚ, GPT‑5.1‑Codex‑Max ਖੁਦ Codex CLI ਓਪਨ ਸੋਰਸ ਰਿਪੋਜ਼ਟਰੀ ਨੂੰ ਰੀਫੈਕਟਰ ਕਰ ਰਿਹਾ ਹੈ.

ਜਿਵੇਂ ਸੈਸ਼ਨ ਦੀ ਲੰਬਾਈ ਮਾਡਲ ਦੀ context-window ਦੇ ਨੇੜੇ ਪਹੁੰਚਦੀ ਹੈ, ਇਹ ਆਪਣੀ ਤਰੱਕੀ ਗੁਆਏ ਬਿਨਾਂ ਕੰਮ ਜਾਰੀ ਰੱਖਣ ਲਈ ਥਾਂ ਖਾਲੀ ਕਰਨ ਵਾਸਤੇ ਸੈਸ਼ਨ ਨੂੰ ਆਪਣੇ ਆਪ ਸੰਕੁਚਿਤ ਕਰਦਾ ਹੈ.

ਸਪਸ਼ਟਤਾ ਲਈ ਵੀਡੀਓ ਨੂੰ ਕੱਟਿਆ ਅਤੇ ਤੇਜ਼ ਕੀਤਾ ਗਿਆ ਹੈ.

ਸੁਰੱਖਿਅਤ ਅਤੇ ਭਰੋਸੇਯੋਗ AI ਏਜੰਟ ਬਣਾਉਣਾ

GPT‑5.1‑Codex‑Max ਉਹਨਾਂ ਮੁਲਾਂਕਣਾਂ ਵਿੱਚ ਕਾਫ਼ੀ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਲੰਬੇ ਅੰਤਰਾਲ ਵਾਲੀ ਲਗਾਤਾਰ ਰੀਜ਼ਨਿੰਗ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ. ਕਿਉਂਕਿ ਇਹ compaction ਵਰਤ ਕੇ ਕਈ context windows ਵਿੱਚ ਸੰਗਠਿਤ ਢੰਗ ਨਾਲ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ, ਮਾਡਲ long-horizon coding ਅਤੇ cybersecurity ਵਰਗੇ ਖੇਤਰਾਂ ਦੀਆਂ ਚੁਣੌਤੀਆਂ ਵਿੱਚ ਸੁਧਰੇ ਨਤੀਜੇ ਦਿੰਦਾ ਹੈ. ਅਸੀਂ GPT‑5.1‑Codex‑Max ਸਿਸਟਮ ਕਾਰਡ ਵਿੱਚ ਪਹਿਲੇ ਅਤੇ ਤੀਜੇ ਪੱਖ ਦੇ ਮੁਲਾਂਕਣਾਂ 'ਤੇ ਇਸ ਮਾਡਲ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਨਤੀਜਿਆਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ ਹੈ.

ਸਾਡੇ ਪ੍ਰਿਪੇਅਰਡਨੈਸ ਫ੍ਰੇਮਵਰਕ ਤਹਿਤ GPT‑5.1‑Codex‑Max Cybersecurity 'ਤੇ High capability ਤੱਕ ਨਹੀਂ ਪਹੁੰਚਦਾ, ਪਰ ਇਹ ਅੱਜ ਤੱਕ ਸਾਡਾ ਸਭ ਤੋਂ ਸਮਰੱਥ cybersecurity ਮਾਡਲ ਹੈ ਅਤੇ ਏਜੰਟਿਕ cybersecurity ਸਮਰੱਥਾਵਾਂ ਤੇਜ਼ੀ ਨਾਲ ਵਿਕਸਿਤ ਹੋ ਰਹੀਆਂ ਹਨ. ਇਸ ਲਈ, ਅਸੀਂ Cybersecurity 'ਤੇ High capability ਲਈ ਤਿਆਰੀ ਦੇ ਕਦਮ ਚੁੱਕ ਰਹੇ ਹਾਂ, cyber ਖੇਤਰ ਵਿੱਚ ਆਪਣੇ ਸੁਰੱਖਿਆ ਉਪਾਇਆ ਨੂੰ ਮਜ਼ਬੂਤ ਕਰ ਰਹੇ ਹਾਂ, ਅਤੇ Aardvark ਵਰਗੇ ਪ੍ਰੋਗਰਾਮਾਂ ਰਾਹੀਂ ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਕੰਮ ਕਰ ਰਹੇ ਹਾਂ ਕਿ ਰੱਖਿਆਕਰਤਾ ਇਨ੍ਹਾਂ ਸੁਧਰੀਆਂ ਸਮਰੱਥਾਵਾਂ ਤੋਂ ਲਾਭ ਲੈ ਸਕਣ.

ਜਦੋਂ ਅਸੀਂ GPT‑5‑Codex ਲਾਂਚ ਕੀਤਾ, ਅਸੀਂ ਦੁਰਾਭਾਵਨਾਪੂਰਣ ਗਤੀਵਿਧੀ ਦੀ ਪਛਾਣ ਅਤੇ ਰੋਕਥਾਮ ਲਈ ਖਾਸ cybersecurity-ਕੇਂਦਰਤ ਨਿਗਰਾਨੀ ਲਾਗੂ ਕੀਤੀ. ਹਾਲਾਂਕਿ ਅਸੀਂ ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਦੁਰਵਰਤੋਂ ਵਿੱਚ ਕੋਈ ਅਰਥਪੂਰਨ ਵਾਧਾ ਨਹੀਂ ਦੇਖਿਆ, ਅਸੀਂ ਉੱਨਤ ਸਮਰੱਥਾਵਾਂ ਲਈ ਵਾਧੂ mitigations ਤਿਆਰ ਕਰ ਰਹੇ ਹਾਂ. ਸਾਡੀਆਂ ਟੀਮਾਂ ਪਹਿਲਾਂ ਹੀ ਸਾਡੇ ਮਾਡਲਾਂ ਦੀ ਗਲਤ ਵਰਤੋਂ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੀਆਂ cyber operations ਨੂੰ ਵਿਘਟਿਤ ਕਰ ਚੁੱਕੀਆਂ ਹਨ, ਅਤੇ ਸ਼ੱਕੀ ਗਤੀਵਿਧੀ ਨੂੰ ਸਾਡੀਆਂ policy monitoring systems ਰਾਹੀਂ ਸਮੀਖਿਆ ਲਈ ਭੇਜਿਆ ਜਾਂਦਾ ਹੈ.

Codex ਮੂਲ ਰੂਪ ਵਿੱਚ ਇੱਕ ਸੁਰੱਖਿਅਤ sandbox ਵਿੱਚ ਚਲਾਉਣ ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੈ: file writes ਇਸਦੇ ਵਰਕਸਪੇਸ ਤੱਕ ਸੀਮਿਤ ਹਨ, ਅਤੇ network access ਤਦ ਤੱਕ ਬੰਦ ਰਹਿੰਦੀ ਹੈ ਜਦ ਤੱਕ ਡਿਵੈਲਪਰ ਇਸਨੂੰ ਚਾਲੂ ਨਾ ਕਰੇ. ਅਸੀਂ Codex ਨੂੰ ਇਸ restricted-access mode ਵਿੱਚ ਹੀ ਰੱਖਣ ਦੀ ਸਿਫਾਰਸ਼ ਕਰਦੇ ਹਾਂ, ਕਿਉਂਕਿ internet ਜਾਂ web search ਚਾਲੂ ਕਰਨ ਨਾਲ ਅਣਭਰੋਸੇਯੋਗ ਸਮੱਗਰੀ ਤੋਂ prompt-injection ਖਤਰੇ ਆ ਸਕਦੇ ਹਨ.

ਜਿਵੇਂ Codex ਲੰਬੇ ਸਮੇਂ ਚੱਲਣ ਵਾਲੇ ਕੰਮਾਂ ਵਿੱਚ ਹੋਰ ਸਮਰੱਥ ਬਣਦਾ ਜਾ ਰਿਹਾ ਹੈ, ਤਿਵੇਂ ਬਦਲਾਅ ਕਰਨ ਜਾਂ production ਵਿੱਚ ਡਿਪਲੋਇ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਡਿਵੈਲਪਰਾਂ ਲਈ ਏਜੰਟ ਦੇ ਕੰਮ ਦੀ ਸਮੀਖਿਆ ਕਰਨਾ ਹੋਰ ਮਹੱਤਵਪੂਰਨ ਬਣ ਜਾਂਦਾ ਹੈ. ਇਸ ਵਿੱਚ ਮਦਦ ਲਈ, Codex terminal logs ਤਿਆਰ ਕਰਦਾ ਹੈ ਅਤੇ ਆਪਣੀਆਂ tool calls ਅਤੇ test results ਦਾ ਹਵਾਲਾ ਦਿੰਦਾ ਹੈ. ਹਾਲਾਂਕਿ ਇਸ ਦੀਆਂ code reviews ਮਾਡਲ ਜਾਂ ਮਨੁੱਖ ਦੁਆਰਾ ਬਣਾਈਆਂ bugs ਨੂੰ production ਵਿੱਚ ਡਿਪਲੋਇ ਕਰਨ ਦੇ ਖਤਰੇ ਨੂੰ ਘਟਾਉਂਦੀਆਂ ਹਨ, Codex ਨੂੰ ਇੱਕ ਵਾਧੂ reviewer ਵਜੋਂ ਹੀ ਦੇਖਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ, ਮਨੁੱਖੀ reviews ਦੇ ਬਦਲ ਵਜੋਂ ਨਹੀਂ.

Cybersecurity ਸਮਰੱਥਾਵਾਂ ਰੱਖਿਆ ਅਤੇ ਹਮਲੇ ਦੋਹਾਂ ਲਈ ਵਰਤੀਆਂ ਜਾ ਸਕਦੀਆਂ ਹਨ, ਇਸ ਲਈ ਅਸੀਂ iterative deployment ਪਹੁੰਚ ਅਪਣਾਉਂਦੇ ਹਾਂ: ਅਸਲੀ ਵਰਤੋਂ ਤੋਂ ਸਿੱਖਣਾ, safeguards ਅਪਡੇਟ ਕਰਨਾ, ਅਤੇ automated vulnerability scanning ਅਤੇ remediation assistance ਵਰਗੇ ਮਹੱਤਵਪੂਰਨ ਰੱਖਿਆਕਾਰੀ ਸੰਦਾਂ ਨੂੰ ਕਾਇਮ ਰੱਖਣਾ.

ਉਪਲਬਧਤਾ

GPT‑5.1‑Codex‑Max Codex ਵਿੱਚ ChatGPT Plus, Pro, Business, Edu ਅਤੇ Enterprise ਪਲਾਨਾਂ ਨਾਲ ਉਪਲਬਧ ਹੈ. ਤੁਹਾਡੇ ਪਲਾਨ ਲਈ ਵਰਤੋਂ ਦੀਆਂ ਸੀਮਾਵਾਂ ਕਿਵੇਂ ਕੰਮ ਕਰਦੀਆਂ ਹਨ, ਇਸ ਦੇ ਵੇਰਵੇ ਲਈ ਕਿਰਪਾ ਕਰਕੇ ਸਾਡੇ ਦਸਤਾਵੇਜ਼(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵੇਖੋ.

ਉਹ ਡਿਵੈਲਪਰ ਜੋ API key ਰਾਹੀਂ Codex CLI ਵਰਤਦੇ ਹਨ, ਉਨ੍ਹਾਂ ਲਈ ਅਸੀਂ GPT‑5.1‑Codex‑Max ਨੂੰ ਜਲਦੀ ਹੀ API ਵਿੱਚ ਉਪਲਬਧ ਕਰਵਾਉਣ ਦੀ ਯੋਜਨਾ ਬਣਾਈ ਹੈ.

ਅੱਜ ਤੋਂ, GPT‑5.1‑Codex‑Max Codex surfaces ਵਿੱਚ ਡਿਫਾਲਟ ਮਾਡਲ ਵਜੋਂ GPT‑5.1‑Codex ਦੀ ਥਾਂ ਲਏਗਾ. GPT‑5.1 ਤੋਂ ਵੱਖਰਾ, ਜੋ ਇੱਕ general-purpose ਮਾਡਲ ਹੈ, ਅਸੀਂ GPT‑5.1‑Codex‑Max ਅਤੇ Codex ਮਾਡਲ ਪਰਿਵਾਰ ਨੂੰ ਸਿਰਫ਼ Codex ਜਾਂ Codex-ਜਿਹੇ environments ਵਿੱਚ ਏਜੰਟਿਕ ਕੋਡਿੰਗ ਕੰਮਾਂ ਲਈ ਵਰਤਣ ਦੀ ਸਿਫਾਰਸ਼ ਕਰਦੇ ਹਾਂ.

ਨਿਸਕਰਸ਼

GPT‑5.1‑Codex‑Max ਦਿਖਾਉਂਦਾ ਹੈ ਕਿ ਮਾਡਲ ਲੰਬੇ ਅੰਤਰਾਲ ਵਾਲੇ ਕੋਡਿੰਗ ਕੰਮਾਂ ਨੂੰ ਕਾਇਮ ਰੱਖਣ, ਜਟਿਲ workflow ਮੈਨੇਜ ਕਰਨ, ਅਤੇ ਬਹੁਤ ਘੱਟ ਟੋਕਨਾਂ ਨਾਲ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੀਆਂ implementations ਤਿਆਰ ਕਰਨ ਵਿੱਚ ਕਿੰਨੇ ਅੱਗੇ ਆ ਗਏ ਹਨ. ਅਸੀਂ ਵੇਖਿਆ ਹੈ ਕਿ ਸਾਡੇ CLI, IDE extension, cloud integration, ਅਤੇ code review tooling ਵਿੱਚ ਲਗਾਤਾਰ upgrades ਨਾਲ ਮਿਲ ਕੇ ਇਸ ਮਾਡਲ ਨੇ ਇੰਜੀਨੀਅਰਿੰਗ ਉਤਪਾਦਕਤਾ ਨੂੰ ਬਹੁਤ ਤੇਜ਼ ਕੀਤਾ ਹੈ: ਅੰਦਰੂਨੀ ਤੌਰ 'ਤੇ, OpenAI ਦੇ 95% ਇੰਜੀਨੀਅਰ ਹਫ਼ਤਾਵਾਰ Codex ਵਰਤਦੇ ਹਨ, ਅਤੇ Codex ਅਪਣਾਉਣ ਤੋਂ ਬਾਅਦ ਇਹ ਇੰਜੀਨੀਅਰ ਲਗਭਗ 70% ਵੱਧ ਪੁੱਲ ਰਿਕਵੈਸਟ ਭੇਜ ਰਹੇ ਹਨ. ਜਿਵੇਂ ਅਸੀਂ ਏਜੰਟਾਂ ਦੀ ਸਮਰੱਥਾ ਦੀ ਅਤਿ-ਆਧੁਨਿਕ ਸੀਮਾ ਨੂੰ ਅੱਗੇ ਧੱਕਦੇ ਹਾਂ, ਅਸੀਂ ਇਹ ਦੇਖਣ ਲਈ ਉਤਸ਼ਾਹਿਤ ਹਾਂ ਕਿ ਤੁਸੀਂ ਇਨ੍ਹਾਂ ਨਾਲ ਕੀ ਬਣਾਓਗੇ.

ਐਪੈਂਡਿਕਸ: ਮਾਡਲ ਮੁਲਾਂਕਣ

GPT‑5.1‑Codex (high)

GPT‑5.1‑Codex‑Max (xhigh)

SWE-bench Verified (n=500)

73.7%

77.9%

SWE-Lancer IC SWE

66.3%

79.9%

Terminal-Bench 2.0

52.8%

58.1%

ਲੇਖਕ

OpenAI