ਡਿਵੈਲਪਰਾਂ ਲਈ GPT‑5.1 ਪੇਸ਼ ਕਰਦੇ ਹਾਂ
ਅੱਜ ਅਸੀਂ API ਪਲੇਟਫਾਰਮ ਵਿੱਚ GPT‑5.1 ਜਾਰੀ ਕਰ ਰਹੇ ਹਾਂ, ਜੋ GPT‑5 ਸਿਰੀਜ਼ ਦਾ ਅਗਲਾ ਮਾਡਲ ਹੈ ਅਤੇ ਏਜੰਟਿਕ ਅਤੇ ਕੋਡਿੰਗ ਕੰਮਾਂ ਦੀ ਵਿਸ਼ਾਲ ਰੇਂਜ ਲਈ ਬੁੱਧੀਮੱਤਾ ਅਤੇ ਗਤੀ ਵਿੱਚ ਸੰਤੁਲਨ ਰੱਖਦਾ ਹੈ। GPT‑5.1 ਕੰਮ ਦੀ ਜਟਿਲਤਾ ਦੇ ਆਧਾਰ 'ਤੇ ਇਹ ਗਤੀਸ਼ੀਲ ਤੌਰ 'ਤੇ ਅਨੁਕੂਲ ਕਰਦਾ ਹੈ ਕਿ ਇਹ ਸੋਚਣ 'ਤੇ ਕਿੰਨਾ ਸਮਾਂ ਲਗਾਉਂਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਮਾਡਲ ਸਧਾਰਣ ਰੋਜ਼ਾਨਾ ਦੇ ਕੰਮਾਂ 'ਤੇ ਕਾਫ਼ੀ ਤੇਜ਼ ਅਤੇ ਹੋਰ ਟੋਕਨ-ਕੁਸ਼ਲ ਬਣਦਾ ਹੈ। ਮਾਡਲ ਵਿੱਚ ਇੱਕ “ਬਿਨਾ ਰੀਜ਼ਨਿੰਗ” ਮੋਡ ਵੀ ਹੈ, ਤਾਂ ਜੋ ਉਹਨਾਂ ਕੰਮਾਂ 'ਤੇ ਤੇਜ਼ੀ ਨਾਲ ਜਵਾਬ ਦਿੱਤਾ ਜਾ ਸਕੇ ਜਿਨ੍ਹਾਂ ਲਈ ਡੂੰਘੀ ਸੋਚ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ, ਅਤੇ ਨਾਲ ਹੀ GPT‑5.1 ਦੀ ਅਤਿ-ਆਧੁਨਿਕ ਬੁੱਧੀਮੱਤਾ ਬਣੀ ਰਹੇ।
GPT‑5.1 ਨੂੰ ਹੋਰ ਵੀ ਕੁਸ਼ਲ ਬਣਾਉਣ ਲਈ, ਅਸੀਂ 24 ਘੰਟਿਆਂ ਤੱਕ ਕੈਸ਼ ਰਿਟੈਂਸ਼ਨ ਵਾਲੀ ਵਧਾਈ ਗਈ ਪ੍ਰੌੰਪਟ ਕੈਸ਼ਿੰਗ ਜਾਰੀ ਕਰ ਰਹੇ ਹਾਂ, ਜਿਸ ਨਾਲ ਘੱਟ ਲਾਗਤ 'ਤੇ ਫਾਲੋ-ਅੱਪ ਸਵਾਲਾਂ ਲਈ ਤੇਜ਼ ਜਵਾਬ ਮਿਲਦੇ ਹਨ। ਸਾਡੇ Priority Processing(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਗਾਹਕ ਵੀ GPT‑5 ਦੇ ਮੁਕਾਬਲੇ GPT‑5.1 ਨਾਲ ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ ਤੇਜ਼ ਕਾਰਗੁਜ਼ਾਰੀ ਦਾ ਅਨੁਭਵ ਕਰਨਗੇ।
ਕੋਡਿੰਗ ਲਈ, ਅਸੀਂ Cursor, Cognition, Augment Code, Factory, ਅਤੇ Warp ਵਰਗੀਆਂ ਸਟਾਰਟਅੱਪਸ ਨਾਲ ਨੇੜੇ ਤੋਂ ਕੰਮ ਕੀਤਾ ਹੈ ਤਾਂ ਜੋ GPT‑5.1 ਦੀ ਕੋਡਿੰਗ ਸ਼ਖਸੀਅਤ, steerability, ਅਤੇ ਕੋਡ ਗੁਣਵੱਤਾ ਵਿੱਚ ਸੁਧਾਰ ਕੀਤਾ ਜਾ ਸਕੇ। ਆਮ ਤੌਰ 'ਤੇ, GPT‑5.1 ਕੋਡਿੰਗ ਲਈ ਵਰਤਣ ਵਿੱਚ ਹੋਰ ਸਹਿਜ ਮਹਿਸੂਸ ਹੁੰਦਾ ਹੈ ਅਤੇ ਕੰਮ ਪੂਰੇ ਕਰਦੇ ਸਮੇਂ ਯੂਜ਼ਰ-ਸਾਮ੍ਹਣੇ ਅੱਪਡੇਟਾਂ ਨਾਲ ਹੋਰ ਸੰਚਾਰਕ ਹੈ।
ਅੰਤ ਵਿੱਚ, ਅਸੀਂ GPT‑5.1 ਨਾਲ ਦੋ ਨਵੇਂ ਟੂਲ ਪੇਸ਼ ਕਰ ਰਹੇ ਹਾਂ: ਇੱਕ apply_patch ਟੂਲ ਜੋ ਕੋਡ ਨੂੰ ਹੋਰ ਭਰੋਸੇਯੋਗ ਢੰਗ ਨਾਲ ਸੋਧਣ ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ ਇੱਕ shell ਟੂਲ ਜੋ ਮਾਡਲ ਨੂੰ shell ਕਮਾਂਡਾਂ ਚਲਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ।
GPT‑5.1 GPT‑5 ਸਿਰੀਜ਼ ਵਿੱਚ ਅਗਲਾ ਉਨੱਤੀਕਰਨ ਹੈ, ਅਤੇ ਅਸੀਂ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਭਰੋਸੇਯੋਗ ਏਜੰਟਿਕ ਵਰਕਫ਼ਲੋ ਬਣਾਉਣ ਵਿੱਚ ਮਦਦ ਲਈ ਹੋਰ ਬੁੱਧੀਮਾਨ ਅਤੇ ਸਮਰੱਥ ਮਾਡਲਾਂ ਵਿੱਚ ਨਿਵੇਸ਼ ਜਾਰੀ ਰੱਖਣ ਦੀ ਯੋਜਨਾ ਰੱਖਦੇ ਹਾਂ।
GPT‑5.1 ਨੂੰ ਹੋਰ ਤੇਜ਼ ਬਣਾਉਣ ਲਈ, ਅਸੀਂ ਇਸਨੂੰ ਸੋਚਣ ਲਈ ਟ੍ਰੇਨ ਕਰਨ ਦੇ ਤਰੀਕੇ ਨੂੰ ਮੁੜ ਤਿਆਰ ਕੀਤਾ ਹੈ। ਸਿੱਧੇ-ਸਾਧੇ ਕੰਮਾਂ 'ਤੇ, GPT‑5.1 ਸੋਚਣ ਲਈ ਘੱਟ ਟੋਕਨ ਵਰਤਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਹੋਰ ਤੇਜ਼ ਉਤਪਾਦ ਅਨੁਭਵ ਅਤੇ ਘੱਟ ਟੋਕਨ ਬਿੱਲ ਸੰਭਵ ਹੁੰਦੇ ਹਨ। ਮੁਸ਼ਕਲ ਕੰਮਾਂ 'ਤੇ, ਜਿਨ੍ਹਾਂ ਲਈ ਵਾਧੂ ਸੋਚ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, GPT‑5.1 ਭਰੋਸੇਯੋਗਤਾ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਕਰਨ ਲਈ ਲਗਾਤਾਰ ਜੁਟਿਆ ਰਹਿੰਦਾ ਹੈ, ਵਿਕਲਪਾਂ ਦੀ ਜਾਂਚ ਕਰਦਾ ਹੈ ਅਤੇ ਆਪਣੇ ਕੰਮ ਦੀ ਪੜਤਾਲ ਕਰਦਾ ਹੈ।
Balyasny Asset Management(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨੇ ਕਿਹਾ ਕਿ GPT‑5.1 ਨੇ “ਸਾਡੇ ਪੂਰੇ ਡਾਇਨਾਮਿਕ ਮੁਲਾਂਕਣ ਸੂਟ ਵਿੱਚ GPT‑4.1 ਅਤੇ GPT‑5 ਦੋਵਾਂ ਤੋਂ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ, ਜਦੋਂ ਕਿ ਇਹ GPT‑5 ਨਾਲੋਂ 2-3x ਤੇਜ਼ ਚੱਲਿਆ।” ਉਨ੍ਹਾਂ ਨੇ ਇਹ ਵੀ ਕਿਹਾ ਕਿ ਉਨ੍ਹਾਂ ਦੇ ਟੂਲ-ਭਾਰੀ ਰੀਜ਼ਨਿੰਗ ਕੰਮਾਂ ਵਿੱਚ GPT‑5.1 ਨੇ “ਮਿਲਦੇ-ਜੁਲਦੇ ਜਾਂ ਵਧੀਆ ਗੁਣਵੱਤਾ 'ਤੇ ਅਗੇਅਣ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਨਾਲੋਂ ਲਗਭਗ ਅੱਧੇ ਟੋਕਨ ਲਗਾਤਾਰ ਵਰਤੇ।” ਇਸੇ ਤਰ੍ਹਾਂ, AI ਇੰਸ਼ੋਰੈਂਸ BPO Pace(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨੇ ਵੀ ਮਾਡਲ ਦੀ ਜਾਂਚ ਕੀਤੀ ਅਤੇ ਕਿਹਾ ਕਿ ਉਨ੍ਹਾਂ ਦੇ ਏਜੰਟ “GPT‑5.1 'ਤੇ 50% ਤੇਜ਼ ਚੱਲਦੇ ਹਨ, ਜਦੋਂ ਕਿ ਸਾਡੇ evals ਵਿੱਚ GPT‑5 ਅਤੇ ਹੋਰ ਅਗੇਅਣ ਮਾਡਲਾਂ ਦੇ ਸਹੀਪਣ ਤੋਂ ਵੱਧ ਹਨ।”
GPT‑5.1 ਆਪਣਾ ਸੋਚਣ ਦਾ ਸਮਾਂ GPT‑5 ਨਾਲੋਂ ਹੋਰ ਗਤੀਸ਼ੀਲ ਢੰਗ ਨਾਲ ਬਦਲਦਾ ਹੈ। ChatGPT ਕੰਮਾਂ ਦੀ ਇੱਕ ਪ੍ਰਤੀਨਿਧ ਵੰਡ ਵਿੱਚ, GPT‑5.1 ਆਸਾਨ ਕੰਮਾਂ 'ਤੇ ਕਾਫ਼ੀ ਤੇਜ਼ ਹੈ, ਇੱਥੋਂ ਤੱਕ ਕਿ ਉੱਚ ਰੀਜ਼ਨਿੰਗ ਮਿਹਨਤ 'ਤੇ ਵੀ।
ਉਦਾਹਰਨ ਵਜੋਂ, ਜਦੋਂ ਇਸਨੂੰ “globally installed packages ਦੀ ਸੂਚੀ ਦਿਖਾਉਣ ਲਈ ਇੱਕ npm ਕਮਾਂਡ ਦਿਖਾਓ” ਪੁੱਛਿਆ ਗਿਆ, ਤਾਂ GPT‑5.1 10 ਸਕਿੰਟਾਂ ਦੀ ਥਾਂ 2 ਸਕਿੰਟਾਂ ਵਿੱਚ ਜਵਾਬ ਦਿੰਦਾ ਹੈ।
GPT-5 (ਮੀਡੀਅਮ) ~250 ਟੋਕਨ ਲੈਂਦਾ ਹੈ (~10 ਸਕਿੰਟ)
GPT-5.1 (ਮੀਡੀਅਮ) ~50 ਟੋਕਨ ਲੈਂਦਾ ਹੈ (~2 ਸਕਿੰਟ)
ਡਿਵੈਲਪਰ ਹੁਣ reasoning_effort ਨੂੰ 'none' 'ਤੇ ਸੈਟ ਕਰਕੇ GPT‑5.1 ਨੂੰ ਬਿਨਾ ਰੀਜ਼ਨਿੰਗ ਵਰਤ ਸਕਦੇ ਹਨ। ਇਹ ਲੇਟੈਂਸੀ-ਸੰਵੇਦਨਸ਼ੀਲ ਵਰਤੋਂ ਦੇ ਕੇਸਾਂ ਲਈ ਮਾਡਲ ਨੂੰ ਇੱਕ non-reasoning ਮਾਡਲ ਵਾਂਗ ਵਰਤਾਅ ਕਰਨ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ, GPT‑5.1 ਦੀ ਉੱਚ ਬੁੱਧੀਮੱਤਾ ਅਤੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ tool-calling ਦੇ ਵਾਧੂ ਫ਼ਾਇਦੇ ਨਾਲ। 'minimal' ਰੀਜ਼ਨਿੰਗ ਵਾਲੇ GPT‑5 ਨਾਲ ਤੁਲਨਾ ਕਰਨ 'ਤੇ, ਬਿਨਾ ਰੀਜ਼ਨਿੰਗ ਵਾਲਾ GPT‑5.1 parallel tool calling ਵਿੱਚ ਬਿਹਤਰ ਹੈ, coding ਕੰਮਾਂ ਵਿੱਚ, ਹਦਾਇਤਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਵਿੱਚ, ਅਤੇ search ਟੂਲ ਵਰਤਣ ਵਿੱਚ ਹੋਰ ਵਧੀਆ ਹੈ—ਅਤੇ ਸਾਡੇ API ਪਲੇਟਫਾਰਮ ਵਿੱਚ web search(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨੂੰ ਸਮਰਥਨ ਦਿੰਦਾ ਹੈ। Sierra(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨੇ ਸਾਂਝਾ ਕੀਤਾ ਕਿ “ਬਿਨਾ ਰੀਜ਼ਨਿੰਗ” ਮੋਡ 'ਤੇ GPT‑5.1 ਨੇ ਉਨ੍ਹਾਂ ਦੇ ਅਸਲ-ਦੁਨੀਆ evals ਵਿੱਚ “GPT‑5 minimal reasoning ਦੇ ਮੁਕਾਬਲੇ ਘੱਟ-ਲੇਟੈਂਸੀ tool calling performance ਵਿੱਚ 20% ਸੁਧਾਰ” ਦਿਖਾਇਆ।
reasoning_effort ਵਿੱਚ 'none' ਨੂੰ ਇੱਕ value ਵਜੋਂ ਲਿਆਂਦੇ ਜਾਣ ਨਾਲ, ਡਿਵੈਲਪਰਾਂ ਕੋਲ ਹੁਣ ਆਪਣੇ ਵਰਤੋਂ ਕੇਸ ਲਈ ਗਤੀ, ਲਾਗਤ ਅਤੇ ਬੁੱਧੀਮੱਤਾ ਦੇ ਸੰਤੁਲਨ 'ਤੇ ਹੋਰ ਵੀ ਲਚਕੀਲਾਪਣ ਅਤੇ ਨਿਯੰਤਰਣ ਹੈ। GPT‑5.1 ਡਿਫੌਲਟ ਤੌਰ 'ਤੇ 'none' ਵਰਤਦਾ ਹੈ, ਜੋ ਲੇਟੈਂਸੀ-ਸੰਵੇਦਨਸ਼ੀਲ ਵਰਕਲੋਡ ਲਈ ਆਦਰਸ਼ ਹੈ। ਅਸੀਂ ਸਿਫ਼ਾਰਸ਼ ਕਰਦੇ ਹਾਂ ਕਿ ਡਿਵੈਲਪਰ ਵਧੀਕ ਜਟਿਲਤਾ ਵਾਲੇ ਕੰਮਾਂ ਲਈ 'low' ਜਾਂ 'medium' ਚੁਣਨ ਅਤੇ ਜਦੋਂ ਗਤੀ ਨਾਲੋਂ ਬੁੱਧੀਮੱਤਾ ਅਤੇ ਭਰੋਸੇਯੋਗਤਾ ਵੱਧ ਮਹੱਤਵਪੂਰਨ ਹੋਣ ਤਾਂ 'high' ਚੁਣਨ।
ਵਧਾਈ ਗਈ ਕੈਸ਼ਿੰਗ ਰੀਜ਼ਨਿੰਗ ਕੁਸ਼ਲਤਾ ਵਿੱਚ ਸੁਧਾਰ ਕਰਦੀ ਹੈ ਕਿਉਂਕਿ ਇਹ ਪ੍ਰੌੰਪਟਾਂ ਨੂੰ ਅੱਜ ਸਮਰਥਿਤ ਕੁਝ ਮਿੰਟਾਂ ਦੀ ਬਜਾਏ 24 ਘੰਟਿਆਂ ਤੱਕ ਕੈਸ਼ ਵਿੱਚ ਸਰਗਰਮ ਰਹਿਣ ਦਿੰਦੀ ਹੈ। ਲੰਬੀ ਰਿਟੈਂਸ਼ਨ ਵਿੰਡੋ ਨਾਲ, ਹੋਰ ਫਾਲੋ-ਅੱਪ ਬੇਨਤੀਆਂ cached context ਦਾ ਲਾਭ ਲੈ ਸਕਦੀਆਂ ਹਨ—ਜਿਸ ਨਾਲ ਘੱਟ ਲੇਟੈਂਸੀ, ਘੱਟ ਲਾਗਤ, ਅਤੇ ਲੰਬੇ ਸਮੇਂ ਚੱਲਣ ਵਾਲੀਆਂ ਇੰਟਰਐਕਸ਼ਨਾਂ ਜਿਵੇਂ multi-turn chat, coding sessions, ਜਾਂ knowledge retrieval workflows ਲਈ ਹੋਰ ਸੁਚਾਰੂ ਕਾਰਗੁਜ਼ਾਰੀ ਮਿਲਦੀ ਹੈ।
ਪ੍ਰੌੰਪਟ ਕੈਸ਼ ਦੀ ਕੀਮਤ ਬਦਲੀ ਨਹੀਂ ਹੈ, cached input tokens uncached tokens ਨਾਲੋਂ 90% ਸਸਤੇ ਰਹਿੰਦੇ ਹਨ, ਅਤੇ cache writes ਜਾਂ storage ਲਈ ਕੋਈ ਵਾਧੂ ਸ਼ੁਲਕ ਨਹੀਂ ਹੈ। GPT‑5.1 ਨਾਲ ਵਧਾਈ ਗਈ caching ਵਰਤਣ ਲਈ, Responses ਜਾਂ Chat Completions API 'ਤੇ “prompt_cache_retention='24h'” ਪੈਰਾਮੀਟਰ ਜੋੜੋ। ਹੋਰ ਵੇਰਵੇ ਲਈ prompt caching docs(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵੇਖੋ।
GPT‑5.1, GPT‑5 ਦੀਆਂ ਕੋਡਿੰਗ ਸਮਰੱਥਾਵਾਂ 'ਤੇ ਅੱਗੇ ਵੱਧਦਾ ਹੈ ਅਤੇ ਇੱਕ ਹੋਰ steerable coding personality, ਘੱਟ overthinking, ਸੁਧਰੀ ਹੋਈ code quality, tool calls ਦੀਆਂ ਲੜੀਆਂ ਦੌਰਾਨ ਹੋਰ ਵਧੀਆ user-targeted update messages (preambles), ਅਤੇ ਹੋਰ ਕਾਰਗੁਜ਼ਾਰ frontend ਡਿਜ਼ਾਈਨਾਂ ਦਿੰਦਾ ਹੈ—ਖਾਸ ਕਰਕੇ ਘੱਟ reasoning effort 'ਤੇ।
ਸਧਾਰਣ ਕੋਡਿੰਗ ਕੰਮਾਂ ਜਿਵੇਂ ਫ਼ੌਰੀ code edits 'ਤੇ, GPT‑5.1 ਦੀ ਤੇਜ਼ ਗਤੀ ਆਗੇ-ਪਿੱਛੇ iteration ਨੂੰ ਆਸਾਨ ਬਣਾਉਂਦੀ ਹੈ। ਸਧਾਰਣ ਕੰਮਾਂ 'ਤੇ GPT‑5.1 ਦੀ ਤੇਜ਼ ਗਤੀ ਮੁਸ਼ਕਲ ਕੰਮਾਂ 'ਤੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਘਟਾਉਂਦੀ ਨਹੀਂ। SWE-bench Verified 'ਤੇ, GPT‑5.1 GPT‑5 ਨਾਲੋਂ ਵੀ ਲੰਮਾ ਕੰਮ ਕਰਦਾ ਹੈ ਅਤੇ 76.3% ਤੱਕ ਪਹੁੰਚਦਾ ਹੈ।
SWE-bench Verified ਵਿੱਚ, ਇੱਕ ਮਾਡਲ ਨੂੰ ਇੱਕ ਕੋਡ ਰਿਪੋਜ਼ਟਰੀ ਅਤੇ ਇਸ਼ੂ ਦਾ ਵੇਰਵਾ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ, ਅਤੇ ਉਸਨੂੰ ਇਸ਼ੂ ਹੱਲ ਕਰਨ ਲਈ ਇੱਕ ਪੈਚ ਤਿਆਰ ਕਰਨਾ ਹੁੰਦਾ ਹੈ। ਲੇਬਲ ਰੀਜ਼ਨਿੰਗ ਮਿਹਨਤ ਦਰਸਾਉਂਦੇ ਹਨ। ਸਹੀਪਣ 500 ਸਭ ਸਮੱਸਿਆਵਾਂ 'ਤੇ ਔਸਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਸਭ ਮਾਡਲਾਂ ਨੇ JSON-ਅਧਾਰਿਤ apply_patch ਟੂਲ ਵਾਲਾ harness ਵਰਤਿਆ।
ਸਾਨੂੰ ਕੁਝ ਕੋਡਿੰਗ ਕੰਪਨੀਆਂ ਤੋਂ GPT‑5.1 ਬਾਰੇ ਸ਼ੁਰੂਆਤੀ ਫੀਡਬੈਕ ਮਿਲਿਆ। ਇੱਥੇ ਉਨ੍ਹਾਂ ਦੇ ਪ੍ਰਭਾਵ ਹਨ:
- Augment Code(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨੇ GPT‑5.1 ਨੂੰ “ਘੱਟ ਬਰਬਾਦ ਕੀਤੀਆਂ ਕਾਰਵਾਈਆਂ ਨਾਲ ਹੋਰ ਸੋਚ-ਸਮਝ ਵਾਲਾ, ਹੋਰ ਕੁਸ਼ਲ ਰੀਜ਼ਨਿੰਗ ਵਾਲਾ, ਅਤੇ ਕੰਮ 'ਤੇ ਹੋਰ ਕੇਂਦ੍ਰਿਤ” ਕਿਹਾ ਅਤੇ ਉਹ “multi-file projects ਵਿੱਚ ਹੋਰ ਸਹੀ ਬਦਲਾਅ, ਹੋਰ ਸੁਚੱਜੀਆਂ ਪੁੱਲ ਰਿਕਵੈਸਟਾਂ, ਅਤੇ ਤੇਜ਼ iteration” ਦੇਖ ਰਹੇ ਹਨ।
- Cline(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨੇ ਸਾਂਝਾ ਕੀਤਾ ਕਿ ਉਨ੍ਹਾਂ ਦੇ evals ਵਿੱਚ, “GPT‑5.1 ਨੇ ਸਾਡੇ diff editing benchmark 'ਤੇ 7% ਸੁਧਾਰ ਨਾਲ SOTA ਹਾਸਲ ਕੀਤਾ, ਜੋ ਜਟਿਲ coding ਕੰਮਾਂ ਲਈ ਅਸਾਧਾਰਣ ਭਰੋਸੇਯੋਗਤਾ ਦਿਖਾਉਂਦਾ ਹੈ।”
- CodeRabbit(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨੇ GPT‑5.1 ਨੂੰ PR reviews ਲਈ ਆਪਣਾ “ਸਭ ਤੋਂ ਪਸੰਦੀਦਾ ਮਾਡਲ” ਕਿਹਾ।
- Cognition(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨੇ ਕਿਹਾ ਕਿ GPT‑5.1 “ਤੁਸੀਂ ਕੀ ਮੰਗ ਰਹੇ ਹੋ, ਇਸਨੂੰ ਸਮਝਣ ਅਤੇ ਤੁਹਾਡੇ ਨਾਲ ਮਿਲਕੇ ਕੰਮ ਪੂਰਾ ਕਰਨ ਵਿੱਚ ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ ਵਧੀਆ ਹੈ।”
- Factory(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨੇ ਕਿਹਾ, “GPT‑5.1 ਕਾਫ਼ੀ ਤੇਜ਼ ਜਵਾਬ ਦਿੰਦਾ ਹੈ ਅਤੇ ਕੰਮ ਦੇ ਮੁਤਾਬਕ ਆਪਣੀ ਰੀਜ਼ਨਿੰਗ ਦੀ ਡੂੰਘਾਈ ਅਨੁਕੂਲ ਕਰਦਾ ਹੈ, overthinking ਘਟਾਉਂਦਾ ਹੈ ਅਤੇ ਕੁੱਲ ਡਿਵੈਲਪਰ ਅਨੁਭਵ ਸੁਧਾਰਦਾ ਹੈ।”
- Warp(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨਵੇਂ ਯੂਜ਼ਰਾਂ ਲਈ GPT‑5.1 ਨੂੰ ਡਿਫੌਲਟ ਬਣਾ ਰਿਹਾ ਹੈ ਅਤੇ ਕਹਿੰਦਾ ਹੈ ਕਿ ਇਹ “ਉਨ੍ਹਾਂ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਬੁੱਧੀਮੱਤਾ ਵਾਧਿਆਂ 'ਤੇ ਅੱਗੇ ਬਣਦਾ ਹੈ ਜੋ GPT‑5 ਸਿਰੀਜ਼ ਨੇ ਪੇਸ਼ ਕੀਤੇ, ਜਦੋਂ ਕਿ ਇਹ ਕਾਫ਼ੀ ਵੱਧ responsive ਮਾਡਲ ਹੈ।”
“GPT 5.1 ਸਿਰਫ਼ ਹੋਰ ਇੱਕ LLM ਨਹੀਂ ਹੈ—ਇਹ ਵਾਕਈ ਏਜੰਟਿਕ ਹੈ, ਅਤੇ ਇਹ ਸਭ ਤੋਂ ਕੁਦਰਤੀ ਤੌਰ 'ਤੇ ਸਵੈ-ਚਾਲਿਤ ਮਾਡਲ ਹੈ ਜਿਸਦੀ ਮੈਂ ਕਦੇ ਜਾਂਚ ਕੀਤੀ ਹੈ। ਇਹ ਤੁਹਾਡੇ ਵਾਂਗ ਲਿਖਦਾ ਹੈ, ਤੁਹਾਡੇ ਵਾਂਗ ਕੋਡ ਕਰਦਾ ਹੈ, ਜਟਿਲ ਹਦਾਇਤਾਂ ਨੂੰ ਆਸਾਨੀ ਨਾਲ ਮੰਨਦਾ ਹੈ, ਅਤੇ ਫਰੰਟ-ਐਂਡ ਕੰਮਾਂ ਵਿੱਚ ਸ਼ਾਨਦਾਰ ਹੈ, ਤੁਹਾਡੇ ਮੌਜੂਦਾ ਕੋਡਬੇਸ ਵਿੱਚ ਸੁਚੱਜੇ ਤਰੀਕੇ ਨਾਲ ਫਿੱਟ ਹੁੰਦਾ ਹੈ। ਤੁਸੀਂ Responses API ਵਿੱਚ ਇਸਦੀ ਪੂਰੀ ਸਮਰੱਥਾ ਨੂੰ ਸੱਚਮੁੱਚ ਅਨਲਾਕ ਕਰ ਸਕਦੇ ਹੋ ਅਤੇ ਅਸੀਂ ਇਸਨੂੰ ਆਪਣੇ IDE ਵਿੱਚ ਪੇਸ਼ ਕਰਨ ਲਈ ਉਤਸ਼ਾਹਿਤ ਹਾਂ।”
ਅਸੀਂ GPT‑5.1 ਨਾਲ ਦੋ ਨਵੇਂ ਟੂਲ ਪੇਸ਼ ਕਰ ਰਹੇ ਹਾਂ ਤਾਂ ਜੋ ਡਿਵੈਲਪਰ Responses API ਵਿੱਚ ਮਾਡਲ ਤੋਂ ਸਭ ਤੋਂ ਵੱਧ ਲਾਭ ਲੈ ਸਕਣ: ਇੱਕ freeform apply_patch ਟੂਲ ਜੋ JSON escaping ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾ code edits ਨੂੰ ਹੋਰ ਭਰੋਸੇਯੋਗ ਬਣਾਉਂਦਾ ਹੈ, ਅਤੇ ਇੱਕ shell ਟੂਲ ਜੋ ਮਾਡਲ ਨੂੰ ਤੁਹਾਡੀ ਲੋਕਲ ਮਸ਼ੀਨ 'ਤੇ ਚਲਾਉਣ ਲਈ ਕਮਾਂਡਾਂ ਲਿਖਣ ਦਿੰਦਾ ਹੈ।
freeform apply_patch ਟੂਲ GPT‑5.1 ਨੂੰ structured diffs ਦੀ ਵਰਤੋਂ ਕਰਕੇ codebase ਵਿੱਚ ਫ਼ਾਈਲਾਂ ਬਣਾਉਣ, ਅੱਪਡੇਟ ਕਰਨ, ਅਤੇ ਹਟਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਸਿਰਫ਼ edits ਸੁਝਾਉਣ ਦੀ ਬਜਾਏ, ਮਾਡਲ patch operations ਨਿਕਲਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਇੱਕ ਐਪਲੀਕੇਸ਼ਨ ਲਾਗੂ ਕਰਦੀ ਹੈ ਅਤੇ ਉਨ੍ਹਾਂ ਬਾਰੇ ਵਾਪਸ ਰਿਪੋਰਟ ਕਰਦੀ ਹੈ, ਜਿਸ ਨਾਲ iterative, multi-step code editing workflows ਸੰਭਵ ਹੁੰਦੇ ਹਨ।
Responses API ਵਿੱਚ apply_patch ਟੂਲ ਵਰਤਣ ਲਈ, ਇਸਨੂੰ tools array ਵਿੱਚ "tools": [{“type”: “apply_patch”}] ਨਾਲ ਸ਼ਾਮਲ ਕਰੋ ਅਤੇ ਜਾਂ ਤਾਂ ਆਪਣੀ input ਵਿੱਚ file content ਸ਼ਾਮਲ ਕਰੋ ਜਾਂ ਮਾਡਲ ਨੂੰ ਤੁਹਾਡੇ file system ਨਾਲ ਇੰਟਰਐਕਟ ਕਰਨ ਵਾਲੇ ਟੂਲ ਦਿਓ। ਮਾਡਲ ਫ਼ਾਈਲਾਂ ਬਣਾਉਣ, ਅੱਪਡੇਟ ਕਰਨ ਜਾਂ ਹਟਾਉਣ ਲਈ apply_patch_call ਆਈਟਮ ਤਿਆਰ ਕਰੇਗਾ ਜਿਨ੍ਹਾਂ ਵਿੱਚ diffs ਹੋਣਗੇ, ਜੋ ਤੁਸੀਂ ਆਪਣੇ file system 'ਤੇ ਲਾਗੂ ਕਰੋਗੇ। apply_patch ਟੂਲ ਨਾਲ ਇੰਟੀਗ੍ਰੇਟ ਕਰਨ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ ਸਾਡੀ developer documentation(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵੇਖੋ।
shell ਟੂਲ ਮਾਡਲ ਨੂੰ ਇੱਕ ਨਿਯੰਤਰਿਤ command-line interface ਰਾਹੀਂ ਲੋਕਲ ਕੰਪਿਊਟਰ ਨਾਲ ਇੰਟਰਐਕਟ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਮਾਡਲ shell commands ਦਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ; ਡਿਵੈਲਪਰ ਦੀ integration ਉਨ੍ਹਾਂ ਨੂੰ ਚਲਾਉਂਦੀ ਹੈ ਅਤੇ outputs ਵਾਪਸ ਕਰਦੀ ਹੈ। ਇਸ ਨਾਲ ਇੱਕ ਸਧਾਰਣ plan-execute loop ਬਣਦਾ ਹੈ ਜੋ ਮਾਡਲਾਂ ਨੂੰ ਸਿਸਟਮ ਦੀ ਜਾਂਚ ਕਰਨ, utilities ਚਲਾਉਣ, ਅਤੇ ਡਾਟਾ ਇਕੱਠਾ ਕਰਨ ਦਿੰਦਾ ਹੈ ਜਦੋਂ ਤੱਕ ਉਹ ਕੰਮ ਪੂਰਾ ਨਾ ਕਰ ਸਕਣ।
Responses API ਵਿੱਚ shell ਟੂਲ ਵਰਤਣ ਲਈ, ਡਿਵੈਲਪਰ ਇਸਨੂੰ tools array ਵਿੱਚ "tools": [{“type”: “shell”}] ਨਾਲ ਸ਼ਾਮਲ ਕਰ ਸਕਦੇ ਹਨ। API "shell_call" ਆਈਟਮ ਤਿਆਰ ਕਰੇਗੀ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਚਲਾਏ ਜਾਣ ਵਾਲੀਆਂ shell commands ਹੋਣਗੀਆਂ। ਡਿਵੈਲਪਰ commands ਨੂੰ ਲੋਕਲ environment ਵਿੱਚ ਚਲਾਉਂਦੇ ਹਨ ਅਤੇ ਅਗਲੀ API request ਵਿੱਚ "shell_call_output" ਆਈਟਮ ਵਿੱਚ execution results ਵਾਪਸ ਭੇਜਦੇ ਹਨ। ਹੋਰ ਜਾਣਨ ਲਈ ਸਾਡੀ developer documentation(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵੇਖੋ।
GPT‑5.1 ਅਤੇ gpt-5.1-chat-latest API ਵਿੱਚ ਸਾਰੇ paid tiers ਦੇ ਡਿਵੈਲਪਰਾਂ ਲਈ ਉਪਲਬਧ ਹਨ। Pricing and rate limits(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) GPT‑5 ਵਰਗੇ ਹੀ ਹਨ। ਅਸੀਂ API ਵਿੱਚ gpt-5.1-codex ਅਤੇ gpt-5.1-codex-mini ਵੀ ਜਾਰੀ ਕਰ ਰਹੇ ਹਾਂ। ਜਦੋਂ ਕਿ GPT‑5.1 ਜ਼ਿਆਦਾਤਰ coding ਕੰਮਾਂ ਵਿੱਚ ਸ਼ਾਨਦਾਰ ਹੈ, gpt-5.1-codex ਮਾਡਲ Codex ਜਾਂ Codex-ਜਿਹੇ harnesses ਵਿੱਚ ਲੰਬੇ ਸਮੇਂ ਚੱਲਣ ਵਾਲੇ, ਏਜੰਟਿਕ coding ਕੰਮਾਂ ਲਈ ਅਨੁਕੂਲਿਤ ਕੀਤੇ ਗਏ ਹਨ।
ਡਿਵੈਲਪਰ ਸਾਡੀ GPT‑5.1 developer documentation(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਅਤੇ model prompting guide(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਬਣਾਉਣਾ ਸ਼ੁਰੂ ਕਰ ਸਕਦੇ ਹਨ। ਅਸੀਂ ਇਸ ਵੇਲੇ API ਵਿੱਚ GPT‑5 ਨੂੰ deprecate ਕਰਨ ਦੀ ਯੋਜਨਾ ਨਹੀਂ ਰੱਖਦੇ ਅਤੇ ਜੇ ਅਤੇ ਜਦੋਂ ਅਸੀਂ ਐਸਾ ਕਰਨ ਦਾ ਫੈਸਲਾ ਕਰਾਂਗੇ, ਅਸੀਂ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਪਹਿਲਾਂ ਤੋਂ ਸੂਚਿਤ ਕਰਾਂਗੇ।
ਅਸੀਂ ਅਸਲ ਏਜੰਟਿਕ ਅਤੇ coding ਕੰਮ ਲਈ ਸਭ ਤੋਂ ਸਮਰੱਥ, ਭਰੋਸੇਯੋਗ ਮਾਡਲਾਂ ਨੂੰ ਦੁਹਰਾਉਂਦੇ ਤਰੀਕੇ ਨਾਲ ਤਾਇਨਾਤ ਕਰਨ ਲਈ ਵਚਨਬੱਧ ਹਾਂ—ਐਸੇ ਮਾਡਲ ਜੋ ਕੁਸ਼ਲਤਾ ਨਾਲ ਸੋਚਦੇ ਹਨ, ਤੇਜ਼ੀ ਨਾਲ iteration ਕਰਦੇ ਹਨ, ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਨੂੰ flow ਵਿੱਚ ਰੱਖਦੇ ਹੋਏ ਜਟਿਲ ਕੰਮ ਸੰਭਾਲਦੇ ਹਨ। adaptive reasoning, ਮਜ਼ਬੂਤ coding performance, ਹੋਰ ਸਪੱਸ਼ਟ user-facing updates, ਅਤੇ apply_patch ਅਤੇ shell ਵਰਗੇ ਨਵੇਂ ਟੂਲਾਂ ਨਾਲ, GPT‑5.1 ਤੁਹਾਡੀ ਮਦਦ ਲਈ ਘੱਟ friction ਨਾਲ ਬਣਾਉਣ ਵਾਸਤੇ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੈ। ਅਤੇ ਅਸੀਂ ਇੱਥੇ ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਨਿਵੇਸ਼ ਜਾਰੀ ਰੱਖ ਰਹੇ ਹਾਂ: ਆਉਣ ਵਾਲੇ ਹਫ਼ਤਿਆਂ ਅਤੇ ਮਹੀਨਿਆਂ ਵਿੱਚ ਤੁਸੀਂ ਹੋਰ ਸਮਰੱਥ ਏਜੰਟਿਕ ਅਤੇ coding ਮਾਡਲਾਂ ਦੀ ਉਮੀਦ ਕਰ ਸਕਦੇ ਹੋ।
ਮੁਲਾਂਕਣ | GPT‑5.1 (high) | GPT‑5 (high) |
SWE-bench Verified | 76.3% | 72.8% |
GPQA Diamond | 88.1% | 85.7% |
AIME 2025 | 94.0% | 94.6% |
FrontierMath | 26.7% | 26.3% |
MMMU | 85.4% | 84.2% |
Tau2-bench Airline | 67.0% | 62.6% |
Tau2-bench Telecom* | 95.6% | 96.7% |
Tau2-bench Retail | 77.9% | 81.1% |
BrowseComp Long Context 128k | 90.0% | 90.0% |
* Tau2-bench Telecom ਲਈ, ਅਸੀਂ GPT‑5.1 ਨੂੰ ਇਸਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਸੁਧਾਰਣ ਲਈ ਇੱਕ ਛੋਟਾ, ਆਮ ਤੌਰ 'ਤੇ ਲਾਭਕਾਰੀ ਪ੍ਰੌੰਪਟ ਦਿੱਤਾ।


