gpt-oss ਪੇਸ਼ ਕਰਦੇ ਹਾਂ
gpt-oss-120b ਅਤੇ gpt-oss-20b ਓਪਨ-ਵੇਟ ਰੀਜ਼ਨਿੰਗ ਮਾਡਲਾਂ ਦੀ ਅਤਿ-ਆਧੁਨਿਕ ਹੱਦ ਨੂੰ ਅੱਗੇ ਵਧਾਉਂਦੇ ਹਨ
ਅਸੀਂ gpt-oss-120b ਅਤੇ gpt-oss-20b ਜਾਰੀ ਕਰ ਰਹੇ ਹਾਂ—ਦੋ ਅਤਿ-ਆਧੁਨਿਕ ਓਪਨ-ਵੇਟ ਭਾਸ਼ਾ ਮਾਡਲ ਜੋ ਘੱਟ ਲਾਗਤ 'ਤੇ ਮਜ਼ਬੂਤ ਅਸਲ-ਦੁਨੀਆ ਪ੍ਰਦਰਸ਼ਨ ਦਿੰਦੇ ਹਨ. ਲਚਕੀਲੇ Apache 2.0 ਲਾਇਸੈਂਸ ਅਧੀਨ ਉਪਲਬਧ, ਇਹ ਮਾਡਲ ਰੀਜ਼ਨਿੰਗ ਕੰਮਾਂ ਵਿੱਚ ਸਮਾਨ ਆਕਾਰ ਦੇ ਓਪਨ ਮਾਡਲਾਂ ਤੋਂ ਬਿਹਤਰ ਹਨ, ਮਜ਼ਬੂਤ ਟੂਲ ਵਰਤੋਂ ਸਮਰੱਥਾਵਾਂ ਦਿਖਾਉਂਦੇ ਹਨ, ਅਤੇ ਉਪਭੋਗਤਾ ਹਾਰਡਵੇਅਰ 'ਤੇ ਕੁਸ਼ਲ ਡਿਪਲੋਇਮੈਂਟ ਲਈ ਓਪਟੀਮਾਈਜ਼ ਕੀਤੇ ਗਏ ਹਨ. ਇਨ੍ਹਾਂ ਨੂੰ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਅਤੇ OpenAI ਦੇ ਸਭ ਤੋਂ ਅਗੇਤਰਨ ਅੰਦਰੂਨੀ ਮਾਡਲਾਂ, ਜਿਨ੍ਹਾਂ ਵਿੱਚ o3 ਅਤੇ ਹੋਰ ਅਤਿ-ਆਧੁਨਿਕ ਸਿਸਟਮ ਸ਼ਾਮਲ ਹਨ, ਤੋਂ ਪ੍ਰੇਰਿਤ ਤਕਨੀਕਾਂ ਦੇ ਮਿਲਾਪ ਨਾਲ ਟ੍ਰੇਨ ਕੀਤਾ ਗਿਆ ਸੀ.
gpt-oss-120b ਮਾਡਲ ਮੁੱਢਲੇ ਰੀਜ਼ਨਿੰਗ ਬੈਂਚਮਾਰਕਾਂ 'ਤੇ OpenAI o4-mini ਦੇ ਲਗਭਗ ਬਰਾਬਰ ਨਤੀਜੇ ਹਾਸਲ ਕਰਦਾ ਹੈ, ਅਤੇ ਇਕੱਲੇ 80 GB GPU 'ਤੇ ਕੁਸ਼ਲਤਾਪੂਰਵਕ ਚੱਲਦਾ ਹੈ. gpt-oss-20b ਮਾਡਲ ਆਮ ਬੈਂਚਮਾਰਕਾਂ 'ਤੇ OpenAI o3‑mini ਵਰਗੇ ਨਤੀਜੇ ਦਿੰਦਾ ਹੈ ਅਤੇ ਕੇਵਲ 16 GB ਮੈਮਰੀ ਵਾਲੇ ਐਜ ਡਿਵਾਈਸਾਂ 'ਤੇ ਚੱਲ ਸਕਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਇਹ ਆਨ-ਡਿਵਾਈਸ ਵਰਤੋਂ, ਲੋਕਲ ਇੰਫਰੈਂਸ, ਜਾਂ ਮਹਿੰਗੇ ਇਨਫਰਾਸਟਰਕਚਰ ਤੋਂ ਬਿਨਾਂ ਤੇਜ਼ ਇਟਰੇਸ਼ਨ ਲਈ ਆਦਰਸ਼ ਬਣਦਾ ਹੈ. ਦੋਵੇਂ ਮਾਡਲ ਟੂਲ ਵਰਤੋਂ, ਫਿਊ-ਸ਼ਾਟ ਫੰਕਸ਼ਨ ਕਾਲਿੰਗ, CoT ਰੀਜ਼ਨਿੰਗ (ਜਿਵੇਂ Tau-Bench agentic evaluation suite ਦੇ ਨਤੀਜਿਆਂ ਵਿੱਚ ਦਿਖਿਆ ਗਿਆ ਹੈ) ਅਤੇ HealthBench 'ਤੇ ਵੀ ਮਜ਼ਬੂਤ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੇ ਹਨ, ਇੱਥੋਂ ਤੱਕ ਕਿ OpenAI o1 ਅਤੇ GPT‑4o ਵਰਗੇ proprietary ਮਾਡਲਾਂ ਤੋਂ ਵੀ ਅੱਗੇ ਨਿਕਲਦੇ ਹਨ.
ਇਹ ਮਾਡਲ ਸਾਡੇ Responses API(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨਾਲ ਅਨੁਕੂਲ ਹਨ ਅਤੇ ਏਜੰਟਿਕ ਵਰਕਫਲੋਜ਼ ਵਿੱਚ ਵਰਤੋਂ ਲਈ ਡਿਜ਼ਾਇਨ ਕੀਤੇ ਗਏ ਹਨ, ਜਿੱਥੇ ਅਸਾਧਾਰਣ ਨਿਰਦੇਸ਼ ਪਾਲਣਾ, ਵੈੱਬ ਖੋਜ ਜਾਂ Python ਕੋਡ ਐਗਜ਼ਿਕਿਊਸ਼ਨ ਵਰਗੇ ਟੂਲਾਂ ਦੀ ਵਰਤੋਂ, ਅਤੇ ਰੀਜ਼ਨਿੰਗ ਸਮਰੱਥਾਵਾਂ—ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਉਹਨਾਂ ਕੰਮਾਂ ਲਈ ਰੀਜ਼ਨਿੰਗ effort ਸਮਾਇਤ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਵੀ ਸ਼ਾਮਲ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਜਟਿਲ ਰੀਜ਼ਨਿੰਗ ਦੀ ਲੋੜ ਨਹੀਂ ਅਤੇ/ਜਾਂ ਬਹੁਤ ਘੱਟ latency ਵਾਲੇ ਅੰਤਿਮ ਆਉਟਪੁੱਟ ਚਾਹੀਦੇ ਹਨ. ਇਹ ਪੂਰੀ ਤਰ੍ਹਾਂ ਕਸਟਮਾਈਜ਼ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ, ਪੂਰਾ ਚੇਨ-ਆਫ-ਥੌਟ (CoT) ਦਿੰਦੇ ਹਨ, ਅਤੇ ਸਟਰੱਕਚਰਡ ਆਉਟਪੁੱਟਸ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਦਾ ਸਮਰਥਨ ਕਰਦੇ ਹਨ.
ਸੁਰੱਖਿਆ ਸਾਡੇ ਸਾਰੇ ਮਾਡਲ ਜਾਰੀ ਕਰਨ ਦੇ ਢੰਗ ਦੀ ਬੁਨਿਆਦ ਹੈ ਅਤੇ ਓਪਨ ਮਾਡਲਾਂ ਲਈ ਇਹ ਖ਼ਾਸ ਮਹੱਤਵ ਰੱਖਦੀ ਹੈ. ਮਾਡਲਾਂ ਨੂੰ ਵਿਆਪਕ ਸੁਰੱਖਿਆ ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਮੁਲਾਂਕਣਾਂ ਵਿੱਚੋਂ ਲੰਘਾਉਣ ਤੋਂ ਇਲਾਵਾ, ਅਸੀਂ gpt-oss-120b ਦੇ ਇੱਕ adversarially fine-tuned ਵਰਜਨ ਨੂੰ ਆਪਣੇ ਪ੍ਰਿਪੇਅਰਡਨੈਸ ਫ੍ਰੇਮਵਰਕ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਅਧੀਨ ਟੈਸਟ ਕਰਕੇ ਮੁਲਾਂਕਣ ਦੀ ਇੱਕ ਵਾਧੂ ਪਰਤ ਵੀ ਜੋੜੀ. gpt-oss ਮਾਡਲ ਅੰਦਰੂਨੀ ਸੁਰੱਖਿਆ ਬੈਂਚਮਾਰਕਾਂ 'ਤੇ ਸਾਡੇ ਅਤਿ-ਆਧੁਨਿਕ ਮਾਡਲਾਂ ਦੇ ਤੁਲਨਾਤਮਕ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਸਾਡੇ ਹਾਲੀਆ proprietary ਮਾਡਲਾਂ ਵਰਗੇ ਹੀ ਸੁਰੱਖਿਆ ਮਾਪਦੰਡ ਮਿਲਦੇ ਹਨ. ਅਸੀਂ ਇਸ ਕੰਮ ਦੇ ਨਤੀਜੇ ਅਤੇ ਹੋਰ ਵੇਰਵੇ ਇੱਕ ਰਿਸਰਚ ਪੇਪਰ ਵਿੱਚ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਅਤੇ ਮਾਡਲ ਕਾਰਡ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵਿੱਚ ਸਾਂਝੇ ਕਰ ਰਹੇ ਹਾਂ. ਸਾਡੀ ਵਿਧੀ ਦੀ ਬਾਹਰੀ ਵਿਸ਼ੇਸ਼ਗਿਆਨਾਂ ਦੁਆਰਾ ਸਮੀਖਿਆ ਕੀਤੀ ਗਈ ਸੀ ਅਤੇ ਇਹ ਓਪਨ-ਵੇਟ ਮਾਡਲਾਂ ਲਈ ਨਵੇਂ ਸੁਰੱਖਿਆ ਮਾਪਦੰਡ ਨਿਰਧਾਰਤ ਕਰਨ ਵੱਲ ਇੱਕ ਕਦਮ ਹੈ.
ਅਸੀਂ ਸ਼ੁਰੂਆਤੀ ਭਾਗੀਦਾਰਾਂ ਜਿਵੇਂ AI Sweden(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ), Orange(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ), ਅਤੇ Snowflake(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨਾਲ ਵੀ ਕੰਮ ਕਰ ਰਹੇ ਹਾਂ ਤਾਂ ਜੋ ਸਾਡੇ ਓਪਨ ਮਾਡਲਾਂ ਦੇ ਅਸਲ-ਦੁਨੀਆਈ ਐਪਲੀਕੇਸ਼ਨਾਂ ਬਾਰੇ ਸਿੱਖ ਸਕੀਏ, ਡਾਟਾ ਸੁਰੱਖਿਆ ਲਈ ਇਹ ਮਾਡਲ on-premises ਹੋਸਟ ਕਰਨ ਤੋਂ ਲੈ ਕੇ ਵਿਸ਼ੇਸ਼ ਡਾਟਾਸੈਟਾਂ 'ਤੇ fine-tune ਕਰਨ ਤੱਕ. ਅਸੀਂ ਇਹ ਸ਼੍ਰੇਸ਼ਠ-ਦਰਜੇ ਦੇ ਓਪਨ ਮਾਡਲ ਹਰ ਕਿਸੇ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣ ਲਈ ਦੇ ਕੇ ਉਤਸ਼ਾਹਿਤ ਹਾਂ—ਵਿਅਕਤੀਗਤ ਡਿਵੈਲਪਰਾਂ ਤੋਂ ਵੱਡੀਆਂ ਸੰਸਥਾਵਾਂ ਅਤੇ ਸਰਕਾਰਾਂ ਤੱਕ—ਤਾਂ ਜੋ ਉਹ ਆਪਣੇ ਹੀ ਇਨਫਰਾਸਟਰਕਚਰ 'ਤੇ AI ਚਲਾ ਅਤੇ ਕਸਟਮਾਈਜ਼ ਕਰ ਸਕਣ. ਸਾਡੇ API ਵਿੱਚ ਉਪਲਬਧ ਮਾਡਲਾਂ ਨਾਲ ਮਿਲਾਕੇ, ਡਿਵੈਲਪਰ AI ਵਰਕਫਲੋਜ਼ ਲਈ ਲੋੜੀਂਦੀ performance, cost, ਅਤੇ latency ਚੁਣ ਸਕਦੇ ਹਨ.
gpt-oss ਮਾਡਲਾਂ ਨੂੰ ਸਾਡੀਆਂ ਸਭ ਤੋਂ ਅਗੇਤਰਨ ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਪੋਸਟ-ਟ੍ਰੇਨਡ ਤਕਨੀਕਾਂ ਨਾਲ ਟ੍ਰੇਨ ਕੀਤਾ ਗਿਆ ਸੀ, ਜਿਸ ਵਿੱਚ ਰੀਜ਼ਨਿੰਗ, ਕੁਸ਼ਲਤਾ ਅਤੇ ਵੱਖ-ਵੱਖ ਡਿਪਲੋਇਮੈਂਟ ਮਾਹੌਲਾਂ ਵਿੱਚ ਅਸਲ-ਦੁਨੀਆਈ ਵਰਤੋਂਯੋਗਤਾ 'ਤੇ ਖ਼ਾਸ ਧਿਆਨ ਦਿੱਤਾ ਗਿਆ. ਹਾਲਾਂਕਿ ਅਸੀਂ Whisper ਅਤੇ CLIP ਸਮੇਤ ਹੋਰ ਮਾਡਲ ਖੁੱਲ੍ਹੇ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਕਰਵਾਏ ਹਨ, gpt-oss ਮਾਡਲ GPT‑2[1] ਤੋਂ ਬਾਅਦ ਸਾਡੇ ਪਹਿਲੇ ਓਪਨ-ਵੇਟ ਭਾਸ਼ਾ ਮਾਡਲ ਹਨ.
ਹਰ ਮਾਡਲ ਇੱਕ ਟ੍ਰਾਂਸਫਾਰਮਰ ਹੈ ਜੋ ਇਨਪੁੱਟ ਪ੍ਰੋਸੈਸ ਕਰਨ ਲਈ ਲੋੜੀਂਦੇ ਸਰਗਰਮ ਪੈਰਾਮੀਟਰਾਂ ਦੀ ਗਿਣਤੀ ਘਟਾਉਣ ਵਾਸਤੇ mixture-of-experts (MoE[2]) ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ. gpt-oss-120b ਹਰ ਟੋਕਨ ਲਈ 5.1B ਪੈਰਾਮੀਟਰ ਸਰਗਰਮ ਕਰਦਾ ਹੈ, ਜਦਕਿ gpt-oss-20b 3.6B ਸਰਗਰਮ ਕਰਦਾ ਹੈ. ਮਾਡਲਾਂ ਵਿੱਚ ਕ੍ਰਮਵਾਰ 117b ਅਤੇ 21b ਕੁੱਲ ਪੈਰਾਮੀਟਰ ਹਨ. ਮਾਡਲ GPT‑3[3] ਵਰਗੇ alternating dense ਅਤੇ locally banded sparse attention patterns ਵਰਤਦੇ ਹਨ. ਇੰਫਰੈਂਸ ਅਤੇ ਮੈਮਰੀ ਕੁਸ਼ਲਤਾ ਲਈ, ਮਾਡਲ 8 ਦੇ group size ਨਾਲ grouped multi-query attention ਵੀ ਵਰਤਦੇ ਹਨ. ਅਸੀਂ positional encoding ਲਈ Rotary Positional Embedding (RoPE[4]) ਵਰਤਦੇ ਹਾਂ, ਅਤੇ ਮੂਲ ਤੌਰ 'ਤੇ 128k ਤੱਕ ਦੀ ਕੰਟੈਕਸਟ ਲੰਬਾਈ ਦਾ ਸਮਰਥਨ ਕਰਦੇ ਹਾਂ.
ਮਾਡਲ | ਲੇਅਰ | ਕੁੱਲ ਪੈਰਾਮੀਟਰ | ਹਰ ਟੋਕਨ ਲਈ ਸਰਗਰਮ ਪੈਰਾਮੀਟਰ | ਕੁੱਲ ਐਕਸਪਰਟ | ਹਰ ਟੋਕਨ ਲਈ ਸਰਗਰਮ ਐਕਸਪਰਟ | ਕੰਟੈਕਸਟ ਲੰਬਾਈ |
gpt-oss-120b | 36 | 117B | 5.1B | 128 | 4 | 128k |
gpt-oss-20b | 24 | 21B | 3.6B | 32 | 4 | 128k |
ਅਸੀਂ ਮਾਡਲਾਂ ਨੂੰ ਮੁੱਖ ਤੌਰ 'ਤੇ ਅੰਗਰੇਜ਼ੀ, ਕੇਵਲ-ਟੈਕਸਟ ਡਾਟਾਸੈਟ 'ਤੇ ਟ੍ਰੇਨ ਕੀਤਾ, ਜਿਸ ਦਾ ਧਿਆਨ STEM, ਕੋਡਿੰਗ ਅਤੇ ਆਮ ਗਿਆਨ 'ਤੇ ਸੀ. ਅਸੀਂ ਡਾਟਾ ਨੂੰ ਆਪਣੇ ਉਸ tokenizer ਦੇ superset ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਟੋਕਨਾਈਜ਼ ਕੀਤਾ ਜੋ OpenAI o4-mini ਅਤੇ GPT‑4o ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ: o200k_harmony, ਜਿਸ ਨੂੰ ਅਸੀਂ ਅੱਜ ਓਪਨ-ਸੋਰਸ ਵੀ ਕਰ ਰਹੇ ਹਾਂ.
ਸਾਡੇ ਮਾਡਲਾਂ ਦੀ ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਟ੍ਰੇਨਿੰਗ ਬਾਰੇ ਹੋਰ ਜਾਣਨ ਲਈ, ਮਾਡਲ ਕਾਰਡ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਪੜ੍ਹੋ.
ਮਾਡਲਾਂ ਨੂੰ o4-mini ਲਈ ਵਰਤੀ ਗਈ ਸਮਾਨ ਪ੍ਰਕਿਰਿਆ ਨਾਲ ਪੋਸਟ-ਟ੍ਰੇਨਡ ਕੀਤਾ ਗਿਆ ਸੀ, ਜਿਸ ਵਿੱਚ ਸੁਪਰਵਾਈਜ਼ਡ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਚਰਨ ਅਤੇ ਉੱਚ-ਕੰਪਿਊਟ RL ਚਰਨ ਸ਼ਾਮਲ ਸੀ. ਸਾਡਾ ਉਦੇਸ਼ ਮਾਡਲਾਂ ਨੂੰ OpenAI Model Spec(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨਾਲ ਅਲਾਈਨ ਕਰਨਾ ਅਤੇ ਉੱਤਰ ਦੇਣ ਤੋਂ ਪਹਿਲਾਂ CoT ਰੀਜ਼ਨਿੰਗ ਅਤੇ ਟੂਲ ਵਰਤੋਂ ਲਾਗੂ ਕਰਨਾ ਸਿਖਾਉਣਾ ਸੀ. ਸਾਡੇ SoTA proprietary ਰੀਜ਼ਨਿੰਗ ਮਾਡਲਾਂ ਵਰਗੀਆਂ ਹੀ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ, ਇਹ ਮਾਡਲ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਤੋਂ ਬਾਅਦ ਅਸਾਧਾਰਣ ਸਮਰੱਥਾਵਾਂ ਦਿਖਾਉਂਦੇ ਹਨ.
API ਵਿੱਚ OpenAI o-series ਰੀਜ਼ਨਿੰਗ ਮਾਡਲਾਂ ਵਾਂਗ, ਇਹ ਦੋ ਓਪਨ-ਵੇਟ ਮਾਡਲ ਤਿੰਨ reasoning efforts—low, medium, ਅਤੇ high—ਦਾ ਸਮਰਥਨ ਕਰਦੇ ਹਨ, ਜੋ latency ਅਤੇ performance ਵਿੱਚ ਸੰਤੁਲਨ ਬਣਾਉਂਦੇ ਹਨ. ਡਿਵੈਲਪਰ system message ਵਿੱਚ ਇੱਕ ਹੀ ਵਾਕ ਨਾਲ reasoning effort ਆਸਾਨੀ ਨਾਲ ਸੈੱਟ ਕਰ ਸਕਦੇ ਹਨ.
ਅਸੀਂ gpt-oss-120b ਅਤੇ gpt-oss-20b ਦਾ ਮਿਆਰੀ ਅਕਾਦਮਿਕ ਬੈਂਚਮਾਰਕਾਂ 'ਤੇ ਮੁਲਾਂਕਣ ਕੀਤਾ ਤਾਂ ਜੋ ਕੋਡਿੰਗ, ਮੁਕਾਬਲਾਤੀ ਗਣਿਤ, ਸਿਹਤ ਅਤੇ ਏਜੰਟਿਕ ਟੂਲ ਵਰਤੋਂ ਵਿੱਚ ਉਨ੍ਹਾਂ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਹੋਰ OpenAI ਰੀਜ਼ਨਿੰਗ ਮਾਡਲਾਂ ਜਿਵੇਂ o3, o3‑mini ਅਤੇ o4-mini ਨਾਲ ਤੁਲਨਾ ਕਰਕੇ ਮਾਪਿਆ ਜਾ ਸਕੇ.
gpt-oss-120b OpenAI o3‑mini ਤੋਂ ਬਿਹਤਰ ਹੈ ਅਤੇ ਮੁਕਾਬਲਾਤੀ ਕੋਡਿੰਗ (Codeforces), ਆਮ ਸਮੱਸਿਆ ਹੱਲ (MMLU ਅਤੇ HLE) ਅਤੇ ਟੂਲ ਕਾਲਿੰਗ (TauBench) ਵਿੱਚ OpenAI o4-mini ਦੇ ਬਰਾਬਰ ਜਾਂ ਉਸ ਤੋਂ ਉੱਪਰ ਹੈ. ਇਹ ਸਿਹਤ-ਸਬੰਧੀ ਪ੍ਰਸ਼ਨਾਂ (HealthBench) ਅਤੇ ਮੁਕਾਬਲਾਤੀ ਗਣਿਤ (AIME 2024 & 2025) ਵਿੱਚ o4-mini ਤੋਂ ਵੀ ਵਧੀਆ ਨਤੀਜੇ ਦਿੰਦਾ ਹੈ. gpt-oss-20b ਆਪਣੇ ਛੋਟੇ ਆਕਾਰ ਦੇ ਬਾਵਜੂਦ ਇਨ੍ਹਾਂ ਹੀ evals 'ਤੇ OpenAI o3‑mini ਦੇ ਬਰਾਬਰ ਜਾਂ ਉਸ ਤੋਂ ਵੱਧ ਹੈ, ਅਤੇ ਮੁਕਾਬਲਾਤੀ ਗਣਿਤ ਅਤੇ ਸਿਹਤ ਵਿੱਚ ਤਾਂ ਇਸ ਤੋਂ ਵੀ ਅੱਗੇ ਨਿਕਲਦਾ ਹੈ.
gpt-oss ਮਾਡਲ ਕਿਸੇ ਮੈਡੀਕਲ ਪੇਸ਼ੇਵਰ ਦਾ ਬਦਲ ਨਹੀਂ ਹਨ ਅਤੇ ਬਿਮਾਰੀ ਦੀ ਨਿਦਾਨ ਜਾਂ ਇਲਾਜ ਲਈ ਨਹੀਂ ਬਣੇ
ਉਦਾਹਰਨ ਰੋਲਆਉਟਸ
gpt-oss-120b ਬ੍ਰਾਊਜ਼ਿੰਗ ਟੂਲ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਤਾਜ਼ਾ ਜਾਣਕਾਰੀ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਇਕੱਠਾ ਕਰ ਸਕਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਬਾਅਦ ਦੀਆਂ ਦਰਜਨਾਂ ਕਾਲਾਂ ਨੂੰ ਲੜੀਵਾਰ ਜੋੜਨਾ ਵੀ ਸ਼ਾਮਲ ਹੈ.
ਸਾਡੀ ਹਾਲੀਆ ਰਿਸਰਚ ਨੇ ਦਿਖਾਇਆ ਹੈ ਕਿ ਰੀਜ਼ਨਿੰਗ ਮਾਡਲ ਦੀ CoT ਦੀ ਨਿਗਰਾਨੀ ਗਲਤ ਵਿਵਹਾਰ ਦੀ ਪਛਾਣ ਲਈ ਮਦਦਗਾਰ ਹੋ ਸਕਦੀ ਹੈ, ਜਦ ਤੱਕ ਮਾਡਲ ਨੂੰ CoT ਨੂੰ ਅਲਾਈਨ ਕਰਨ ਲਈ ਸਿੱਧੀ ਨਿਗਰਾਨੀ ਨਾਲ ਟ੍ਰੇਨ ਨਾ ਕੀਤਾ ਗਿਆ ਹੋਵੇ. ਇਸ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਨੂੰ ਉਦਯੋਗ ਵਿੱਚ ਹੋਰਾਂ ਦੁਆਰਾ ਵੀ ਸਾਂਝਾ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਕੀਤਾ ਜਾਂਦਾ ਹੈ. OpenAI o1‑preview ਲਾਂਚ ਕਰਨ ਤੋਂ ਲੈ ਕੇ ਸਾਡੇ ਸਿਧਾਂਤਾਂ ਦੇ ਅਨੁਸਾਰ, ਅਸੀਂ ਕਿਸੇ ਵੀ gpt-oss ਮਾਡਲ ਦੀ CoT 'ਤੇ ਕੋਈ ਸਿੱਧੀ ਨਿਗਰਾਨੀ ਨਹੀਂ ਲਗਾਈ. ਸਾਡਾ ਵਿਸ਼ਵਾਸ ਹੈ ਕਿ ਮਾਡਲ ਦੇ ਗਲਤ ਵਿਵਹਾਰ, ਧੋਖੇ ਅਤੇ ਦੁਰਵਰਤੋਂ ਦੀ ਨਿਗਰਾਨੀ ਲਈ ਇਹ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਹੈ. ਸਾਡੀ ਉਮੀਦ ਹੈ ਕਿ non-supervised chain of thought ਵਾਲਾ ਓਪਨ ਮਾਡਲ ਜਾਰੀ ਕਰਨ ਨਾਲ ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਰਿਸਰਚਰਾਂ ਨੂੰ ਆਪਣੇ CoT monitoring systems 'ਤੇ ਰਿਸਰਚ ਅਤੇ implementation ਕਰਨ ਦਾ ਮੌਕਾ ਮਿਲੇਗਾ.
ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਆਪਣੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ CoTs ਸਿੱਧੇ ਯੂਜ਼ਰਾਂ ਨੂੰ ਨਹੀਂ ਦਿਖਾਉਣੇ ਚਾਹੀਦੇ. ਇਨ੍ਹਾਂ ਵਿੱਚ hallucinated ਜਾਂ ਹਾਨੀਕਾਰਕ ਸਮੱਗਰੀ ਹੋ ਸਕਦੀ ਹੈ, ਜਿਸ ਵਿੱਚ ਅਜਿਹੀ ਭਾਸ਼ਾ ਵੀ ਸ਼ਾਮਲ ਹੋ ਸਕਦੀ ਹੈ ਜੋ OpenAI ਦੀਆਂ ਮਿਆਰੀ ਸੁਰੱਖਿਆ ਨੀਤੀਆਂ ਨੂੰ ਨਹੀਂ ਦਰਸਾਉਂਦੀ, ਅਤੇ ਇਹ ਅਜਿਹੀ ਜਾਣਕਾਰੀ ਵੀ ਸ਼ਾਮਲ ਕਰ ਸਕਦੀ ਹੈ ਜਿਸਨੂੰ ਮਾਡਲ ਨੂੰ ਅੰਤਿਮ ਆਉਟਪੁੱਟ ਵਿੱਚ ਨਾ ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ ਕਿਹਾ ਗਿਆ ਹੋਵੇ.
gpt-oss-120b ਆਪਣੇ ਆਉਟਪੁੱਟ ਵਿੱਚ ਸਿਸਟਮ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਮਜ਼ਬੂਤੀ ਨਾਲ ਪਾਲਣਾ ਕਰਦਾ ਹੈ, ਪਰ ਆਪਣੀ CoT ਵਿੱਚ ਅਕਸਰ ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਅਣਗਹਿਲੀ ਕਰੇਗਾ.
gpt-oss ਮਾਡਲ ਸੁਰੱਖਿਆ ਟ੍ਰੇਨਿੰਗ ਲਈ ਸਾਡੇ state-of-the-art ਤਰੀਕਿਆਂ ਦਾ ਲਾਭ ਲੈਂਦੇ ਹਨ. ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਦੌਰਾਨ, ਅਸੀਂ Chemical, Biological, Radiological, and Nuclear (CBRN) ਨਾਲ ਸੰਬੰਧਿਤ ਕੁਝ ਹਾਨੀਕਾਰਕ ਡਾਟਾ ਨੂੰ ਫਿਲਟਰ ਕੀਤਾ. ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਦੌਰਾਨ, ਅਸੀਂ ਸੋਚ-ਵਿਚਾਰ ਆਧਾਰਿਤ ਅਲਾਈਨਮੈਂਟ ਅਤੇ instruction hierarchy(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮਾਡਲ ਨੂੰ ਅਸੁਰੱਖਿਅਤ ਪ੍ਰੌੰਪਟਾਂ ਨੂੰ ਰੱਦ ਕਰਨਾ ਅਤੇ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਤੋਂ ਬਚਾਅ ਕਰਨਾ ਸਿਖਾਇਆ.
ਜਦੋਂ ਕੋਈ ਓਪਨ-ਵੇਟ ਮਾਡਲ ਜਾਰੀ ਹੋ ਜਾਂਦਾ ਹੈ, ਵਿਰੋਧੀ ਉਸਨੂੰ ਦੁਰਾਸਤੀ ਉਦੇਸ਼ਾਂ ਲਈ fine-tune ਕਰਨ ਦੇ ਯੋਗ ਹੋ ਸਕਦੇ ਹਨ. ਅਸੀਂ ਇਨ੍ਹਾਂ ਖ਼ਤਰਿਆਂ ਦਾ ਸਿੱਧਾ ਮੁਲਾਂਕਣ ਮਾਡਲ ਨੂੰ ਵਿਸ਼ੇਸ਼ ਜੀਵ ਵਿਗਿਆਨ ਅਤੇ ਸਾਇਬਰਸੁਰੱਖਿਆ ਡਾਟਾ 'ਤੇ fine-tune ਕਰਕੇ ਕੀਤਾ, ਅਤੇ ਹਰੇਕ ਖੇਤਰ ਲਈ ਇੱਕ domain-specific non-refusing ਵਰਜਨ ਉਸੇ ਤਰੀਕੇ ਨਾਲ ਬਣਾਇਆ ਜਿਵੇਂ ਕੋਈ ਹਮਲਾਵਰ ਕਰ ਸਕਦਾ ਹੈ. ਫਿਰ ਅਸੀਂ ਅੰਦਰੂਨੀ ਅਤੇ ਬਾਹਰੀ ਟੈਸਟਿੰਗ ਰਾਹੀਂ ਇਨ੍ਹਾਂ ਮਾਡਲਾਂ ਦੀ ਸਮਰੱਥਾ ਪੱਧਰ ਦਾ ਮੁਲਾਂਕਣ ਕੀਤਾ. ਜਿਵੇਂ ਸਾਡੇ ਨਾਲ ਲੱਗਦੇ ਸੁਰੱਖਿਆ ਪੇਪਰ ਵਿੱਚ ਵੇਰਵਾ ਦਿੱਤਾ ਗਿਆ ਹੈ, ਇਸ ਟੈਸਟਿੰਗ ਨੇ ਦਰਸਾਇਆ ਕਿ OpenAI ਦੇ ਖੇਤਰ-ਅਗੇਤਰਨ ਟ੍ਰੇਨਿੰਗ ਸਟੈਕ ਦੀ ਵਰਤੋਂ ਕਰਨ ਵਾਲੀ ਮਜ਼ਬੂਤ fine-tuning ਦੇ ਬਾਵਜੂਦ, ਇਹ ਦੁਰਾਸਤੀ ਤਰੀਕੇ ਨਾਲ fine-tune ਕੀਤੇ ਮਾਡਲ ਸਾਡੇ ਪ੍ਰਿਪੇਅਰਡਨੈਸ ਫ੍ਰੇਮਵਰਕ ਮੁਤਾਬਕ ਉੱਚ ਸਮਰੱਥਾ ਪੱਧਰ ਤੱਕ ਨਹੀਂ ਪਹੁੰਚ ਸਕੇ. ਇਸ malicious fine-tuning ਵਿਧੀ ਦੀ ਤਿੰਨ ਸੁਤੰਤਰ ਵਿਸ਼ੇਸ਼ਗਿਆਨ ਸਮੂਹਾਂ ਦੁਆਰਾ ਸਮੀਖਿਆ ਕੀਤੀ ਗਈ, ਜਿਨ੍ਹਾਂ ਨੇ ਟ੍ਰੇਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਅਤੇ ਮੁਲਾਂਕਣ ਸੁਧਾਰਨ ਲਈ ਸਿਫ਼ਾਰਸ਼ਾਂ ਦਿੱਤੀਆਂ, ਜਿਨ੍ਹਾਂ ਵਿੱਚੋਂ ਬਹੁਤੀਆਂ ਅਸੀਂ ਅਪਣਾਈਆਂ. ਅਸੀਂ ਇਹ ਸਿਫ਼ਾਰਸ਼ਾਂ ਮਾਡਲ ਕਾਰਡ ਵਿੱਚ ਵਿਸਥਾਰ ਨਾਲ ਦੱਸਦੇ ਹਾਂ. ਇਹ ਪ੍ਰਕਿਰਿਆਵਾਂ ਓਪਨ ਮਾਡਲ ਸੁਰੱਖਿਆ ਲਈ ਇੱਕ ਅਰਥਪੂਰਨ ਤਰੱਕੀ ਨੂੰ ਦਰਸਾਉਂਦੀਆਂ ਹਨ. ਇਨ੍ਹਾਂ ਨਤੀਜਿਆਂ ਨੇ gpt-oss ਮਾਡਲ ਜਾਰੀ ਕਰਨ ਬਾਰੇ ਸਾਡੇ ਫੈਸਲੇ ਨੂੰ ਜਾਣਕਾਰੀ ਦਿੱਤੀ. ਅਸੀਂ ਆਸ ਕਰਦੇ ਹਾਂ ਕਿ ਇਹ ਮਾਡਲ ਪੂਰੇ ਉਦਯੋਗ ਵਿੱਚ ਸੁਰੱਖਿਆ ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਅਲਾਈਨਮੈਂਟ ਰਿਸਰਚ ਨੂੰ ਤੇਜ਼ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਨਗੇ.
ਇੱਕ ਹੋਰ ਸੁਰੱਖਿਅਤ open source ecosystem ਵਿੱਚ ਯੋਗਦਾਨ ਦੇਣ ਲਈ, ਅਸੀਂ ਰੈਡ ਟੀਮਿੰਗ ਚੈਲੈਂਜ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਹੋਸਟ ਕਰ ਰਹੇ ਹਾਂ ਤਾਂ ਜੋ ਦੁਨੀਆ ਭਰ ਦੇ ਰਿਸਰਚਰ, ਡਿਵੈਲਪਰ ਅਤੇ ਉਤਸ਼ਾਹੀ ਨਵੀਆਂ ਸੁਰੱਖਿਆ ਸਮੱਸਿਆਵਾਂ ਦੀ ਪਛਾਣ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਨ. ਇਸ ਚੈਲੈਂਜ ਲਈ $500,000 ਦਾ ਇਨਾਮੀ ਫੰਡ ਹੈ, ਜੋ OpenAI ਅਤੇ ਹੋਰ ਅਗੇਤਰਨ ਲੈਬਾਂ ਦੇ ਵਿਸ਼ੇਸ਼ਗਿਆਨ ਜੱਜਾਂ ਦੇ ਪੈਨਲ ਦੀ ਸਮੀਖਿਆ ਦੇ ਅਧਾਰ 'ਤੇ ਦਿੱਤਾ ਜਾਵੇਗਾ. ਚੈਲੈਂਜ ਦੇ ਅੰਤ 'ਤੇ, ਅਸੀਂ ਇੱਕ ਰਿਪੋਰਟ ਪ੍ਰਕਾਸ਼ਿਤ ਕਰਾਂਗੇ ਅਤੇ ਪ੍ਰਮਾਣਿਤ ਨਤੀਜਿਆਂ ਦੇ ਆਧਾਰ 'ਤੇ ਇੱਕ ਮੁਲਾਂਕਣ ਡਾਟਾ ਸੈੱਟ ਓਪਨ-ਸੋਰਸ ਕਰਾਂਗੇ, ਤਾਂ ਜੋ ਵੱਡਾ ਸਮੁਦਾਇ ਤੁਰੰਤ ਲਾਭ ਲੈ ਸਕੇ. ਹੋਰ ਜਾਣੋ ਅਤੇ ਇੱਥੇ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਹਿੱਸਾ ਲਓ.
gpt-oss-120b ਅਤੇ gpt-oss-20b ਦੋਵੇਂ ਦੇ weights Hugging Face 'ਤੇ ਡਾਊਨਲੋਡ ਲਈ ਮੁਫ਼ਤ ਉਪਲਬਧ ਹਨ ਅਤੇ ਮੂਲ ਤੌਰ 'ਤੇ MXFP4 ਵਿੱਚ quantized ਹਨ. ਇਸ ਨਾਲ gpt-oss-120B ਮਾਡਲ 80GB ਮੈਮਰੀ ਵਿੱਚ ਚੱਲ ਸਕਦਾ ਹੈ, ਜਦਕਿ gpt-oss-20b ਲਈ ਕੇਵਲ 16GB ਦੀ ਲੋੜ ਹੈ.
ਮਾਡਲਾਂ ਨੂੰ ਸਾਡੇ harmony prompt format(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) 'ਤੇ ਪੋਸਟ-ਟ੍ਰੇਨਡ ਕੀਤਾ ਗਿਆ ਹੈ, ਅਤੇ ਅਸੀਂ adoption ਆਸਾਨ ਬਣਾਉਣ ਲਈ Python ਅਤੇ Rust ਦੋਵੇਂ ਵਿੱਚ ਇੱਕ harmony renderer(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਓਪਨ-ਸੋਰਸ ਕਰ ਰਹੇ ਹਾਂ. ਅਸੀਂ PyTorch ਨਾਲ ਅਤੇ Apple ਦੇ Metal ਪਲੇਟਫਾਰਮ 'ਤੇ ਇੰਫਰੈਂਸ ਚਲਾਉਣ ਲਈ reference implementations ਵੀ ਜਾਰੀ ਕਰ ਰਹੇ ਹਾਂ, ਨਾਲ ਹੀ ਮਾਡਲ ਲਈ ਉਦਾਹਰਨ ਟੂਲਾਂ ਦਾ ਇਕ ਸੰਗ੍ਰਹਿ.
ਅਸੀਂ ਇਨ੍ਹਾਂ ਮਾਡਲਾਂ ਨੂੰ ਲਚਕੀਲਾ ਅਤੇ ਕਿਤੇ ਵੀ ਆਸਾਨੀ ਨਾਲ ਚਲਣਯੋਗ ਬਣਾਇਆ ਹੈ—ਲੋਕਲ, ਆਨ-ਡਿਵਾਈਸ, ਜਾਂ third-party inference providers ਰਾਹੀਂ. ਇਸ ਦਾ ਸਮਰਥਨ ਕਰਨ ਲਈ, ਅਸੀਂ ਲਾਂਚ ਤੋਂ ਪਹਿਲਾਂ Azure, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare, ਅਤੇ OpenRouter ਵਰਗੇ ਅਗੇਤਰਨ deployment platforms ਨਾਲ ਭਾਗੀਦਾਰੀ ਕੀਤੀ ਤਾਂ ਜੋ ਮਾਡਲ ਡਿਵੈਲਪਰਾਂ ਲਈ ਵਿਸਤਾਰ ਨਾਲ ਉਪਲਬਧ ਹੋਣ. ਹਾਰਡਵੇਅਰ ਪੱਖੋਂ, ਅਸੀਂ NVIDIA, AMD, Cerebras, ਅਤੇ Groq ਸਮੇਤ ਉਦਯੋਗ ਅਗੂਆਂ ਨਾਲ ਕੰਮ ਕੀਤਾ ਤਾਂ ਜੋ ਵੱਖ-ਵੱਖ ਸਿਸਟਮਾਂ ਵਿੱਚ ਓਪਟੀਮਾਈਜ਼ਡ performance ਯਕੀਨੀ ਬਣਾਈ ਜਾ ਸਕੇ.
ਅੱਜ ਦੀ ਰਿਲੀਜ਼ ਦੇ ਹਿੱਸੇ ਵਜੋਂ, Microsoft Windows ਡਿਵਾਈਸਾਂ ਲਈ gpt-oss-20b ਮਾਡਲ ਦੇ GPU-optimized ਵਰਜਨ ਵੀ ਲਿਆ ਰਿਹਾ ਹੈ. ONNX Runtime ਦੁਆਰਾ ਸੰਚਾਲਿਤ, ਇਹ ਮਾਡਲ ਲੋਕਲ ਇੰਫਰੈਂਸ ਦਾ ਸਮਰਥਨ ਕਰਦੇ ਹਨ ਅਤੇ Foundry Local ਅਤੇ VS Code ਲਈ AI Toolkit ਰਾਹੀਂ ਉਪਲਬਧ ਹਨ, ਜਿਸ ਨਾਲ Windows ਡਿਵੈਲਪਰਾਂ ਲਈ ਓਪਨ ਮਾਡਲਾਂ ਨਾਲ ਬਣਾਉਣਾ ਹੋਰ ਆਸਾਨ ਹੁੰਦਾ ਹੈ.
ਉਹ ਡਿਵੈਲਪਰ ਜੋ ਪੂਰੀ ਤਰ੍ਹਾਂ ਕਸਟਮਾਈਜ਼ ਕਰਨ ਯੋਗ ਮਾਡਲ ਚਾਹੁੰਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਉਹ ਆਪਣੇ ਮਾਹੌਲਾਂ ਵਿੱਚ fine-tune ਅਤੇ deploy ਕਰ ਸਕਣ, ਉਨ੍ਹਾਂ ਲਈ gpt-oss ਬਹੁਤ ਵਧੀਆ ਚੋਣ ਹੈ. ਜਿਹੜੇ ਲੋਕ multimodal support, built-in tools, ਅਤੇ ਸਾਡੇ ਪਲੇਟਫਾਰਮ ਨਾਲ seamless integration ਦੀ ਖੋਜ ਵਿੱਚ ਹਨ, ਉਨ੍ਹਾਂ ਲਈ ਸਾਡੇ API ਪਲੇਟਫਾਰਮ ਰਾਹੀਂ ਉਪਲਬਧ ਮਾਡਲ ਹਾਲੇ ਵੀ ਸਭ ਤੋਂ ਵਧੀਆ ਵਿਕਲਪ ਹਨ. ਅਸੀਂ ਡਿਵੈਲਪਰ ਫੀਡਬੈਕ ਨੂੰ ਧਿਆਨ ਨਾਲ ਸੁਣਦੇ ਰਹਿੰਦੇ ਹਾਂ ਅਤੇ ਭਵਿੱਖ ਵਿੱਚ gpt-oss ਲਈ API support 'ਤੇ ਵਿਚਾਰ ਕਰ ਸਕਦੇ ਹਾਂ.
ਜੇ ਤੁਸੀਂ ਮਾਡਲ ਅਜ਼ਮਾਉਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਸਾਡੇ ਓਪਨ ਮਾਡਲ ਪਲੇਗ੍ਰਾਊਂਡ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) 'ਤੇ ਜਾਓ. ਵੱਖ-ਵੱਖ ecosystem providers ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮਾਡਲਾਂ ਨੂੰ ਕਿਵੇਂ ਵਰਤਣਾ ਹੈ ਜਾਂ ਮਾਡਲਾਂ ਨੂੰ ਕਿਵੇਂ fine-tune ਕਰਨਾ ਹੈ ਬਾਰੇ ਹੋਰ ਜਾਣਨ ਲਈ, ਸਾਡੀਆਂ ਗਾਈਡਾਂ ਵੇਖੋ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ).
gpt-oss-120b ਅਤੇ gpt-oss-20b ਦੀ ਰਿਲੀਜ਼ ਓਪਨ-ਵੇਟ ਮਾਡਲਾਂ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਹੈ. ਆਪਣੇ ਆਕਾਰ 'ਤੇ, ਇਹ ਮਾਡਲ ਰੀਜ਼ਨਿੰਗ ਸਮਰੱਥਾਵਾਂ ਅਤੇ ਸੁਰੱਖਿਆ ਦੋਵੇਂ ਵਿੱਚ ਅਰਥਪੂਰਨ ਤਰੱਕੀ ਦਿੰਦੇ ਹਨ. ਓਪਨ ਮਾਡਲ ਸਾਡੇ hosted models ਨੂੰ ਪੂਰਕ ਬਣਦੇ ਹਨ, ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਅਗੇਤਰਨ ਰਿਸਰਚ ਤੇਜ਼ ਕਰਨ, ਨਵੀਨਤਾ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਅਤੇ ਵੱਖ-ਵੱਖ ਵਰਤੋਂ ਮਾਮਲਿਆਂ ਵਿੱਚ ਹੋਰ ਸੁਰੱਖਿਅਤ, ਵਧੇਰੇ ਪਾਰਦਰਸ਼ੀ AI ਵਿਕਾਸ ਯੋਗ ਬਣਾਉਣ ਲਈ ਟੂਲਾਂ ਦੀ ਵਿਆਪਕ ਸ਼੍ਰੇਣੀ ਦਿੰਦੇ ਹਨ.
ਇਹ ਓਪਨ ਮਾਡਲ ਉਭਰਦੇ ਬਾਜ਼ਾਰਾਂ, ਸੀਮਿਤ ਸਰੋਤਾਂ ਵਾਲੇ ਖੇਤਰਾਂ ਅਤੇ ਛੋਟੀਆਂ ਸੰਸਥਾਵਾਂ ਲਈ ਰੁਕਾਵਟਾਂ ਵੀ ਘਟਾਉਂਦੇ ਹਨ, ਜਿਨ੍ਹਾਂ ਕੋਲ proprietary ਮਾਡਲ ਅਪਣਾਉਣ ਲਈ ਬਜਟ ਜਾਂ ਲਚਕੀਲਾਪਣ ਨਹੀਂ ਹੋ ਸਕਦਾ. ਆਪਣੇ ਹੱਥਾਂ ਵਿੱਚ ਸ਼ਕਤੀਸ਼ਾਲੀ ਅਤੇ ਪਹੁੰਚਯੋਗ ਟੂਲਾਂ ਨਾਲ, ਦੁਨੀਆ ਭਰ ਦੇ ਲੋਕ ਬਣਾਉਣ, ਨਵੀਨਤਾ ਕਰਨ ਅਤੇ ਆਪਣੇ ਅਤੇ ਹੋਰਨਾਂ ਲਈ ਨਵੀਆਂ ਸੰਭਾਵਨਾਵਾਂ ਪੈਦਾ ਕਰਨ ਦੇ ਯੋਗ ਹੋ ਸਕਦੇ ਹਨ. ਅਮਰੀਕਾ ਵਿੱਚ ਬਣੇ ਇਹ ਸਮਰੱਥ ਓਪਨ-ਵੇਟ ਮਾਡਲਾਂ ਤੱਕ ਵਿਆਪਕ ਪਹੁੰਚ ਲੋਕਤਾਂਤਰਿਕ AI rails ਨੂੰ ਵਿਸਤਾਰਿਤ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ.
ਇੱਕ ਸਿਹਤਮੰਦ ਓਪਨ ਮਾਡਲ ecosystem AI ਨੂੰ ਸਭ ਲਈ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਪਹੁੰਚਯੋਗ ਅਤੇ ਲਾਭਕਾਰੀ ਬਣਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਨ ਦਾ ਇੱਕ ਪਹਲੂ ਹੈ. ਅਸੀਂ ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਰਿਸਰਚਰਾਂ ਨੂੰ ਇਹ ਮਾਡਲ ਵਰਤ ਕੇ ਪ੍ਰਯੋਗ ਕਰਨ, ਸਹਿਯੋਗ ਕਰਨ ਅਤੇ ਸੰਭਾਵਨਾਵਾਂ ਦੀਆਂ ਹੱਦਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਲਈ ਸੱਦਾ ਦਿੰਦੇ ਹਾਂ. ਅਸੀਂ ਦੇਖਣ ਦੀ ਉਡੀਕ ਕਰ ਰਹੇ ਹਾਂ ਕਿ ਤੁਸੀਂ ਕੀ ਬਣਾਉਂਦੇ ਹੋ.
ਲੇਖਕ
ਹਵਾਲੇ
ਯੋਗਦਾਨਕਾਰ
Zoran Martinovic, Zhuohan Li, Zhiqing Sun, Zach Johnson, Yu Yang, Yu Bai, Yang Song, Xin Wang, Wenting Zhan, Volodymyr Kyrylov, Vlad Fomenko, Tyler Bertao, Tong Mu, Timur Garipov, Tarun Gogineni, Suvansh Sanjeev, Steve Mostovoy, Song Mei, Shengjia Zhao, Sebastien Bubeck, Scott McKinney, Scott Lessans, Sandhini Agarwal, Sam Toizer, Sam Altman, Saachi Jain, Romain Huet, Rahul K. Arora, Philippe Tillet, Olivia Watkins, Nivedita Brett, Nikhil Vyas, Miles Wang, Michihiro Yasunaga, Michelle Pokrass, Mia Glaese, Max Schwarzer, Mark Chen, Mario Lezcano-Casado, Marat Dukhan, Lukas Gross, Ludovic Peran, Ludovic Peran, Lindsay McCallum, Lin Yang, Lily (Xiaoxuan) Liu, Leher Pathak, Lama Ahmad, Kristian Georgiev, Kristen Ying, Kimmy Richardson, Kevin Whinnery, Kevin Weil, Kevin Lu, Kevin Fives, Kendal Simon, Katia Gil Guzman, Karan Singhal, Karan Singhal, Kai Chen, Josh McGrath, Jordan Liss, Jongsoo Park, John Hallman, Johannes Heidecke, Jiancheng Liu, Ji Lin, Jason Kwon, Jason Ai, James Park Lennon, Jakub Pachocki, Jacob Huh, Jackie Hehir, Irina Kofman, Huida Qiu, Hongyu Ren, Harshit Sikchi, Hannah Wong, Haitang Hu, Haitang Hu, Haiming Bao, Hadi Salman, Guillaume Leclerc, Greg Brockman, Gideon Myles, Giambattista Parascandolo, Gaby Raila, Foivos Tsimpourlas, Filippo Raso, Eugene Brevdo, Eric Wallace, Enoch Cheung, Elizabeth Proehl, Elaine Ya Le, Edwin Arbus, Eddie Zhang, Dominik Kundel, Dmitry Pimenov, David Robinson, Dane Stuckey, Dana Palmie, Dan Cook, Cyril Zhang, Chris Lu, Chris Koch, Che Chang, Cedric Whitney, Casey Dvorak, Carolina Paz, Brian Zhang, Bowen Baker, Bob Rotsted, Boaz Barak, Ashley Pantuliano, Andy Applebaum, Amy Wendling, Ally Bennett, Alexander Neitz, Alex Paino, Alex Nichol, Alec Helyar, Aidan McLaughlin, Aidan Clark, Adam Goucher


