12 ਮਈ 2026

Parameter Golf ਨੇ ਸਾਨੂੰ ਕੀ ਸਿਖਾਇਆ

1,000+ ਭਾਗੀਦਾਰਾਂ, 2,000+ ਸਬਮਿਸ਼ਨਾਂ, ਅਤੇ ਕੋਡਿੰਗ ਏਜੰਟਾਂ ਦੁਆਰਾ ਰੂਪ ਦਿੱਤੀ ਗਈ ਓਪਨ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਚੁਣੌਤੀ ਤੋਂ ਸਿੱਖਿਆ।

ਲੋਡ ਹੋ ਰਿਹਾ ਹੈ…

ਅਸੀਂ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਰਿਸਰਚ ਕਮਿਊਨਿਟੀ ਨੂੰ ਇੱਕ ਨਵੀਂ, ਬਹੁਤ ਹੀ ਕੜੀਆਂ ਸੀਮਾਵਾਂ ਵਾਲੀ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਸਮੱਸਿਆ ਦੀ ਪੜਚੋਲ ਵਿੱਚ ਸ਼ਾਮਲ ਕਰਨ ਅਤੇ ਸਹਾਇਤਾ ਦੇਣ ਲਈ Parameter Golf ਲਾਂਚ ਕੀਤਾ। ਅਸੀਂ ਚਾਹੁੰਦੇ ਸੀ ਕਿ ਚੁਣੌਤੀ ਇੰਨੀ ਦਿਲਚਸਪ ਹੋਵੇ ਕਿ ਅਸਲ ਤਕਨੀਕੀ ਰਚਨਾਤਮਕਤਾ ਨੂੰ ਰਿਵਾਰਡ ਦੇ ਸਕੇ, ਨਾਲ ਹੀ ਸੰਕਲਪਕ ਤੌਰ 'ਤੇ ਸਧਾਰਨ ਅਤੇ ਤਸਦੀਕ ਕਰਨ ਵਿੱਚ ਆਸਾਨ ਰਹੇ।

ਭਾਗੀਦਾਰਾਂ ਨੂੰ ਇੱਕ ਸਥਿਰ FineWeb ਡੇਟਾਸੈੱਟ 'ਤੇ ਹੋਲਡ-ਆਉਟ ਲੌਸ ਨੂੰ ਘੱਟ ਤੋਂ ਘੱਟ ਕਰਨਾ ਸੀ, ਜਦਕਿ ਉਹਨਾਂ ਨੂੰ 16 MB ਆਰਟੀਫੈਕਟ ਸੀਮਾ ਦੇ ਅੰਦਰ ਰਹਿਣਾ ਸੀ, ਜਿਸ ਵਿੱਚ ਮਾਡਲ ਵਜ਼ਨ ਅਤੇ ਟ੍ਰੇਨਿੰਗ ਕੋਡ ਦੋਵੇਂ ਸ਼ਾਮਲ ਸਨ, ਅਤੇ 8×H100s 'ਤੇ 10 ਮਿੰਟ ਦਾ ਟ੍ਰੇਨਿੰਗ ਬਜਟ ਸੀ। ਅਸੀਂ ਇੱਕ ਬੇਸਲਾਈਨ, ਡੇਟਾਸੈੱਟ ਅਤੇ ਮੁਲਾਂਕਣ ਸਕ੍ਰਿਪਟਾਂ ਪ੍ਰਦਾਨ ਕੀਤੀਆਂ ਤਾਂ ਜੋ ਭਾਗੀਦਾਰ ਰਿਪੋ ਨੂੰ ਫੋਰਕ ਕਰ ਸਕਣ, ਮਾਡਲ ਨੂੰ ਸੁਧਾਰ ਸਕਣ ਅਤੇ GitHub ਰਾਹੀਂ ਆਪਣੇ ਨਤੀਜੇ ਜਮ੍ਹਾਂ ਕਰ ਸਕਣ।

ਅੱਠ ਹਫ਼ਤਿਆਂ ਦੇ ਦੌਰਾਨ, ਸਾਨੂੰ 1,000 ਤੋਂ ਵੱਧ ਭਾਗੀਦਾਰਾਂ ਵੱਲੋਂ 2,000 ਤੋਂ ਵੱਧ ਸਬਮਿਸ਼ਨ ਪ੍ਰਾਪਤ ਹੋਏ। ਅਸੀਂ ਸਬਮਿਸ਼ਨਾਂ ਵਿੱਚ ਦਿਖਾਈ ਗਈ ਤਕਨੀਕੀ ਮੁਹਾਰਤ, ਰਚਨਾਤਮਕਤਾ ਅਤੇ ਨਿਯਮਾਂ ਤੋਂ ਪਰ੍ਹੇ ਜਾ ਕੇ ਕੀਤੇ ਗਏ ਕੰਮਾਂ ਤੋਂ ਬਹੁਤ ਪ੍ਰਭਾਵਿਤ ਹੋਏ ਹਾਂ; ਜਿਸ ਵਿੱਚ ਬਾਰੀਕੀ ਨਾਲ ਕੀਤੀ ਗਈ ਔਪਟੀਮਾਈਜ਼ਰ ਟਿਊਨਿੰਗ ਅਤੇ ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ ਤੋਂ ਲੈ ਕੇ ਮਾਡਲਿੰਗ ਦੇ ਨਵੇਂ ਵਿਚਾਰ ਅਤੇ ਟੈਸਟ-ਟਾਈਮ ਟ੍ਰੇਨਿੰਗ ਤੱਕ ਸਭ ਕੁਝ ਸ਼ਾਮਲ ਸੀ।

ਇਸ ਚੁਣੌਤੀ ਦਾ ਸਭ ਤੋਂ ਦਿਲਚਸਪ ਪਹਿਲੂ ਇਹ ਦੇਖਣਾ ਸੀ ਕਿ ਹਿੱਸਾ ਲੈਣ ਵਾਲਿਆਂ ਨੇ ਕਿੰਨੇ ਵਿਆਪਕ ਪੱਧਰ 'ਤੇ AI ਕੋਡਿੰਗ ਏਜੰਟਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ। ਏਜੰਟਾਂ ਨੇ ਪ੍ਰਯੋਗਾਂ ਦੀ ਲਾਗਤ ਘਟਾਉਣ ਵਿੱਚ ਮਦਦ ਕੀਤੀ, ਹੋਰ ਲੋਕਾਂ ਲਈ ਹਿੱਸਾ ਲੈਣਾ ਆਸਾਨ ਬਣਾਇਆ, ਅਤੇ ਮੁਕਾਬਲੇ ਦੀ ਰਫ਼ਤਾਰ ਬਦਲ ਦਿੱਤੀ। ਉਹਨਾਂ ਨੇ ਸਬਮਿਸ਼ਨ ਸਮੀਖਿਆ, ਐਟ੍ਰਿਬਿਊਸ਼ਨ ਅਤੇ ਸਕੋਰਿੰਗ ਲਈ ਨਵੀਆਂ ਚੁਣੌਤੀਆਂ ਵੀ ਪੈਦਾ ਕੀਤੀਆਂ।

ਇਹ ਚੁਣੌਤੀ ਸਾਡੇ ਲਈ ਪ੍ਰਤਿਭਾ ਦੀ ਖੋਜ ਦਾ ਇੱਕ ਅਰਥਪੂਰਨ ਮੰਚ ਵੀ ਬਣ ਗਈ। ਇਹ Parameter Golf ਲਈ ਸਾਡੇ ਟੀਚਿਆਂ ਵਿੱਚੋਂ ਇੱਕ ਸੀ, ਅਤੇ ਇਹ ਇੱਕ ਉਪਯੋਗੀ ਸੰਕੇਤ ਸੀ ਕਿ ਓਪਨ-ਐਂਡ ਤਕਨੀਕੀ ਚੁਣੌਤੀਆਂ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਬਾਰੇ ਬੇਮਿਸਾਲ ਸਮਝ ਅਤੇ ਦ੍ਰਿੜਤਾ ਨੂੰ ਉਜਾਗਰ ਕਰ ਸਕਦੀਆਂ ਹਨ।

ਇਸ ਪੋਸਟ ਵਿੱਚ, ਅਸੀਂ ਕੁਝ ਅਜਿਹੀਆਂ ਐਂਟਰੀਆਂ ਨੂੰ ਉਜਾਗਰ ਕਰਦੇ ਹਾਂ ਜੋ ਸਾਨੂੰ ਹੈਰਾਨ ਕਰਨ ਵਾਲੀਆਂ ਅਤੇ ਦਿਲਚਸਪ ਲੱਗੀਆਂ, ਅਤੇ ਅਸੀਂ ਇਹ ਵੀ ਸਾਂਝਾ ਕਰਦੇ ਹਾਂ ਕਿ ਤਾਕਤਵਰ AI ਏਜੰਟਾਂ ਦੇ ਯੁੱਗ ਵਿੱਚ ਕੋਡਿੰਗ ਮੁਕਾਬਲਾ ਆਯੋਜਿਤ ਕਰਨ ਤੋਂ ਅਸੀਂ ਕੀ ਸਿੱਖਿਆ।

ਤਕਨੀਕੀ ਪ੍ਰਭਾਵ

ਟਰੈਕ ਰਿਕਾਰਡ ਕਰੋ

ਅਅਸੀਂ ਰਿਕਾਰਡ-ਟਰੈਕ ਲੀਡਰਬੋਰਡ 'ਤੇ ਹਰੇਕ ਸਬਮਿਸ਼ਨ ਦੀ ਸੁਤੰਤਰ ਤੌਰ 'ਤੇ ਜਾਂਚ ਕੀਤੀ ਅਤੇ ਉਸ ਨੂੰ ਦੁਬਾਰਾ ਤਿਆਰ ਕਰਕੇ ਦੇਖਿਆ; ਅਤੇ ਇਹ ਪੁਸ਼ਟੀ ਕੀਤੀ ਕਿ ਹਰੇਕ ਸਬਮਿਸ਼ਨ ਆਪਣੇ ਜਮ੍ਹਾਂ ਕੀਤੇ ਜਾਣ ਦੇ ਸਮੇਂ 'ਤੇ ਪਿਛਲੇ ਸਾਰੇ ਰਿਕਾਰਡ ਤੋੜਨ ਵਾਲੀ ਸੀ। ਕਈ ਵਿਸ਼ੇ ਖਾਸ ਤੌਰ 'ਤੇ ਉਭਰ ਕੇ ਸਾਹਮਣੇ ਆਏ।

ਸਿਖਲਾਈ ਔਪਟੀਮਾਈਜ਼ੇਸ਼ਨ

ਕੁਝ ਸਭ ਤੋਂ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਨਤੀਜੇ ਮੌਜੂਦਾ ਕੰਪੋਨੈਂਟਾਂ ਦੀ ਸਾਵਧਾਨੀ ਨਾਲ ਕੀਤੀ ਟਿਊਨਿੰਗ ਤੋਂ ਮਿਲੇ।

ਸਬਮਿਸ਼ਨ	ਯੋਗਦਾਨੀ	ਤਕਨੀਕ	ਇਹ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਸੀ
#60	@notapplica ਨੇ	#50, #42, और ਸੰਭਵਤ #39 ਦੀਆਂ ਪਹਿਲਾਂ ਦੀਆਂ ਸਫ਼ਲ ਤਕਨੀਕਾਂ ਨੂੰ ਇੱਕ ਨਾਲ ਜੋੜਿਆ।, ਫਿਰ Muon ਵੇਟ ਡਿਕੇਅ, ਸਪੈਕਟਰਲ ਐਮਬੈਡਿੰਗ ਇਨੀਸ਼ੀਅਲਾਈਜ਼ੇਸ਼ਨ, ਰੈਜ਼ੀਡਿਊਲ-ਮਿਕਸ ਸ਼ੈਡਿਊਲਿੰਗ, ਅਤੇ ਕੰਪਾਈਲਡ ਇਵੈਲੂਏਸ਼ਨ ਦੀ ਵਰਤੋਂ ਨਾਲ ਇੱਕ ਡੀਪਰ ਮਾਡਲ ਨੂੰ ਕਾਰਜਸ਼ੀਲ ਬਣਾਇਆ ਗਿਆ।	ਅਨੁਸ਼ਾਸਿਤ ਲੀਡਰਬੋਰਡ ਕਾਰਜ ਦੀ ਇੱਕ ਮਜ਼ਬੂਤ ਉਦਾਹਰਨ: ਇਹ ਪਛਾਣਨਾ ਕਿ ਕਿਹੜੇ ਮੌਜੂਦਾ ਸੁਧਾਰ ਮਹੱਤਵ ਰੱਖਦੇ ਹਨ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਸਪਸ਼ਟ ਤੌਰ 'ਤੇ ਇਕੱਠਾ ਕਰਨਾ।

ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ

ਕਈ ਸਬਮਿਸ਼ਨਾਂ ਨੇ ਕੰਪ੍ਰੈਸ਼ਨ ਅਤੇ ਐਕਸਪੋਰਟ 'ਤੇ ਜ਼ੋਰਦਾਰ ਢੰਗ ਨਾਲ ਜ਼ੋਰ ਦਿੱਤਾ।

ਸਬਮਿਸ਼ਨ	ਯੋਗਦਾਨੀ	ਤਕਨੀਕ	ਇਹ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਸੀ
#414	@signalrush	ਸਿਖਲਾਈ ਤੋਂ ਬਾਅਦ ਵੇਟਸ ਨੂੰ ਕੁਆਂਟਾਈਜ਼ ਕਰਨ ਲਈ GPTQ-lite ਦੀ ਵਰਤੋਂ ਕੀਤੀ।	ਲੀਡਰਬੋਰਡ ਦੀ ਇਹ ਪਹਿਲੀ ਸਬਮਿਸ਼ਨ ਸੀ ਜਿਸ ਵਿੱਚ GPTQ-lite ਦੀ ਸਫਲਤਾਪੂਰਵਕ ਵਰਤੋਂ ਕੀਤੀ ਗਈ	ਜਿਸ ਸਦਕਾ ਬਿਹਤਰ ਮੁਲਾਂਕਣ ਪ੍ਰਾਪਤ ਹੋਇਆ।"
#1060	@dexhunter	ਪੂਰਨ Hessian GPTQ ਦੀ ਸਫਲ ਵਰਤੋਂ ਕਰਨ ਲਈ @raahilshah ਦੀ #634 'ਤੇ ਆਧਾਰਿਤ।	ਪੁਰਾਣੇ ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ ਕਾਰਜ ਨੂੰ ਇੱਕ ਮਜ਼ਬੂਤ ਕੰਪ੍ਰੈਸ਼ਨ ਪਾਥ ਵਿੱਚ ਵਿਸਤਾਰਿਤ ਕੀਤਾ।

ਟੈਸਟ-ਸਮੇਂ ਅਤੇ ਮੁਲਾਂਕਣ ਦੀਆਂ ਰਣਨੀਤੀਆਂ

ਕੁਝ ਸਬਮਿਸ਼ਨਾਂ ਨੇ ਮਾਡਲ ਸੁਧਾਰ ਅਤੇ ਮੁਲਾਂਕਣ ਰਣਨੀਤੀ ਦਰਮਿਆਨ ਦੀ ਸੀਮਾ ਨੂੰ ਚੁਣੌਤੀ ਦਿੱਤੀ। ਇਹ ਤਰੀਕੇ ਨਿਯਮਾਂ ਅਧੀਨ ਵੈਧ ਸਨ, ਪਰ ਆਯੋਜਕਾਂ ਵਜੋਂ ਸਾਡੇ ਵੱਲੋਂ ਇਹਨਾਂ ਦੀ ਧਿਆਨ ਨਾਲ ਸਮੀਖਿਆ ਕਰਨ ਦੀ ਲੋੜ ਸੀ।

ਸਬਮਿਸ਼ਨ	ਯੋਗਦਾਨੀ	ਤਕਨੀਕ	ਇਹ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਸੀ
#77	@samacqua	ਪਹਿਲਾਂ ਸਕੋਰ ਕਰਨ ਵਾਲੀ ਵਿਧੀ ਦੇ ਆਧਾਰ ‘ਤੇ, ਹਰੇਕ ਦਸਤਾਵੇਜ਼ ਲਈ LoRA ਦੀ ਟੈਸਟ-ਟਾਈਮ ਸਿਖਲਾਈ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਗਈ — ਭਾਵ ਪਹਿਲਾਂ ਮੁਲਾਂਕਣ ਕੀਤਾ ਗਿਆ, ਫਿਰ ਸਿਰਫ਼ ਉਹਨਾਂ ਹਿੱਸਿਆਂ ‘ਤੇ ਮਾਡਲ ਨੂੰ ਅਨੁਕੂਲਿਤ ਕੀਤਾ ਗਿਆ ਜਿਨ੍ਹਾਂ ਦਾ ਸਕੋਰ ਪਹਿਲਾਂ ਹੀ ਹੋ ਚੁੱਕਾ ਸੀ, ਅਤੇ ਹਰੇਕ ਦਸਤਾਵੇਜ਼ ਦੀ ਸੀਮਾ ‘ਤੇ ਮਾਡਲ ਨੂੰ ਰੀਸੈੱਟ ਕਰ ਦਿੱਤਾ ਗਿਆ।	ਇਸ ਨੇ ਨਿਯਮਾਂ ਦੇ ਦਾਇਰੇ ਵਿੱਚ ਰਹਿੰਦੇ ਹੋਏ, ਮਾਡਲ ਸੁਧਾਰ ਅਤੇ ਮੁਲਾਂਕਣ ਰਣਨੀਤੀ — ਦੋਵਾਂ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਦਾ ਕੰਮ ਕੀਤਾ।
#1019	@abaybektursun	ਸਵੈ-ਨਿਰਮਿਤ GPTQ ਕੈਲੀਬ੍ਰੇਸ਼ਨ ਵਿਧੀ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਗਈ — ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲ ਤੋਂ ਹੀ ਕੈਲੀਬ੍ਰੇਸ਼ਨ ਲਈ ਟੈਕਸਟ ਤਿਆਰ ਕੀਤਾ ਗਿਆ, ਅਤੇ ਫਿਰ ਉਹਨਾਂ ਹੀ ਐਕਟੀਵੇਸ਼ਨਾਂ ਦੇ ਆਧਾਰ 'ਤੇ GPTQ Hessians ਬਣਾਏ ਗਏ।	ਇਹ ਇੱਕ ਰਚਨਾਤਮਕ ਕੈਲੀਬ੍ਰੇਸ਼ਨ ਰਣਨੀਤੀ ਸੀ, ਜਿਸ ਕਾਰਨ ਪ੍ਰਬੰਧਕਾਂ ਨੂੰ ਇਸਦਾ ਬੜੀ ਸਾਵਧਾਨੀ ਨਾਲ ਟੈਸਟ ਅਤੇ ਸਮੀਖਿਆ ਕਰਨੀ ਪਈ।

ਨਵੀਂ ਮਾਡਲਿੰਗ ਅਤੇ ਡਾਟਾ ਵਿਚਾਰ

ਕੁਝ ਸਬਮਿਸ਼ਨਾਂ ਵਿੱਚ ਮਾਡਲਿੰਗ ਜਾਂ ਡਾਟਾ ਸੰਬੰਧੀ ਅਜਿਹੇ ਵਿਚਾਰ ਪੇਸ਼ ਕੀਤੇ ਗਏ ਜੋ ਖਾਸ ਤੌਰ 'ਤੇ ਰਚਨਾਤਮਕ ਸਨ।

ਸਬਮਿਸ਼ਨ	ਯੋਗਦਾਨੀ	ਤਕਨੀਕ	ਇਹ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਸੀ
#1729	@romeerp	CaseOps ਟੋਕਨਾਈਜ਼ਰ ਪੇਸ਼ ਕੀਤਾ ਗਿਆ: ਓਰੀਜਨਲ-ਬਾਈਟ BPB ਸਾਈਡਕਾਰ ਅਕਾਊਂਟਿੰਗ ਦੇ ਨਾਲ ਲੌਸਲੈੱਸ ਕੈਪੀਟਲਾਈਜ਼ੇਸ਼ਨ operator ਟੋਕਨ।	ਰਚਨਾਤਮਕ ਟੋਕਨਾਈਜ਼ਰ ਅਤੇ ਡਾਟਾ-ਪ੍ਰਤਿਨਿਧਤਾ ਦਾ ਵਿਚਾਰ।
#265	@unnir	XSA ਪੇਸ਼ ਕੀਤਾ ਗਿਆ, ਜੋ ਕਿ GQA-ਸੁਚੇਤ ਗਰੁੱਪਡ ਵਿਊਜ਼ ਦੇ ਨਾਲ ਇੱਕ ਕੁਸ਼ਲ ਪਾਰਸ਼ੀਅਲ ਐਕਸਕਲੂਸਿਵ ਸੈਲਫ ਅਟੈਂਸ਼ਨ ਪਹੁੰਚ ਹੈ।	ਚੁਣੌਤੀ ਵਿੱਚ ਇੱਕ ਕੁਸ਼ਲ ਅਟੈਂਸ਼ਨ ਵੇਰੀਐਂਟ ਪੇਸ਼ ਕੀਤਾ ਗਿਆ।
#65	@aquariouseworkman	SmearGate ਅਤੇ BigramHash ਪੇਸ਼ ਕੀਤੇ ਗਏ: ਇੱਕ ਲਰਨਡ ਪ੍ਰੀਵੀਅਸ-ਟੋਕਨ ਐਮਬੈਡਿੰਗ ਬਲੈਂਡ ਅਤੇ ਨਾਲ ਲੱਗਦੇ ਟੋਕਨ-ਪੇਅਰ ਹੈਸ਼ ਫੀਚਰ।	ਬਿਲਕੁਲ ਸ਼ੁਰੂਆਤ ਤੋਂ ਨਵੇਂ ਫੀਚਰ ਮਕੈਨਿਜ਼ਮ ਜੋੜੇ ਗਏ।
#1204	@msisovic	ਮਿੰਨੀ ਡੈਪਥ ਰਿਕਰੈਂਸ ਪੇਸ਼ ਕੀਤੀ ਗਈ: ਲੇਅਰ 4 ਅਤੇ 5 ਨੂੰ ਦੁਹਰਾਇਆ ਗਿਆ, ਟ੍ਰੇਨਿੰਗ ਦੇ ਅੱਧ ਤੱਕ ਰਿਕਰੈਂਸ ਨੂੰ ਰੋਕਿਆ ਗਿਆ, ਅਤੇ ਦੁਹਰਾਏ ਗਏ MLPs ਨੂੰ ਅੰਸ਼ਿਕ ਤੌਰ 'ਤੇ ਵੱਖ ਕੀਤਾ ਗਿਆ।	ਲੀਡਰਬੋਰਡ ਦੀ ਪਹਿਲੀ ਸਵੀਕਾਰ ਕੀਤੀ ਗਈ ਐਂਟਰੀ ਜਿਸ ਨੇ ਰਿਕਰੈਂਟ ਲੇਅਰਾਂ ਨੂੰ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਕਾਰਜਸ਼ੀਲ ਬਣਾਇਆ।

ਅਸੀਂ ਇਹਨਾਂ ਨੌਂ ਸਬਮਿਸ਼ਨਾਂ ਨੂੰ ਖਾਸ ਤੌਰ 'ਤੇ ਉਜਾਗਰ ਕਰਨ ਲਈ ਚੁਣਿਆ ਹੈ ਕਿਉਂਕਿ ਇਹ ਉਹਨਾਂ ਨਤੀਜਿਆਂ ਦੇ ਵਿਆਪਕ ਦਾਇਰੇ ਨੂੰ ਦਰਸਾਉਂਦੀਆਂ ਹਨ, ਜਿਨ੍ਹਾਂ ਦੀ ਅਸੀਂ ਇਸ ਚੁਣੌਤੀ ਤੋਂ ਉਮੀਦ ਕਰ ਰਹੇ ਸੀ। ਕੁਝ ਭਾਗੀਦਾਰਾਂ ਨੇ ਸਾਵਧਾਨੀ ਨਾਲ ਕੀਤੀ ਟਿਊਨਿੰਗ ਰਾਹੀਂ ਸਫਲਤਾਵਾਂ ਹਾਸਲ ਕੀਤੀਆਂ। ਹੋਰਾਂ ਨੇ ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ ਅਤੇ ਲੋ-ਰੈਂਕ ਤਕਨੀਕਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਇਆ। ਕੁਝ ਲੋਕਾਂ ਨੇ ਮੁਲਾਂਕਣ ਨਿਯਮਾਂ ਦੀਆਂ ਸੀਮਾਵਾਂ ਦੀ ਜਾਂਚ ਕੀਤੀ। ਅਤੇ ਮਾਡਲਿੰਗ ਜਾਂ ਡਾਟਾ ਸੰਬੰਧੀ ਕਈ ਪੇਸ਼ ਕੀਤੇ ਗਏ ਵਿਚਾਰ, ਚਾਹੇ ਉਹ ਸਾਹਿਤ ਤੋਂ ਲਏ ਗਏ ਹੋਣ ਜਾਂ ਬਿਲਕੁਲ ਸ਼ੁਰੂ ਤੋਂ ਬਣਾਏ ਗਏ ਹੋਣ, ਜਿਹਨਾਂ ਨਾਲ ਅਣਕਿਆਸੇ ਸੁਧਾਰ ਹੋਏ।

ਗੈਰ-ਰਿਕਾਰਡ ਟਰੈਕ

ਗੈਰ-ਰਿਕਾਰਡ ਟ੍ਰੈਕ ਕਈ ਰਚਨਾਤਮਕ ਸਬਮਿਸ਼ਨਾਂ ਦਾ ਕੇਂਦਰ ਸੀ। ਅਸੀਂ 15 ਪਸੰਦੀਦਾ ਚੋਣਾਂ ਨੂੰ ਉਜਾਗਰ ਕੀਤਾ, ਜਿਹਨਾਂ ਵਿੱਚ ਨੌਨ-ਆਟੋਰੇਗ੍ਰੈਸਿਵ ਟੈਕਸਟ ਮਾਡਲਿੰਗ ਤੋਂ ਲੈ ਕੇ ਗਤੀਸ਼ੀਲ ਟੋਕਨਾਈਜ਼ੇਸ਼ਨ ਤੱਕ ਦੀਆਂ ਪਹੁੰਚਾਂ ਸ਼ਾਮਲ ਹਨ।

ਕਿਉਂਕਿ ਇਹ ਟ੍ਰੈਕ ਵਧੇਰੇ ਪ੍ਰਯੋਗਾਤਮਕ ਸੀ, ਅਸੀਂ ਕੱਚੀ ਕਾਰਗੁਜ਼ਾਰੀ ’ਤੇ ਘੱਟ ਅਤੇ ਇਸ ਗੱਲ ’ਤੇ ਵੱਧ ਧਿਆਨ ਦਿੱਤਾ ਕਿ ਕੀ ਇਹ ਪਹੁੰਚ ਤਕਨੀਕੀ ਤੌਰ ’ਤੇ ਦਿਲਚਸਪ ਸੀ। ਤਿੰਨ ਸਬਮਿਸ਼ਨਾਂ ਖ਼ਾਸ ਤੌਰ 'ਤੇ ਉਭਰ ਕੇ ਸਾਹਮਣੇ ਆਈਆਂ:

ਇਹ ਸਾਡੀਆਂ ਤਿੰਨ ਪਸੰਦੀਦਾ ਗੈਰ-ਰਿਕਾਰਡ ਸਬਮਿਸ਼ਨਾਂ ਸਨ, ਭਾਵੇਂ ਕਾਰਗੁਜ਼ਾਰੀ ਦੇ ਹਿਸਾਬ ਨਾਲ ਇਹ ਲਾਜ਼ਮੀ ਤੌਰ 'ਤੇ ਸਿਖਰ ਦੀਆਂ ਤਿੰਨ ਨਹੀਂ ਸਨ।

ਇਹ ਕਹਿਣ ਦੇ ਬਾਵਜੂਦ, ਗੈਰ-ਰਿਕਾਰਡ ਟ੍ਰੈਕ ਫਿਰ ਵੀ ਮੁਕਾਬਲੇ ਵਾਲਾ ਸੀ। ਗੈਰ-ਰਿਕਾਰਡ ਲੀਡਰਬੋਰਡ ਐਂਟਰੀਆਂ ਵਿੱਚੋਂ ਅੱਧੀਆਂ ਨੇ 1.22 BPB ਦੀ ਨਾਈਵ ਬੇਸਲਾਈਨ ਨੂੰ ਪਿੱਛੇ ਛੱਡਿਆ, ਅਤੇ ਸਭ ਤੋਂ ਉੱਚੀ ਰੈਂਕ ਵਾਲੀ ਐਂਟਰੀ 1.12 BPB ਤੱਕ ਪਹੁੰਚੀ।

ਸਾਨੂੰ ਇਹ ਉਤਸ਼ਾਹਜਨਕ ਲੱਗਿਆ। ਮਜ਼ਬੂਤ ਟ੍ਰਾਂਸਫਾਰਮਰ ਬੇਸਲਾਈਨ ਮਾਡਲਾਂ ਦੇ ਮੁਕਾਬਲੇ ਵੀ, ਵਿਕਲਪਿਕ ਦ੍ਰਿਸ਼ ਕਦੇ-ਕਦੇ ਪ੍ਰਮੁੱਖ ਆਰਕੀਟੈਕਚਰ ਦੇ ਸਾਹਮਣੇ ਆਪਣੀ ਸਮਰੱਥਾ ਨੂੰ ਬਣਾਉਣ ਵਿੱਚ ਸਫਲ ਹੋ ਰਹੇ ਹਨ।

ਸਾਨੂੰ ਇਹ ਵੀ ਲੱਗਦਾ ਹੈ ਕਿ ਇਸ ਟਰੈਕ ਨੂੰ ਬਿਹਤਰ ਕੋਡਿੰਗ ਏਜੰਟਾਂ ਦੀ ਉਪਲਬੱਧਤਾ ਤੋਂ ਖਾਸ ਤੌਰ 'ਤੇ ਫਾਇਦਾ ਮਿਲਦਾ ਹੈ। ਏਜੰਟਾਂ ਨੇ ਅਨੁਮਾਨਾਤਮਕ ਵਿਚਾਰਾਂ ਦੇ ਪ੍ਰੋਟੋਟਾਈਪ ਤਿਆਰ ਕਰਨ ਨੂੰ ਕਾਫ਼ੀ ਸਸਤਾ ਕਰ ਦਿੱਤਾ, ਜਿਸ ਵਿੱਚ ਉਹ ਤਰੀਕੇ ਵੀ ਸ਼ਾਮਲ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਪਹਿਲਾਂ ਕਿਸੇ ਛੋਟੇ ਮੁਕਾਬਲੇ ਵਿੱਚ ਅਜ਼ਮਾਉਣਾ ਬਹੁਤ ਸਮਾਂ ਲੈਣ ਵਾਲਾ ਜਾਂ ਅਨਿਸ਼ਚਿਤ ਲੱਗਦਾ ਹੋ ਸਕਦਾ ਸੀ।

ਮੁੱਖ ਨੁਕਤੇ

Parameter Golf ਅਤੇ ਇਸ ਵਰਗੇ ਪੁਰਾਣੇ ਮੁਕਾਬਲਿਆਂ ਵਿਚਕਾਰ ਇੱਕ ਵੱਡਾ ਅੰਤਰ ਕੋਡਿੰਗ ਏਜੰਟਾਂ ਦੀ ਵਿਆਪਕ ਵਰਤੋਂ ਸੀ। ਸਬਮਿਸ਼ਨ ਕਰਨ ਵਾਲਿਆਂ ਦੀ ਬਹੁਤ ਵੱਡੀ ਬਹੁਗਿਣਤੀ ਨੇ ਆਪਣੇ ਕੰਮ ਦੇ ਹਿੱਸੇ ਵਜੋਂ ਏਜੰਟਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦਾ ਜ਼ਿਕਰ ਕੀਤਾ।

ਇਸ ਨਾਲ ਦਾਖਲੇ ਦੀ ਰੁਕਾਵਟ ਨੂੰ ਘੱਟ ਕੀਤਾ ਗਿਆ। ਭਾਗੀਦਾਰ ਪ੍ਰਯੋਗਾਂ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਸੈੱਟ ਅੱਪ ਕਰ ਸਕਦੇ ਸਨ, ਅਣਜਾਣ ਕੋਡ ਦੀ ਜਾਂਚ ਕਰ ਸਕਦੇ ਸਨ, ਅਤੇ ਘੱਟ ਰੁਕਾਵਟਾਂ ਨਾਲ ਵਿਚਾਰਾਂ ਨੂੰ ਪਰਖ ਸਕਦੇ ਸਨ। Runpod ਵੱਲੋਂ ਕੰਪਿਊਟ ਸਰੋਤਾਂ ਵਿੱਚ $1,000,000 ਦੀ ਸਪਾਂਸਰਸ਼ਿਪ ਨੇ ਵੀ ਇਸ ਚੁਣੌਤੀ ਨੂੰ ਹੋਰ ਵੱਧ ਲੋਕਾਂ ਲਈ ਪਹੁੰਚਯੋਗ ਬਣਾਉਣ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਭੂਮਿਕਾ ਨਿਭਾਈ।

ਇਸੇ ਸਮੇਂ, ਏਜੰਟ ਦੀ ਵਰਤੋਂ ਨੇ ਸਬਮਿਸ਼ਨ ਅਤੇ ਸਕੋਰਿੰਗ ਵਿੱਚ ਨਵੀਆਂ ਸਮੱਸਿਆਵਾਂ ਪੈਦਾ ਕੀਤੀਆਂ। ਕਈ ਸਬਮਿਸ਼ਨਾਂ ਬੁਨਿਆਦੀ ਤੌਰ 'ਤੇ ਨਵੇਂ ਤਰੀਕੇ ਹੋਣ ਦੀ ਬਜਾਏ, ਮੌਜੂਦਾ ਸਿਖਰਲੇ ਸਕੋਰਰਾਂ ਵਿੱਚ ਛੋਟੇ ਬਦਲਾਅ ਸਨ। ਇਹ ਅਕਸਰ ਉਪਯੋਗੀ ਹੁੰਦਾ ਸੀ: ਠੋਸ ਵਿਚਾਰ ਜਲਦੀ ਫੈਲ ਜਾਂਦੇ ਸਨ ਅਤੇ ਦੂਜਿਆਂ ਵੱਲੋਂ ਉਨ੍ਹਾਂ ਨੂੰ ਹੋਰ ਨਿਖਾਰਿਆ ਜਾਂਦਾ ਸੀ। ਪਰ ਇਸ ਨੇ ਸ਼ੋਰ ਵੀ ਪੈਦਾ ਕੀਤਾ। ਜਦੋਂ ਮੁਕਾਬਲੇ ਦੇ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਤੋਂ ਬਾਹਰ ਵਾਲੀਆਂ ਸਬਮਿਸ਼ਨਾਂ ਨੇ ਅਸਧਾਰਨ ਤੌਰ 'ਤੇ ਮਜ਼ਬੂਤ ਸਕੋਰ ਹਾਸਲ ਕੀਤੇ, ਤਾਂ ਹੋਰ ਏਜੰਟਾਂ ਨੇ ਕਈ ਵਾਰ ਉਹਨਾਂ ਵਿਚਾਰਾਂ ਦੀ ਨਕਲ ਕੀਤੀ ਅਤੇ ਉਸੇ ਅਵੈਧ ਰਾਹ 'ਤੇ ਅੱਗੇ ਵਧਦੇ ਰਹੇ।

ਸਬਮਿਸ਼ਨਾਂ ਦੀ ਵੱਡੀ ਗਿਣਤੀ ਨੇ ਇਹ ਵੀ ਬਦਲ ਦਿੱਤਾ ਕਿ ਸਾਨੂੰ ਮੁਕਾਬਲਾ ਕਿਵੇਂ ਚਲਾਉਣਾ ਪਿਆ। ਸਾਡੇ ਲਈ ਹਰ ਸਬਮਿਸ਼ਨ ਦੀ ਹੱਥੋਂ ਜਾਂਚ ਕਰਦੇ ਹੋਏ ਲੀਡਰਬੋਰਡ ਨੂੰ ਲਗਾਤਾਰ ਅੱਪਡੇਟ ਹੁੰਦਿਆਂ ਰੱਖਣਾ ਸੰਭਵ ਨਹੀਂ ਸੀ। ਚੁਣੌਤੀ ਦੌਰਾਨ, ਅਸੀਂ ਨਵੀਆਂ ਸਬਮਿਸ਼ਨਾਂ ਦੀ ਨਿਗਰਾਨੀ ਕਰਨ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਮਨੁੱਖੀ ਸਮੀਖਿਆ ਲਈ ਫਲੈਗ ਕਰਨ ਵਾਸਤੇ ਇੱਕ ਅੰਦਰੂਨੀ Codex-ਆਧਾਰਿਤ ਟ੍ਰਾਇਏਜ ਬੋਟ ਵਿਕਸਿਤ ਕੀਤਾ। ਇਹ ਗੱਲ ਉਸ ਸਮੇਂ ਖਾਸ ਤੌਰ 'ਤੇ ਮਹੱਤਵਪੂਰਨ ਹੋ ਗਈ ਜਦੋਂ ਸਾਨੂੰ ਇੱਕ ਦਿਨ ਵਿੱਚ ਸੈਂਕੜੇ ਸਬਮਿਸ਼ਨਾਂ ਪ੍ਰਾਪਤ ਹੋ ਰਹੀਆਂ ਸਨ।

AI ਏਜੰਟ ਚੁਣੌਤੀ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਭਾਈਚਾਰੇ ਦਾ ਹਿੱਸਾ ਬਣ ਗਏ। ਮੁਕਾਬਲੇ ਦੇ ਵੱਡੇ ਹਿੱਸੇ ਦੌਰਾਨ, @notapplica ਅਤੇ ਉਹਨਾਂ ਦੇ ਕੋਡਿੰਗ ਏਜੰਟ ਨੇ “ਲਾਈਵ ਅੱਪਡੇਟ” ਬੁਲੇਟਿਨ ਚਲਾਇਆ, ਮੁੱਖ ਘਟਨਾਵਾਂ ਨੂੰ ਟ੍ਰੈਕ ਕੀਤਾ, ਲੀਡਰਬੋਰਡ ਰਣਨੀਤੀਆਂ ਦੀ ਵਿਆਖਿਆ ਕੀਤੀ, ਅਤੇ ਹੋਰ ਭਾਗੀਦਾਰਾਂ ਨੂੰ ਮਦਦ ਕੀਤੀ। ਕਮਿਊਨਿਟੀ ਸਮੀਖਿਆ ਟੂਲ ਘੱਟ ਤਜਰਬੇਕਾਰ ਭਾਗੀਦਾਰਾਂ ਨੂੰ ਸਹਾਇਕ ਸਨ, ਤਾਂ ਜੋ ਉਹ ਆਪਣੀਆਂ ਸਬਮਿਸ਼ਨਾਂ ਨੂੰ ਨਿਯਮਾਂ ਦੇ ਅਨੁਸਾਰ ਜਾਂਚ ਸਕਣ ਅਤੇ ਆਮ ਗਲਤੀਆਂ ਤੋਂ ਬਚ ਸਕਣ।

ਅੱਗੇ ਕੀ ਹੈ?

ਸਾਡਾ ਮੁੱਖ ਉਦੇਸ਼ ਇੱਕ ਅਜਿਹੀ ਚੁਣੌਤੀ ਸ਼ੁਰੂ ਕਰਨਾ ਸੀ ਜਿਸ ਵਿੱਚ ਯੋਗ ਭਾਗੀਦਾਰ⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਹਿੱਸਾ ਲੈ ਸਕਣ ਅਤੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਖੋਜ ਦਾ ਅਨੁਭਵ ਕਰ ਸਕਣ। Parameter Golf ਨੇ ਤਕਨੀਕੀ ਪੱਖੋਂ ਮਜ਼ਬੂਤ ਅਤੇ ਰਚਨਾਤਮਕ ਸਬਮਿਸ਼ਨਾਂ ਦੀ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨੂੰ ਆਕਰਸ਼ਿਤ ਕੀਤਾ, ਅਤੇ ਇਸ ਨੇ ਸਾਨੂੰ ਇਸ ਬਾਰੇ ਹੋਰ ਸਪਸ਼ਟ ਦ੍ਰਿਸ਼ਟੀ ਦਿੱਤੀ ਕਿ AI ਏਜੰਟਾਂ ਦੇ ਹੋਰ ਸਮਰੱਥ ਅਤੇ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਵਰਤੇ ਜਾਣ ਨਾਲ ਮੁਕਤ ਖੋਜ ਮੁਕਾਬਲੇ ਕਿਵੇਂ ਬਦਲ ਸਕਦੇ ਹਨ।

ਅਸੀਂ ਭਵਿੱਖ ਵਿੱਚ ਇਸ ਤਰ੍ਹਾਂ ਦੀਆਂ ਹੋਰ ਚੁਣੌਤੀਆਂ ਸ਼ੁਰੂ ਕਰਨ ਬਾਰੇ ਸੋਚ ਰਹੇ ਹਾਂ। ਜੇਕਰ ਤੁਸੀਂ ਰੁਚੀ ਰੱਖਦੇ ਹੋ, ਤਾਂ ਚੁਣੌਤੀ ਭਾਗੀਦਾਰ ਫਾਰਮ⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਭਰੋ।

ਲੇਖਕ

OpenAI

ਪੜ੍ਹਦੇ ਰਹੋ

ਸਭ ਵੇਖੋ

ਕੋਡਿੰਗ ਮੁਲਾਂਕਣਾਂ ਵਿੱਚ ਸੰਕੇਤ ਨੂੰ ਸ਼ੋਰ ਤੋਂ ਵੱਖ ਕਰਨਾ

ਖੋਜ8 ਜੁਲਾ 2026

GeneBench-Pro ਪੇਸ਼ ਹੈ

ਖੋਜ30 ਜੂਨ 2026

A near-autonomous AI chemist improves a challenging reaction

ਇੱਕ ਲਗਭਗ ਸਵੈ-ਚਾਲਿਤ AI ਰਸਾਇਣ ਵਿਗਿਆਨੀ ਨੇ ਦਵਾਈਆਂ ਦੇ ਰਸਾਇਣ ਵਿਗਿਆਨ ਵਿੱਚ ਚੁਣੌਤੀਪੂਰਨ ਪ੍ਰਤੀਕਿਰਿਆ ਵਿੱਚ ਸੁਧਾਰ ਕੀਤਾ ਹੈ

ਖੋਜ17 ਜੂਨ 2026