ಮೇ 12, 2026

Parameter Golf ನಮಗೆ ಕಲಿಸಿದುದು

1,000+ ಭಾಗವಹಿಸಿದವರು, 2,000+ ಸಲ್ಲಿಕೆಗಳು ಮತ್ತು ಕೋಡಿಂಗ್ ಏಜೆಂಟ್‌ಗಳು ರೂಪಿಸಿದ ಮುಕ್ತ ಯಂತ್ರ ಕಲಿಕೆ ಸವಾಲಿನಿಂದ ಪಡೆದ ಪಾಠಗಳು.

ಲೋಡ್ ಆಗುತ್ತಿದೆ…

ಹೊಸದು ಮತ್ತು ಕಟ್ಟುನಿಟ್ಟಿನ ನಿರ್ಬಂಧಗಳಿರುವ ಯಂತ್ರ ಕಲಿಕೆ ಸಮಸ್ಯೆಯನ್ನು ಅನ್ವೇಷಿಸಲು ಯಂತ್ರ ಕಲಿಕೆ ಸಂಶೋಧನಾ ಸಮುದಾಯವನ್ನು ತೊಡಗಿಸಿಕೊಳ್ಳಲು ಮತ್ತು ಬೆಂಬಲಿಸಲು ನಾವು Parameter Golf ಅನ್ನು ಆರಂಭಿಸಿದ್ದೇವೆ. ಸವಾಲು ನಿಜವಾದ ತಾಂತ್ರಿಕ ಸೃಜನಶೀಲತೆಯನ್ನು ಪುರಸ್ಕರಿಸುವಷ್ಟು ಆಸಕ್ತಿದಾಯಕವಾಗಿರಬೇಕು, ಜೊತೆಗೆ ಕಲ್ಪನಾತ್ಮಕವಾಗಿ ಸರಳವಾಗಿದ್ದು ಪರಿಶೀಲಿಸಲು ಸುಲಭವಾಗಿರಬೇಕು ಎಂಬುದು ನಮ್ಮ ಉದ್ದೇಶವಾಗಿತ್ತು.

ಭಾಗವಹಿಸಿದವರು ನಿಗದಿತ FineWeb ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ held-out loss ಅನ್ನು ಕನಿಷ್ಠಗೊಳಿಸಬೇಕಾಗಿತ್ತು, ಅದೇ ವೇಳೆ ಮಾಡೆಲ್ ತೂಕಗಳು ಮತ್ತು ತರಬೇತಿ ಕೋಡ್ ಎರಡನ್ನೂ ಒಳಗೊಂಡ 16 MB artifact ಮಿತಿಯೊಳಗೂ, 8×H100ಗಳಲ್ಲಿ 10 ನಿಮಿಷಗಳ ತರಬೇತಿ ಬಜೆಟ್‌ನೊಳಗೂ ಉಳಿಯಬೇಕಾಗಿತ್ತು. ಭಾಗವಹಿಸಿದವರು repo ಅನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ, ಮಾಡೆಲ್ ಅನ್ನು ಸುಧಾರಿಸಿ, GitHub ಮೂಲಕ ತಮ್ಮ ಫಲಿತಾಂಶಗಳನ್ನು ಸಲ್ಲಿಸಲು ನಾವು ಬೇಸ್‌ಲೈನ್, ಡೇಟಾಸೆಟ್ ಮತ್ತು ಮೌಲ್ಯಮಾಪನ ಸ್ಕ್ರಿಪ್ಟ್‌ಗಳನ್ನು ಒದಗಿಸಿದ್ದೇವೆ.

ಎಂಟು ವಾರಗಳ ಅವಧಿಯಲ್ಲಿ, 1,000 ಕ್ಕೂ ಹೆಚ್ಚು ಭಾಗವಹಿಸಿದವರಿಂದ 2,000 ಕ್ಕೂ ಹೆಚ್ಚು ಸಲ್ಲಿಕೆಗಳನ್ನು ನಾವು ಸ್ವೀಕರಿಸಿದ್ದೇವೆ. ಜಾಗರೂಕ ಆಪ್ಟಿಮೈಜರ್ ಟ್ಯೂನಿಂಗ್ ಮತ್ತು ಪ್ರಮಾಣೀಕರಣ ಕೆಲಸದಿಂದ ಹಿಡಿದು ಹೊಸ ಮಾಡೆಲಿಂಗ್ ಕಲ್ಪನೆಗಳು ಮತ್ತು ಪರೀಕ್ಷಾ-ಸಮಯದ ತರಬೇತಿವರೆಗೆ, ಸಲ್ಲಿಕೆಗಳಲ್ಲಿದ್ದ ತಾಂತ್ರಿಕ ವ್ಯಾಪ್ತಿ, ಸೃಜನಶೀಲತೆ ಮತ್ತು ನಿಯಮಗಳ ಅಂಚನ್ನು ಮುಟ್ಟುವ ಪ್ರಯತ್ನಗಳು ನಮ್ಮನ್ನು ಮೆಚ್ಚಿಸಿವೆ.

ಸವಾಲಿನ ಅತ್ಯಂತ ರೋಚಕ ಭಾಗಗಳಲ್ಲಿ ಒಂದೇಂದರೆ ಭಾಗವಹಿಸಿದವರು AI ಕೋಡಿಂಗ್ ಏಜೆಂಟ್‌ಗಳನ್ನು ಎಷ್ಟು ವ್ಯಾಪಕವಾಗಿ ಬಳಸಿದರು ಎಂಬುದನ್ನು ನೋಡುವುದು. ಏಜೆಂಟ್‌ಗಳು ಪ್ರಯೋಗಗಳ ವೆಚ್ಚವನ್ನು ಕಡಿಮೆ ಮಾಡಲು ಸಹಾಯ ಮಾಡಿದರು, ಹೆಚ್ಚು ಜನರಿಗೆ ಭಾಗವಹಿಸುವುದನ್ನು ಸುಲಭಗೊಳಿಸಿದರು ಮತ್ತು ಸ್ಪರ್ಧೆಯ ವೇಗವನ್ನೇ ಬದಲಿಸಿದರು. ಅವು ಸಲ್ಲಿಕೆ ಪರಿಶೀಲನೆ, ಕೃತಿತ್ವ ನಿರ್ಧಾರ ಮತ್ತು ಅಂಕಗಳಿಕೆಗೆ ಹೊಸ ಸವಾಲುಗಳನ್ನೂ ಸೃಷ್ಟಿಸಿವೆ.

ಈ ಸವಾಲು ನಮಗೆ ಅರ್ಥಪೂರ್ಣ ಪ್ರತಿಭೆ ಅನ್ವೇಷಣೆಯ ವೇದಿಕೆಯಾಗಿಯೂ ಪರಿಣಮಿಸಿತು. ಅದು Parameter Golf ಗಾಗಿ ನಮ್ಮ ಗುರಿಗಳಲ್ಲೊಂದು ಆಗಿತ್ತು ಮತ್ತು ಮುಕ್ತ ಅಂತ್ಯದ ತಾಂತ್ರಿಕ ಸವಾಲುಗಳು ಯಂತ್ರ ಕಲಿಕೆಯಲ್ಲಿ ಅಸಾಧಾರಣ ರುಚಿ ಮತ್ತು ಹಠವನ್ನು ಬಹಿರಂಗಪಡಿಸಬಲ್ಲವು ಎಂಬುದಕ್ಕೆ ಇದು ಉಪಯುಕ್ತ ಸಂಕೇತವಾಗಿತ್ತು.

ಈ ಲೇಖನದಲ್ಲಿ, ನಮಗೆ ಆಶ್ಚರ್ಯಕರ ಮತ್ತು ಆಸಕ್ತಿದಾಯಕವೆನಿಸಿದ ಕೆಲವು ಸಲ್ಲಿಕೆಗಳನ್ನು ನಾವು ಹೈಲೈಟ್ ಮಾಡುತ್ತೇವೆ ಮತ್ತು ಶಕ್ತಿಶಾಲಿ AI ಏಜೆಂಟ್‌ಗಳ ಯುಗದಲ್ಲಿ ಕೋಡಿಂಗ್ ಸ್ಪರ್ಧೆಯನ್ನು ನಡೆಸುವುದರಿಂದ ನಾವು ಕಲಿತದ್ದನ್ನು ಹಂಚಿಕೊಳ್ಳುತ್ತೇವೆ.

ತಾಂತ್ರಿಕ ಅನಿಸಿಕೆಗಳು

ರೆಕಾರ್ಡ್ ಟ್ರ್ಯಾಕ್

ರೆಕಾರ್ಡ್-ಟ್ರ್ಯಾಕ್ ಲೀಡರ್‌ಬೋರ್ಡ್‌ನ ಪ್ರತಿಯೊಂದು ಸಲ್ಲಿಕೆಯನ್ನು ನಾವು ಮೌಲ್ಯಮಾಪನ ಮಾಡಿ ಸ್ವತಂತ್ರವಾಗಿ ಮರುಉತ್ಪಾದಿಸಿದ್ದೇವೆ ಮತ್ತು ಪ್ರತಿಯೊಂದು ಸಲ್ಲಿಕೆಯೂ ಅದು ಸಲ್ಲಿಸಲ್ಪಟ್ಟ ಸಮಯದಲ್ಲಿ ರೆಕಾರ್ಡ್ ಮುರಿದದ್ದೇ ಎಂದು ಪರಿಶೀಲಿಸಿದ್ದೇವೆ. ಹಲವು ವಿಷಯಗಳು ವಿಶೇಷವಾಗಿ ಗಮನಸೆಳೆದವು.

ತರಬೇತಿ ಆಪ್ಟಿಮೈಸೇಶನ್

ಕೆಲವು ಅತ್ಯುತ್ತಮ ಫಲಿತಾಂಶಗಳು ಈಗಿರುವ ಘಟಕಗಳನ್ನು ಜಾಗರೂಕವಾಗಿ ಟ್ಯೂನ್ ಮಾಡುವುದರಿಂದ ಬಂದವು.

ಸಲ್ಲಿಕೆ	ಕೊಡುಗೆದಾರ	ತಂತ್ರ	ಅದು ಏಕೆ ಮಹತ್ವದ್ದಾಗಿತ್ತು
#60	@notapplica	ಸಂಯೋಜಿತ #50 ನಿಂದ ಹಿಂದಿನ ಗೆಲುವುಗಳು, #42, ಮತ್ತು ಬಹುಶಃ #39, ನಂತರ Muon weight decay, spectral embedding initialization, residual-mix scheduling, ಮತ್ತು compiled evaluation ಬಳಸಿ ಇನ್ನಷ್ಟು ಆಳವಾದ ಮಾಡೆಲ್ ಕಾರ್ಯನಿರ್ವಹಿಸುವಂತೆ ಮಾಡಿತು.	ಒಬ್ಬ ಶಿಸ್ತುಬದ್ಧ ಲೀಡರ್‌ಬೋರ್ಡ್ ಕಾರ್ಯದ ಬಲವಾದ ಉದಾಹರಣೆ: ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಯಾವ ಸುಧಾರಣೆಗಳು ಮಹತ್ವದ್ದಾಗಿವೆ ಎಂಬುದನ್ನು ಗುರುತಿಸಿ, ಅವನ್ನು ಅಚ್ಚುಕಟ್ಟಾಗಿ ಸಂಯೋಜಿಸುವುದು.

ಕ್ವಾಂಟೈಜೇಶನ್

ಹಲವು ಸಲ್ಲಿಕೆಗಳು ಸಂಕೋಚನ ಮತ್ತು export ಮೇಲೆ ಗಟ್ಟಿಯಾಗಿ ಕೆಲಸ ಮಾಡಿದ್ದವು.

ಸಲ್ಲಿಕೆ	ಕೊಡುಗೆದಾರ	ತಂತ್ರ	ಅದು ಏಕೆ ಮಹತ್ವದ್ದಾಗಿತ್ತು
#414	@signalrush	ಬಳಸಲಾಗಿದೆ ತರಬೇತಿಯ ನಂತರ ತೂಕಗಳನ್ನು ಕ್ವಾಂಟೈಸ್ ಮಾಡಲು GPTQ-lite.	ಈ GPTQ-lite ಅನ್ನು ಯಶಸ್ವಿಯಾಗಿ ಬಳಸಿದ ಮೊದಲ ಲೀಡರ್‌ಬೋರ್ಡ್ ಸಲ್ಲಿಕೆ, ಇದರಿಂದ ಉತ್ತಮ ಮೌಲ್ಯಮಾಪನಕ್ಕೆ ದಾರಿ ಮಾಡಿಕೊಟ್ಟಿತು.
#1060	@dexhunter	ಪೂರ್ಣ Hessian GPTQ ಅನ್ನು ಯಶಸ್ವಿಯಾಗಿ ಬಳಸಲು @raahilshah ಅವರ #634 ಕೆಲಸದ ಮೇಲೆ ನಿರ್ಮಿಸಿದರು.	ಹಿಂದಿನ ಕ್ವಾಂಟೈಜೇಶನ್ ಕೆಲಸವನ್ನು ಇನ್ನಷ್ಟು ಬಲವಾದ ಸಂಕೋಚನ ಮಾರ್ಗಕ್ಕೆ ವಿಸ್ತರಿಸಿತು.

ಟೆಸ್ಟ್-ಟೈಮ್ ಮತ್ತು ಮೌಲ್ಯಮಾಪನ ತಂತ್ರಗಳು

ಕೆಲವು ಸಲ್ಲಿಕೆಗಳು ಮಾಡೆಲ್ ಸುಧಾರಣೆ ಮತ್ತು ಮೌಲ್ಯಮಾಪನ ತಂತ್ರಗಳ ನಡುವಿನ ಗಡಿಯನ್ನು ಮುಂದೂಡಿದವು. ಈ ವಿಧಾನಗಳು ನಿಯಮಗಳ ಅಡಿಯಲ್ಲಿ ಮಾನ್ಯವಾಗಿದ್ದರೂ, ಆಯೋಜಕರಾದ ನಮ್ಮಿಂದ ಜಾಗರೂಕ ಪರಿಶೀಲನೆ ಅಗತ್ಯವಾಯಿತು.

ಸಲ್ಲಿಕೆ	ಕೊಡುಗೆದಾರ	ತಂತ್ರ	ಅದು ಏಕೆ ಮಹತ್ವದ್ದಾಗಿತ್ತು
#77	@samacqua	ಬಳಸಿರುವುದು ಸ್ಕೋರ್-ಮೊದಲು, ಪ್ರತಿ-ದಾಖಲೆ LoRA ಪರೀಕ್ಷಾ-ಸಮಯದ ತರಬೇತಿ: ಮೊದಲು ಸ್ಕೋರ್ ಮಾಡಿ, ಈಗಾಗಲೇ ಸ್ಕೋರ್ ಮಾಡಲಾದ ಚಂಕ್‌ಗಳ ಮೇಲೆ ಮಾತ್ರ ಹೊಂದಿಸಿ ಮತ್ತು ದಾಖಲೆ ಗಡಿಗಳಲ್ಲಿ ಮರುಹೊಂದಿಸಿ.	ನಿಯಮಗಳ ಅಡಿಯಲ್ಲಿ ಪರಿಶೀಲಿಸಬಹುದಾಗಿಯೇ ಉಳಿಯುತ್ತಾ ಮಾಡೆಲ್ ಸುಧಾರಣೆ ಮತ್ತು ಮೌಲ್ಯಮಾಪನ ತಂತ್ರದ ನಡುವಿನ ಗಡಿಯನ್ನು ಮುಂದೂಡಿತು.
#1019	@abaybektursun	ಬಳಸಲಾಗಿದೆ ಸ್ವಯಂ-ರಚಿತ GPTQ ಕ್ಯಾಲಿಬ್ರೇಶನ್: ತರಬೇತಿ ಪಡೆದ ಮಾಡೆಲ್‌ನಿಂದ ಕ್ಯಾಲಿಬ್ರೇಶನ್ ಪಠ್ಯವನ್ನು ರಚಿಸಿ, ನಂತರ ಆ ಸಕ್ರಿಯೀಕರಣಗಳಿಂದ GPTQ ಹೆಷಿಯನ್‌ಗಳನ್ನು ನಿರ್ಮಿಸಿ.	ಒಬ್ಬ ಆಯೋಜಕರಿಂದ ಎಚ್ಚರಿಕೆಯಿಂದ ಪರಿಶೀಲನೆ ಅಗತ್ಯವಿದ್ದ ಸೃಜನಾತ್ಮಕ ಮಾಪನಾಂಕ ನಿರ್ಣಯ ತಂತ್ರ.

ಹೊಸ ಮಾಡೆಲಿಂಗ್ ಮತ್ತು ಡೇಟಾ ಕಲ್ಪನೆಗಳು

ಕೆಲವು ಸಲ್ಲಿಕೆಗಳು ವಿಶೇಷವಾಗಿ ಸೃಜನಶೀಲವಾಗಿದ್ದ ಮಾಡೆಲಿಂಗ್ ಅಥವಾ ಡೇಟಾ ಕಲ್ಪನೆಗಳನ್ನು ಪರಿಚಯಿಸಿದವು.

ಸಲ್ಲಿಕೆ	ಕೊಡುಗೆದಾರ	ತಂತ್ರ	ಅದು ಏಕೆ ಮಹತ್ವದ್ದಾಗಿತ್ತು
#1729	@romeerp	CaseOps ಟೋಕನೈಸರ್ ಅನ್ನು ಪರಿಚಯಿಸಲಾಗಿದೆ: ಮೂಲ-ಬೈಟ್ BPB ಸೈಡ್‌ಕಾರ್ ಲೆಕ್ಕಾಚಾರ ಹೊಂದಿರುವ ನಷ್ಟರಹಿತ ಕ್ಯಾಪಿಟಲೈಸೇಶನ್ operator ಟೋಕನ್‌ಗಳು.	ಒಂದು ಸೃಜನಾತ್ಮಕ ಟೋಕನೈಸರ್ ಮತ್ತು ಡೇಟಾ-ಪ್ರಾತಿನಿಧ್ಯದ ಕಲ್ಪನೆ.
#265	@unnir	ಪರಿಚಯಿಸಲಾಗಿದೆ XSA, GQA-aware grouped views ಹೊಂದಿರುವ ಪರಿಣಾಮಕಾರಿ partial Exclusive Self Attention ವಿಧಾನ.	ತಂದಿದೆ ಒಂದು ದಕ್ಷ ಅಟೆನ್ಷನ್ ರೂಪಾಂತರವನ್ನು ಸವಾಲಿನೊಳಗೆ.
#65	@aquariouseworkman	ಪರಿಚಯಿಸಲಾಗಿದೆ SmearGate ಮತ್ತು BigramHash: ಕಲಿತ ಹಿಂದಿನ-ಟೋಕನ್ ಎಂಬೆಡಿಂಗ್ ಮಿಶ್ರಣದ ಜೊತೆಗೆ ಪಕ್ಕದ-ಟೋಕನ್-ಜೋಡಿ ಹ್ಯಾಶ್ ವೈಶಿಷ್ಟ್ಯಗಳು.	ಸೇರಿಸಲಾಗಿದೆ ಹೊಸ ವೈಶಿಷ್ಟ್ಯಗಳ ಕಾರ್ಯವಿಧಾನಗಳನ್ನು ಆರಂಭದಿಂದಲೇ.
#1204	@msisovic	ಪರಿಚಯಿಸಲಾಗಿದೆ ಮಿನಿ ಡೆಪ್ತ್ ರಿಕರೆನ್ಸ್: 4 ಮತ್ತು 5ನೇ ಪದರಗಳನ್ನು ಪುನರಾವರ್ತಿಸಲಾಗಿದೆ, ತರಬೇತಿಯ ಮಧ್ಯಭಾಗದವರೆಗೆ ರಿಕರೆನ್ಸ್ ಅನ್ನು ವಿಳಂಬಗೊಳಿಸಲಾಗಿದೆ, ಮತ್ತು ಪುನರಾವರ್ತಿತ MLPಗಳನ್ನು ಭಾಗಶಃ ಅನ್‌ಟೈ ಮಾಡಲಾಗಿದೆ.	ಪುನರಾವರ್ತಿತ ಪದರಗಳು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಕೆಲಸ ಮಾಡುವಂತೆ ಮಾಡಿದ ಮೊದಲ ಸ್ವೀಕರಿಸಲಾದ ಲೀಡರ್‌ಬೋರ್ಡ್ ಸಾಲು.

ನಾವು ಈ ಒಂಬತ್ತು ಸಲ್ಲಿಕೆಗಳನ್ನು ಹೈಲೈಟ್ ಮಾಡಲು ಆಯ್ಕೆ ಮಾಡಿಕೊಂಡದ್ದು, ಸವಾಲು ಹೊರತರುವುದಾಗಿ ನಾವು ನಿರೀಕ್ಷಿಸಿದ್ದ ಫಲಿತಾಂಶಗಳ ವ್ಯಾಪ್ತಿಯನ್ನು ಅವು ಪ್ರತಿನಿಧಿಸುತ್ತವೆ ಎಂಬ ಕಾರಣದಿಂದ. ಕೆಲವು ಭಾಗವಹಿಸಿದವರು ಜಾಗರೂಕ ಟ್ಯೂನಿಂಗ್ ಮೂಲಕ ಯಶಸ್ಸು ಕಂಡರು. ಇತರರು ಪ್ರಮಾಣೀಕರಣ ಮತ್ತು ಕಡಿಮೆ ಶ್ರೇಣಿ ತಂತ್ರಗಳನ್ನು ಮುಂದೂಡಿದರು. ಕೆಲವರು ಮೌಲ್ಯಮಾಪನ ನಿಯಮಗಳ ಅಂಚುಗಳನ್ನು ಅನ್ವೇಷಿಸಿದರು. ಇನ್ನೂ ಹಲವರು ಸಾಹಿತ್ಯದಿಂದಲೋ ಅಥವಾ ಸಂಪೂರ್ಣ ಹೊಸದಾಗಿ ಯೋಚಿಸಿಯೋ ಮಾಡೆಲಿಂಗ್ ಅಥವಾ ಡೇಟಾ ಕಲ್ಪನೆಗಳನ್ನು ಪರಿಚಯಿಸಿ, ನಿರೀಕ್ಷೆಯಿರದ ಲಾಭಗಳನ್ನು ತಂದರು.

ನಾನ್‌ರೆಕಾರ್ಡ್ ಟ್ರ್ಯಾಕ್

ನಾನ್‌ರೆಕಾರ್ಡ್ ಟ್ರ್ಯಾಕ್ ಅನೇಕ ಸೃಜನಶೀಲ ಸಲ್ಲಿಕೆಗಳ ನೆಲೆಯಾಗಿತ್ತು. ಸ್ವಯಂಪ್ರೇರಿತವಲ್ಲದ ಪಠ್ಯ ಮಾಡೆಲಿಂಗ್ ಇಂದ ಡೈನಾಮಿಕ್ ಟೋಕನೈಸೇಶನ್ವರೆಗೆ ವ್ಯಾಪಿಸುವ ವಿಧಾನಗಳನ್ನು ಒಳಗೊಂಡ 15 ಮೆಚ್ಚಿನ ಸಲ್ಲಿಕೆಗಳನ್ನು ನಾವು ಹೈಲೈಟ್ ಮಾಡಿದ್ದೇವೆ.

ಈ ಟ್ರ್ಯಾಕ್ ಹೆಚ್ಚು ಪ್ರಯೋಗಾತ್ಮಕವಾಗಿದ್ದರಿಂದ, ಕಚ್ಚಾ ಕಾರ್ಯಕ್ಷಮತೆಯಿಗಿಂತ ವಿಧಾನ ತಾಂತ್ರಿಕವಾಗಿ ಆಸಕ್ತಿದಾಯಕವಾಗಿದೆಯೇ ಎಂಬುದರ ಮೇಲೆ ನಾವು ಹೆಚ್ಚು ಗಮನಹರಿಸಿದ್ದೇವೆ. ವಿಶೇಷವಾಗಿ ಮೂರು ಸಲ್ಲಿಕೆಗಳು ಗಮನಸೆಳೆದವು:

ಇವು ಕಾರ್ಯಕ್ಷಮತೆಯ ಆಧಾರದ ಮೇಲೆ ಅವಶ್ಯವಾಗಿ ಅಗ್ರ ಮೂರು ಆಗಿರದಿದ್ದರೂ, ನಮ್ಮ ಮೆಚ್ಚಿನ ಮೂರು ನಾನ್‌ರೆಕಾರ್ಡ್ ಸಲ್ಲಿಕೆಗಳಾಗಿದ್ದವು.

ಆದರೂ, ನಾನ್‌ರೆಕಾರ್ಡ್ ಟ್ರ್ಯಾಕ್ ಇನ್ನೂ ಸ್ಪರ್ಧಾತ್ಮಕವಾಗಿತ್ತು. ನಾನ್‌ರೆಕಾರ್ಡ್ ಲೀಡರ್‌ಬೋರ್ಡ್‌ನ ಅರ್ಧ ಎಂಟ್ರಿಗಳು 1.22 BPB ಎಂಬ ಸರಳ ಬೇಸ್ ಲೈನ್ ಅನ್ನು ಮೀರಿದ್ದವು ಮತ್ತು ಅಗ್ರ ಸ್ಥಾನದಲ್ಲಿದ್ದ ಎಂಟ್ರಿ 1.12 BPB ತಲುಪಿತು.

ಇದು ನಮಗೆ ಉತ್ತೇಜನಕಾರಿಯೆನಿಸಿತು. ಬಲವಾದ ಟ್ರಾನ್ಸ್‌ಫಾರ್ಮರ್ ಬೇಸ್ ಲೈನ್‌ಗಳ ವಿರುದ್ಧವೂ, ಪರ್ಯಾಯ ವಿಧಾನಗಳು ಕೆಲವೊಮ್ಮೆ ಪ್ರಭುತ್ವ ಹೊಂದಿರುವ ವಿನ್ಯಾಸದ ಎದುರು ತಮ್ಮ ಸ್ಥಾನವನ್ನು ಉಳಿಸಿಕೊಳ್ಳಬಲ್ಲವು.

ಈ ಟ್ರ್ಯಾಕ್‌ಗೆ ಬಲವಾದ ಕೋಡಿಂಗ್ ಏಜೆಂಟ್‌ಗಳ ಲಭ್ಯತೆ ವಿಶೇಷವಾಗಿ ಪ್ರಯೋಜನಕಾರಿಯಾಗಿದೆ ಎಂದು ನಾವು ಭಾವಿಸುತ್ತೇವೆ. ಏಜೆಂಟ್‌ಗಳು ಊಹಾತ್ಮಕ ಕಲ್ಪನೆಗಳ prototype‌ಗಳನ್ನು ತಯಾರಿಸುವುದನ್ನು ಬಹಳ ಕಡಿಮೆ ವೆಚ್ಚದದ್ದಾಗಿಸಿವೆ, ಇದರಲ್ಲಿ ಹಿಂದೆ ಚಿಕ್ಕ ಸ್ಪರ್ಧೆಯಲ್ಲಿ ಪ್ರಯತ್ನಿಸಲು ತುಂಬಾ ಸಮಯ ಬೇಕಾಗಬಹುದು ಅಥವಾ ಅನಿಶ್ಚಿತವೆನಿಸಬಹುದಾದ ವಿಧಾನಗಳೂ ಸೇರಿವೆ.

ಮುಖ್ಯ ಪಾಠಗಳು

Parameter Golf ಮತ್ತು ಅದಕ್ಕೆ ಹೋಲುವ ಹಿಂದಿನ ಸ್ಪರ್ಧೆಗಳ ನಡುವಿನ ಪ್ರಮುಖ ವ್ಯತ್ಯಾಸವೆಂದರೆ ಕೋಡಿಂಗ್ ಏಜೆಂಟ್‌ಗಳ ವ್ಯಾಪಕ ಬಳಕೆ. ಸಲ್ಲಿಸಿದವರ ಬಹುಪಾಲು ತಮ್ಮ ಕೆಲಸದ ಭಾಗವಾಗಿ ಏಜೆಂಟ್‌ಗಳನ್ನು ಬಳಸಿದ್ದಾಗಿ ಉಲ್ಲೇಖಿಸಿದ್ದಾರೆ.

ಇದರಿಂದ ಪ್ರವೇಶಕ್ಕೆ ಇರುವ ಅಡೆತಡೆ ಕಡಿಮೆಯಾಯಿತು. ಭಾಗವಹಿಸುವವರು ಪ್ರಯೋಗಗಳನ್ನು ವೇಗವಾಗಿ ಅಣಿಗೊಳಿಸಲು, ಅಪರಿಚಿತ ಕೋಡ್ ಅನ್ನು ಪರಿಶೀಲಿಸಲು ಮತ್ತು ಕಡಿಮೆ ಅಡೆತಡೆಗಳೊಂದಿಗೆ ಆಲೋಚನೆಗಳನ್ನು ಪರೀಕ್ಷಿಸಲು ಸಾಧ್ಯವಾಯಿತು. ರನ್‌ಪಾಡ್‌ನ $1,000,000 ಮೌಲ್ಯದ ಕಂಪ್ಯೂಟ್ ಪ್ರಾಯೋಜಕತ್ವವು ಕೂಡ ಈ ಸವಾಲನ್ನು ಇನ್ನಷ್ಟು ಜನರಿಗೆ ಪ್ರವೇಶಯೋಗ್ಯವಾಗಿಸುವಲ್ಲಿ ಪ್ರಮುಖ ಪಾತ್ರವಹಿಸಿತು.

ಅದೇ ಸಮಯದಲ್ಲಿ, ಏಜೆಂಟ್ ಬಳಕೆ ಸಲ್ಲಿಕೆ ಮತ್ತು ಅಂಕಗಳಿಕೆಗೆ ಹೊಸ ಸಮಸ್ಯೆಗಳನ್ನು ಸೃಷ್ಟಿಸಿತು. ಅನೇಕ ಸಲ್ಲಿಕೆಗಳು ಮೂಲತಃ ಹೊಸ ವಿಧಾನಗಳಿಗಿಂತ, ಈಗಿರುವ ಅಗ್ರ ಅಂಕಗಳಿಸಿದ ಸಲ್ಲಿಕೆಗಳಲ್ಲಿನ ಸಣ್ಣ ಬದಲಾವಣೆಗಳಾಗಿದ್ದವು. ಇದು ಬಹುಮಟ್ಟಿಗೆ ಉಪಯುಕ್ತವಾಗಿತ್ತು: ಬಲವಾದ ಕಲ್ಪನೆಗಳು ವೇಗವಾಗಿ ಹರಡಿದವು ಮತ್ತು ಇತರರಿಂದ ಇನ್ನಷ್ಟು ಪರಿಷ್ಕೃತವಾದವು. ಆದರೆ ಇದರಿಂದ ಗದ್ದಲವೂ ಉಂಟಾಯಿತು. ಸ್ಪರ್ಧಾ ಮಾರ್ಗಸೂಚಿಗಳ ಹೊರಗೆ ಬಿದ್ದ ಸಲ್ಲಿಕೆಗಳು ಅಸಾಮಾನ್ಯವಾಗಿ ಬಲವಾದ ಅಂಕಗಳನ್ನು ತೋರಿಸಿದಾಗ, ಇತರ ಏಜೆಂಟ್‌ಗಳು ಕೆಲವೊಮ್ಮೆ ಆ ಕಲ್ಪನೆಗಳನ್ನು ನಕಲಿಸಿ ಅದೇ ಅಮಾನ್ಯ ದಾರಿಯಲ್ಲಿ ಮುಂದುವರಿದವು.

ಸಲ್ಲಿಕೆಗಳ ಪ್ರಮಾಣವೂ ನಾವು ಸ್ಪರ್ಧೆಯನ್ನು ನಡೆಸಬೇಕಾದ ರೀತಿಯನ್ನು ಬದಲಿಸಿತು. ಪ್ರತಿಯೊಂದು ಸಲ್ಲಿಕೆಯನ್ನು ಕೈಯಾರೆ ಪರಿಶೀಲಿಸಿ, ಅದೇ ವೇಳೆ ಲೀಡರ್‌ಬೋರ್ಡ್ ಅನ್ನು ಮುಂದುವರಿಸುವುದು ನಮಗೆ ಸಾಧ್ಯವಾಗಲಿಲ್ಲ. ಸವಾಲಿನ ಅವಧಿಯಲ್ಲಿ, ಹೊಸ ಸಲ್ಲಿಕೆಗಳನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡಿ ಮಾನವ ಪರಿಶೀಲನೆಗಾಗಿ ಗುರುತಿಸಲು ನಾವು Codex ಆಧಾರಿತ ಆಂತರಿಕ triage bot ಅನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದೇವೆ. ದಿನಕ್ಕೆ ನೂರಾರು ಸಲ್ಲಿಕೆಗಳು ಬಂದ ಅವಧಿಗಳಲ್ಲಿ ಇದು ವಿಶೇಷವಾಗಿ ಮಹತ್ವದ್ದಾಯಿತು.

AI ಏಜೆಂಟ್‌ಗಳು ಸವಾಲಿನ ಸುತ್ತಲಿನ ಸಮುದಾಯದ ಭಾಗವಾಗಿಯೂ ಪರಿಣಮಿಸಿದವು. ಸ್ಪರ್ಧೆಯ ಬಹುಭಾಗದಲ್ಲಿ, @notapplica ಮತ್ತು ಅವರ ಕೋಡಿಂಗ್ ಏಜೆಂಟ್ “Live Updates” ಬುಲೆಟಿನ್ ಅನ್ನು ನಡೆಸಿ, ಪ್ರಮುಖ ಘಟನೆಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಿದರು, ಲೀಡರ್‌ಬೋರ್ಡ್ ವಿಧಾನಗಳನ್ನು ವಿವರಿಸಿದರು ಮತ್ತು ಇತರ ಭಾಗವಹಿಸಿದವರಿಗೆ ಸ್ಪರ್ಧೆಯನ್ನು ಅನುಸರಿಸಲು ಸಹಾಯ ಮಾಡಿದರು. ಕಡಿಮೆ ಅನುಭವ ಹೊಂದಿದ ಭಾಗವಹಿಸಿದವರು ತಮ್ಮ ಸಲ್ಲಿಕೆಗಳು ನಿಯಮಗಳೊಳಗಿದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಲು ಮತ್ತು ಸಾಮಾನ್ಯ ಅಮಾನ್ಯ ವಿಧಾನಗಳನ್ನು ತಪ್ಪಿಸಲು ಸಹಾಯ ಮಾಡುವ ಸಮುದಾಯ ವಿಮರ್ಶಾ ಸಾಧನಗಳೂ ಕಾಣಿಸಿಕೊಂಡವು.

ಮುಂದೇನು?

ಅರ್ಹ ಭಾಗವಹಿಸುವವರು⁠(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಪಾಲ್ಗೊಳ್ಳಲು ಮತ್ತು ಮಷಿನ್ ಲರ್ನಿಂಗ್ ಸಂಶೋಧನೆಯನ್ನು ಅನುಭವಿಸಲು ಸಾಧ್ಯವಾಗುವಂತಹ ಸವಾಲನ್ನು ಪ್ರಾರಂಭಿಸುವುದು ನಮ್ಮ ಪ್ರಾಥಮಿಕ ಗುರಿಯಾಗಿತ್ತು. Parameter Golf ತಾಂತ್ರಿಕವಾಗಿ ಬಲವಾದ ಮತ್ತು ಸೃಜನಶೀಲ ಸಲ್ಲಿಕೆಗಳ ವಿಶಾಲ ಶ್ರೇಣಿಯನ್ನು ಒಟ್ಟುಗೂಡಿಸಿತು, ಮತ್ತು AI ಏಜೆಂಟ್‌ಗಳು ಹೆಚ್ಚು ಸಾಮರ್ಥ್ಯವುಳ್ಳವುಗಳಾಗಿ ಹಾಗೂ ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲ್ಪಡುವಂತೆ ಆಗುತ್ತಿದ್ದಂತೆ ಮುಕ್ತ ಸಂಶೋಧನಾ ಸ್ಪರ್ಧೆಗಳು ಹೇಗೆ ಬದಲಾಗಬಹುದು ಎಂಬುದರ ಬಗ್ಗೆ ನಮಗೆ ಇನ್ನಷ್ಟು ಸ್ಪಷ್ಟ ದೃಷ್ಟಿಕೋನ ನೀಡಿತು.

ಭವಿಷ್ಯದಲ್ಲಿ ಇಂತಹ ಇನ್ನಷ್ಟು ಸವಾಲುಗಳನ್ನು ಆರಂಭಿಸುವ ಬಗ್ಗೆ ನಾವು ಯೋಚಿಸುತ್ತಿದ್ದೇವೆ. ನಿಮಗೆ ಆಸಕ್ತಿ ಇದ್ದರೆ, ದಯವಿಟ್ಟು ಚಾಲೆಂಜ್ ಭಾಗವಹಿಸುವವರ ಫಾರ್ಮ್⁠(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಅನ್ನು ಭರ್ತಿ ಮಾಡಿ.

2026

ಲೇಖಕ

OpenAI

ಓದು ಮುಂದುವರಿಸಿ

ಎಲ್ಲವನ್ನೂ ನೋಡಿ

ಕೋಡಿಂಗ್ ಮೌಲ್ಯಮಾಪನಗಳಲ್ಲಿ ಸಂಕೇತವನ್ನು ಗದ್ದಲದಿಂದ ಬೇರ್ಪಡಿಸುವುದು

ಸಂಶೋಧನೆಜುಲೈ 8, 2026

GeneBench-Pro ಪರಿಚಯ

ಸಂಶೋಧನೆಜೂನ್ 30, 2026

A near-autonomous AI chemist improves a challenging reaction

ಸಮೀಪ-ಸ್ವಾಯತ್ತ AI ರಸಾಯನಶಾಸ್ತ್ರಜ್ಞನು ಔಷಧೀಯ ರಸಾಯನಶಾಸ್ತ್ರದಲ್ಲಿ ಸವಾಲಿನ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಸುಧಾರಿಸುತ್ತಾನೆ

ಸಂಶೋಧನೆಜೂನ್ 17, 2026