gpt-oss ಪರಿಚಯಿಸುತ್ತಿದ್ದೇವೆ
gpt-oss-120b ಮತ್ತು gpt-oss-20b ಓಪನ್ ವೆಯ್ಟ್ ಮಾಡೆಲ್ಗಳ ಗಡಿಯನ್ನು ಮತ್ತಷ್ಟು ವಿಸ್ತರಿಸುತ್ತವೆ
ನಾವು gpt-oss-120b ಮತ್ತು gpt-oss-20b—ಅತ್ಯಾಧುನಿಕ ಓಪನ್ ವೆಯ್ಟ್ ಭಾಷಾ ಮಾಡೆಲ್ಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡುತ್ತಿದ್ದೇವೆ. ಇವುಗಳು ಕಡಿಮೆ ವೆಚ್ಚದಲ್ಲಿ ಶಕ್ತಿಶಾಲಿ ನೈಜ-ಪ್ರಪಂಚದ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ನೀಡುತ್ತವೆ. ನಮ್ಯವಾದ Apache 2.0 ಲೈಸೆನ್ಸ್ ಅಡಿಯಲ್ಲಿ ಲಭ್ಯವಿರುವ ಈ ಮಾಡೆಲ್ಗಳು, ಸಮಾನ ಗಾತ್ರದ open models ಅನ್ನು ತಾರ್ಕಿಕತೆ ಕಾರ್ಯಗಳಲ್ಲಿ ಮೀರಿಸುತ್ತವೆ, ಶಕ್ತಿಶಾಲಿ ಉಪಕರಣ ಬಳಕೆ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ತೋರಿಸುತ್ತವೆ ಮತ್ತು ಗ್ರಾಹಕರ ಹಾರ್ಡ್ವೇರ್ನಲ್ಲಿ ಪರಿಣಾಮಕಾರಿಯಾಗಿ ನಿಯೋಜಿಸಲು ಆಪ್ಟಿಮೈಸ್ ಮಾಡಲ್ಪಟ್ಟಿವೆ. ಇವುಗಳನ್ನು OpenAI ನ ಅತ್ಯಾಧುನಿಕ ಆಂತರಿಕ ಮಾಡೆಲ್ಗಳಾದ o3 ಮತ್ತು ಇತರ ಫ್ರಂಟಿಯರ್ ಸಿಸ್ಟಮ್ಗಳಿಂದ ಪ್ರೇರಿತವಾದ ವಿಧಾನಗಳು ಹಾಗೂ ಬಲವರ್ಧನೆ ಕಲಿಕೆಯ ಸಂಯೋಜನೆಯ ಮೂಲಕ ತರಬೇತುಗೊಳಿಸಲಾಗಿದೆ.
gpt-oss-120b ಮಾಡೆಲ್ ಮೂಲ ತಾರ್ಕಿಕತೆ ಬೆಂಚ್ಮಾರ್ಕ್ಗಳಲ್ಲಿ OpenAI o4-mini ಮಾದರಿಯ ಸಮೀಪದ ಸಮಾನತೆಯನ್ನು ಸಾಧಿಸುತ್ತದೆ ಮತ್ತು ಒಂದೇ 80 GB GPU ಮೇಲೆ ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. gpt-oss-20b ಮಾಡೆಲ್ ಸಾಮಾನ್ಯ ಬೆಂಚ್ಮಾರ್ಕ್ಗಳಲ್ಲಿ OpenAI o3‑mini ಮಾಡೆಲ್ನಂತೆಯೇ ಸಮಾನ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡುತ್ತದೆ ಮತ್ತು ಕೇವಲ 16 GB ಮೆಮೊರಿಯುಳ್ಳ ಎಡ್ಜ್ ಸಾಧನಗಳಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸಬಲ್ಲದು, ಇದರಿಂದ ಇದು ಆನ್-ಡಿವೈಸ್ ಬಳಕೆ, ಸ್ಥಳೀಯ ಇನ್ಫರೆನ್ಸ್ ಅಥವಾ ದುಬಾರಿ ಮೂಲಸೌಕರ್ಯ ಇಲ್ಲದೆ ವೇಗದ ಆವೃತ್ತಿ ಪರಿಷ್ಕರಣೆಗಳಿಗೆ ಅತ್ಯುತ್ತಮವಾಗಿದೆ. ಈ ಎರಡೂ ಮಾಡೆಲ್ಗಳು ಟೂಲ್ ಬಳಕೆ, ಕೆಲವು-ಶಾಟ್ ಫಂಕ್ಷನ್ ಕಾಲಿಂಗ್, CoT ರೀಸನಿಂಗ್ (Tau-Bench ಏಜೆಂಟಿಕ್ ಇವಾಲ್ಯುವೇಷನ್ ಸೂಟ್ನ ಫಲಿತಾಂಶಗಳಲ್ಲಿ ಕಾಣಿಸಿದಂತೆ) ಮತ್ತು HealthBenchನಲ್ಲಿ ಅತ್ಯುತ್ತಮ ಕಾರ್ಯಕ್ಷಮತೆ ನೀಡುತ್ತವೆ — (OpenAI o1 ಮತ್ತು GPT‑4o ಮಾಡೆಲ್ಗಳಿಗಿಂತಲೂ ಉತ್ತಮ ಫಲಿತಾಂಶ ನೀಡುತ್ತವೆ).
ಈ ಮಾಡೆಲ್ಗಳು ನಮ್ಮ ಪ್ರತಿಕ್ರಿಯೆಗಳ API(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಗೆ ಹೊಂದಿಕೊಳ್ಳುತ್ತವೆ ಮತ್ತು ಅಸಾಧಾರಣ ಸೂಚನೆ ಅನುಸರಣೆ, ವೆಬ್ ಹುಡುಕಾಟ ಅಥವಾ Python ಕೋಡ್ ಕಾರ್ಯಗತಗೊಳಿಸುವಂತಹ ಸಾಧನ ಬಳಕೆ, ಮತ್ತು ತಾರ್ಕಿಕ ಸಾಮರ್ಥ್ಯಗಳೊಂದಿಗೆ — ಸಂಕೀರ್ಣ ತಾರ್ಕಿಕತೆ ಅಗತ್ಯವಿಲ್ಲದ ಕಾರ್ಯಗಳಿಗೆ ತಾರ್ಕಿಕ ಪ್ರಯತ್ನವನ್ನು ಸರಿಹೊಂದಿಸುವ ಸಾಮರ್ಥ್ಯ ಮತ್ತು/ಅಥವಾ ಅತ್ಯಂತ ಕಡಿಮೆ ಲೇಟೆನ್ಸಿಯ ಅಂತಿಮ ಔಟ್ಪುಟ್ಗಳನ್ನು ಗುರಿಯಾಗಿಸುವ ಸಾಮರ್ಥ್ಯ ಸೇರಿದಂತೆ ಏಜೆಂಟಿಕ್ ವರ್ಕ್ಫ್ಲೋಗಳಲ್ಲಿ ಬಳಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. ಅವು ಸಂಪೂರ್ಣವಾಗಿ ಕಸ್ಟಮೈಸ್ ಮಾಡಬಹುದಾದವು, ಪೂರ್ಣ ಚಿಂತನೆಯ ಸರಣಿಯನ್ನು (CoT) ಒದಗಿಸುತ್ತವೆ ಮತ್ತು ರಚನಾತ್ಮಕ ಔಟ್ಪುಟ್ಗಳನ್ನು(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಬೆಂಬಲಿಸುತ್ತವೆ.
ನಮ್ಮ ಎಲ್ಲಾ ಮಾಡೆಲ್ಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡುವ ನಮ್ಮ ಕ್ರಮದಲ್ಲಿ ಸುರಕ್ಷತೆ ಮೂಲ ಅಂಶವಾಗಿದ್ದು, open models ಗಾಗಿ ಇದು ವಿಶೇಷವಾಗಿ ಅತ್ಯಂತ ಪ್ರಮುಖವಾಗಿದೆ. ಮಾಡೆಲ್ಗಳನ್ನು ಸಮಗ್ರ ಸುರಕ್ಷತಾ ತರಬೇತಿ ಮತ್ತು ಮೌಲ್ಯಮಾಪನಗಳ ಮೂಲಕ ನಡೆಸುವುದರ ಜೊತೆಗೆ, ನಾವು ನಮ್ಮ ಸನ್ನದ್ಧತೆ ಚೌಕಟ್ಟಿನ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಅಡಿಯಲ್ಲಿ GPT‑oss‑120b ನ ಪ್ರತಿಕೂಲವಾಗಿ ಸೂಕ್ಷ್ಮವಾಗಿ ಟ್ಯೂನ್ ಮಾಡಲಾದ ಆವೃತ್ತಿಯನ್ನು ಪರೀಕ್ಷಿಸುವ ಮೂಲಕ ಹೆಚ್ಚುವರಿ ಮೌಲ್ಯಮಾಪನದ ಪದರವನ್ನು ಪರಿಚಯಿಸಿದ್ದೇವೆ. gpt-oss ಮಾಡೆಲ್ಗಳು ಆಂತರಿಕ ಸುರಕ್ಷತಾ ಮಾನದಂಡಗಳಲ್ಲಿ ನಮ್ಮ ಫ್ರಂಟಿಯರ್ ಮಾಡೆಲ್ಗಳಿಗೆ ಸಮಾನವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ, ಡೆವಲಪರ್ಗಳಿಗೆ ನಮ್ಮ ಇತ್ತೀಚಿನ ಸ್ವಾಮ್ಯದ ಮಾಡೆಲ್ಗಳಂತೆಯೇ ಅದೇ ಸುರಕ್ಷತಾ ಮಾನದಂಡಗಳನ್ನು ಒದಗಿಸುತ್ತವೆ. ನಾವು ಆ ಕೆಲಸದ ಫಲಿತಾಂಶಗಳನ್ನು ಮತ್ತು ಹೆಚ್ಚಿನ ವಿವರಗಳನ್ನು ಸಂಶೋಧನಾ ಪ್ರಬಂಧದಲ್ಲಿ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಮತ್ತು ಮಾಡೆಲ್ ಕಾರ್ಡ್ನಲ್ಲಿ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಹಂಚಿಕೊಳ್ಳುತ್ತಿದ್ದೇವೆ. ನಮ್ಮ ವಿಧಾನವನ್ನು ಬಾಹ್ಯ ತಜ್ಞರು ಪರಿಶೀಲಿಸಿದ್ದು, ಓಪನ್-ವೆಯ್ಟ್ ಮಾಡೆಲ್ಗಳಿಗೆ ಹೊಸ ಸುರಕ್ಷತೆ ಮಾನದಂಡಗಳನ್ನು ಸ್ಥಾಪಿಸುವತ್ತ ಇದು ಒಂದು ಪ್ರಮುಖ ಹೆಜ್ಜೆಯಾಗಿದೆ.
ನಮ್ಮ open models ಗಳ ನೈಜ-ಪ್ರಪಂಚದ ಅರ್ಜಿಗಳನ್ನು ತಿಳಿಯಲು, ಡೇಟಾ ಸುರಕ್ಷತೆಗಾಗಿ ಈ ಮಾಡೆಲ್ಗಳನ್ನು ಆವರಣದಲ್ಲಿ ಹೋಸ್ಟ್ ಮಾಡುವುದರಿಂದ ಹಿಡಿದು, ವಿಶೇಷ ಡೇಟಾಸೆಟ್ಗಳಲ್ಲಿ ಅವುಗಳನ್ನು ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡುವವರೆಗೆ ನಾವು AI Sweden(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ), Orange(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ), ಮತ್ತು Snowflake(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಮುಂತಾದ ಆರಂಭಿಕ ಪಾಲುದಾರರೊಂದಿಗೆ ಸಹಕರಿಸುತ್ತಿದ್ದೇವೆ. ವೈಯಕ್ತಿಕ ಡೆವಲಪರ್ಗಳಿಂದ ಹಿಡಿದು ದೊಡ್ಡ ಉದ್ಯಮಗಳು ಹಾಗೂ ಸರ್ಕಾರಗಳವರೆಗೆ ಎಲ್ಲರೂ ತಮ್ಮದೇ ಮೂಲಸೌಕರ್ಯದಲ್ಲಿ AI ಅನ್ನು ಚಾಲನೆ ಮಾಡಿ ಕಸ್ಟಮೈಸ್ ಮಾಡಿಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಗುವಂತೆ ಈ ಶ್ರೇಷ್ಟ open models ಅನ್ನು ನೀಡುತ್ತಿರುವುದು ನಮಗೆ ಅತ್ಯಂತ ಉತ್ಸಾಹದ ವಿಷಯವಾಗಿದೆ. ನಮ್ಮ API ಯಲ್ಲಿ ಲಭ್ಯವಿರುವ ಮಾದರಿಗಳ ಜೊತೆಗೆ, ಡೆವಲಪರ್ಗಳು ತಮ್ಮ AI ವರ್ಕ್ಫ್ಲೋಗಳಿಗೆ ಅಗತ್ಯವಾದ ಕಾರ್ಯಕ್ಷಮತೆ, ವೆಚ್ಚ ಮತ್ತು ಲೇಟೆನ್ಸಿ ಮಟ್ಟವನ್ನು ಆಯ್ಕೆ ಮಾಡಿಕೊಳ್ಳಬಹುದು.
ವಿಶೇಷವಾಗಿ ತಾರ್ಕಿಕತೆ, ಪರಿಣಾಮಕಾರಿತ್ವ ಮತ್ತು ನೈಜ ಜಗತ್ತಿನ ಉಪಯೋಗದ ಮೇಲೆ ಗಮನಹರಿಸಿ, ವಿವಿಧ ನಿಯೋಜನೆ ಪರಿಸರಗಳಲ್ಲಿ ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲು ಅನುಕೂಲವಾಗುವಂತೆ, gpt-oss ಮಾಡೆಲ್ಗಳನ್ನು ನಮ್ಮ ಅತ್ಯಾಧುನಿಕ ಪೂರ್ವ-ತರಬೇತಿ ಮತ್ತು ನಂತರದ ತರಬೇತಿ ತಂತ್ರಗಳನ್ನು ಬಳಸಿ ತರಬೇತುಗೊಳಿಸಲಾಗಿದೆ. ನಾವು Whisper ಮತ್ತು CLIP ಸೇರಿದಂತೆ ಇತರ ಮಾಡೆಲ್ಗಳನ್ನು ಮುಕ್ತವಾಗಿ ಲಭ್ಯವಾಗುವಂತೆ ಮಾಡಿದ್ದರೂ, GPT‑2[1] ನಂತರದ ನಮ್ಮ ಮೊದಲ ಓಪನ್-ವೆಯ್ಟ್ ಭಾಷಾ ಮಾಡೆಲ್ಗಳು gpt-oss ಮಾಡೆಲ್ಗಳಾಗಿವೆ.
ಪ್ರತಿ ಮಾದರಿಯು ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ ಆಗಿದ್ದು, ಇನ್ಪುಟ್ ಅನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲು ಅಗತ್ಯವಿರುವ ಸಕ್ರಿಯ ನಿಯತಾಂಕಗಳ ಸಂಖ್ಯೆಯನ್ನು ಕಡಿಮೆ ಮಾಡಲು ತಜ್ಞರ ಮಿಶ್ರಣ (MoE[2]) ಅನ್ನು ಬಳಸುತ್ತದೆ. gpt-oss-120b ಪ್ರತಿ ಟೋಕನ್ಗೆ 5.1B ನಿಯತಾಂಕಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತದೆ, ಆದರೆ gpt-oss-20b 3.6B ನಿಯತಾಂಕಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತದೆ. ಮಾಡೆಲ್ಗಳು ಕ್ರಮವಾಗಿ 117b ಮತ್ತು 21b ಒಟ್ಟು ನಿಯತಾಂಕಗಳನ್ನು ಹೊಂದಿವೆ. ಮಾಡೆಲ್ಗಳು GPT‑3[3] ನಂತೆಯೇ ಪರ್ಯಾಯ ದಟ್ಟ ಮತ್ತು ಸ್ಥಳೀಯವಾಗಿ ಬ್ಯಾಂಡೆಡ್ ವಿರಳ ಗಮನ ಮಾದರಿಗಳನ್ನು ಬಳಸುತ್ತವೆ. ತರ್ಕ ಮತ್ತು ಮೆಮೊರಿ ದಕ್ಷತೆಗಾಗಿ, ಮಾಡೆಲ್ಗಳು 8 ಗಾತ್ರದ ಗುಂಪು ಬಹು-ಪ್ರಶ್ನೆ ಗಮನವನ್ನು ಬಳಸುತ್ತವೆ. ನಾವು ಸ್ಥಳೀಯ ಎನ್ಕೋಡಿಂಗ್ಗಾಗಿ ರೋಟರಿ ಪೊಸಿಷನಲ್ ಎಂಬೆಡಿಂಗ್ (RoPE[4]) ಅನ್ನು ಬಳಸುತ್ತೇವೆ ಮತ್ತು 128k ವರೆಗಿನ ಸಂದರ್ಭದ ಉದ್ದವನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಬೆಂಬಲಿಸುತ್ತೇವೆ.
ಮಾಡೆಲ್ | ಪದರಗಳು | ಒಟ್ಟು ನಿಯತಾಂಕಗಳು | ಪ್ರತಿ ಟೋಕನ್ಗೆ ಸಕ್ರಿಯ ನಿಯತಾಂಕಗಳು | ಒಟ್ಟು ತಜ್ಞರು | ಪ್ರತಿ ಟೋಕನ್ಗೆ ಸಕ್ರಿಯ ತಜ್ಞರು | ಸಂದರ್ಭದ ಉದ್ದ |
gpt-oss-120b | 36 | 117B | 5.1B | 128 | 4 | 128k |
gpt-oss-20b | 24 | 21B | 3.6B | 32 | 4 | 128k |
ನಾವು ಮಾಡೆಲ್ಗಳನ್ನು ವಿಶೇಷವಾಗಿ STEM, ಕೋಡಿಂಗ್ ಮತ್ತು ಸಾಮಾನ್ಯ ಜ್ಞಾನ ವಿಷಯಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿ, ಬಹುಪಾಲು ಇಂಗ್ಲಿಷ್ ಪಠ್ಯಾಧಾರಿತ ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ತರಬೇತುಗೊಳಿಸಿದ್ದೇವೆ. ನಾವು OpenAI o4-mini ಮತ್ತು GPT‑4o ಮಾಡೆಲ್ಗಳಲ್ಲಿ ಬಳಸಿದ ಟೋಕನೈಜರ್ನ ವಿಸ್ತೃತ ಆವೃತ್ತಿಯಾದ o200k_harmony ಬಳಸಿ ಡೇಟಾವನ್ನು ಟೋಕನೈಸ್ ಮಾಡಿದ್ದೇವೆ, ಇದನ್ನೂ ನಾವು ಇಂದು ಸಾರ್ವಜನಿಕವಾಗಿ ಬಿಡುಗಡೆ ಮಾಡುತ್ತಿದ್ದೇವೆ.
ನಮ್ಮ ಮಾಡೆಲ್ಗಳ ಸಂರಚನೆ ಮತ್ತು ತರಬೇತಿ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ, ಮಾಡೆಲ್ ಕಾರ್ಡ್(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಓದಿ.
ಈ ಮಾಡೆಲ್ಗಳನ್ನು o4-mini ಮಾಡೆಲ್ನಂತೆಯೇ ಪ್ರಕ್ರಿಯೆಯಿಂದ ನಂತರ ತರಬೇತುಗೊಳಿಸಲಾಗಿದೆ, ಇದರಲ್ಲಿ ಮೇಲ್ವಿಚಾರಣೆಯ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಹಂತ ಮತ್ತು ಹೆಚ್ಚಿನ ಗಣನಾ ಸಂಪನ್ಮೂಲ ಅಗತ್ಯವಿರುವ ಬಲವರ್ಧನೆ ಕಲಿಕೆ ಹಂತವನ್ನು ಒಳಗೊಂಡಿದೆ. ನಮ್ಮ ಉದ್ದೇಶವು ಮಾಡೆಲ್ಗಳನ್ನು OpenAI ಮಾಡೆಲ್ ವಿಶೇಷಣದೊಂದಿಗೆ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಹೊಂದಿಸುವುದು ಮತ್ತು ಉತ್ತರವನ್ನು ಉತ್ಪಾದಿಸುವ ಮೊದಲು CoT ತಾರ್ಕಿಕತೆ ಮತ್ತು ಸಾಧನ ಬಳಕೆಯನ್ನು ಅನ್ವಯಿಸಲು ಕಲಿಸುವುದಾಗಿತ್ತು. ನಮ್ಮ ಅತ್ಯಾಧುನಿಕ (SoTA) ಸ್ವಂತ ತಾರ್ಕಿಕತೆ ಮಾಡೆಲ್ಗಳಂತೆಯೇ ತಂತ್ರಗಳನ್ನು ಬಳಸಿ, ಈ ಮಾಡೆಲ್ಗಳು ನಂತರದ ತರಬೇತಿಯ ನಂತರ ವಿಶಿಷ್ಟ ಸಾಮರ್ಥ್ಯವನ್ನು ತೋರಿಸುತ್ತವೆ.
APIಯಲ್ಲಿನ OpenAI o-ಸರಣಿಯ ರೀಸನಿಂಗ್ ಮಾಡೆಲ್ಗಳಂತೆಯೇ, ಈ ಎರಡು open-weight ಮಾಡೆಲ್ಗಳು ಮೂರು ತಾರ್ಕಿಕತೆ ಮಟ್ಟಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತವೆ — ಕಡಿಮೆ, ಮಧ್ಯಮ ಮತ್ತು ಹೆಚ್ಚು — ಅಲ್ಲಿ ಲೇಟೆನ್ಸಿ ಮತ್ತು ಕಾರ್ಯಕ್ಷಮತೆ ಪರಸ್ಪರ ಸಮತೋಲನದಲ್ಲಿರುತ್ತವೆ. ಡೆವಲಪರ್ಗಳು ಸಿಸ್ಟಮ್ ಸಂದೇಶದಲ್ಲಿ ಒಂದು ವಾಕ್ಯದ ಮೂಲಕ ಮೂಲಕ ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನವನ್ನು ಸುಲಭವಾಗಿ ಹೊಂದಿಸಬಹುದು.
gpt-oss-120b ಮತ್ತು gpt-oss-20b ಮಾಡೆಲ್ಗಳನ್ನು — o3, o3‑mini ಮತ್ತು o4-mini ಸೇರಿದಂತೆ ಇತರ OpenAI ತಾರ್ಕಿಕತೆ ಮಾದರಿಗಳೊಂದಿಗೆ ಹೋಲಿಕೆ ಮಾಡಿ ಕೋಡಿಂಗ್, ಸ್ಪರ್ಧಾತ್ಮಕ ಗಣಿತ, ಆರೋಗ್ಯ ಮತ್ತು ಏಜೆಂಟಿಕ್ ಉಪಕರಣ ಬಳಕೆ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಅವರ ಸಾಮರ್ಥ್ಯ ಅಳೆಯಲು ಮಾನದಂಡಗೊಳಿಸಿರುವ ಅಕಾಡೆಮಿಕ್ ಬೆಂಚ್ಮಾರ್ಕ್ಗಳಲ್ಲಿ ಮೌಲ್ಯಮಾಪನ ಮಾಡಲಾಗಿದೆ.
gpt-oss-120b OpenAI o3‑mini ಕ್ಕಿಂತ ಉತ್ತಮ ಪ್ರದರ್ಶನ ನೀಡುತ್ತದೆ ಮತ್ತು ಸ್ಪರ್ಧಾತ್ಮಕ ಕೋಡಿಂಗ್ (Codeforces), ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆ ಪರಿಹಾರ (MMLU ಮತ್ತು HLE) ಮತ್ತು ಉಪಕರಣ ಆಹ್ವಾನ (TauBench) ವಿಭಾಗಗಳಲ್ಲಿ OpenAI o4-mini ಮಟ್ಟವನ್ನು ತಲುಪುತ್ತದೆ ಅಥವಾ ಮೀರಿಸುತ್ತದೆ. ಇದಲ್ಲದೆ, ಇದು ಆರೋಗ್ಯ ಸಂಬಂಧಿತ ಪ್ರಶ್ನೆಗಳು (HealthBench) ಮತ್ತು ಸ್ಪರ್ಧಾತ್ಮಕ ಗಣಿತ (AIME 2024 & 2025) ನಲ್ಲಿ o4-mini ಗಿಂತ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. gpt-oss-20b ಇದೇ ಮೌಲ್ಯಮಾಪನೆಗಳಲ್ಲಿ OpenAI o3‑mini ಗೆ ಹೊಂದಿಕೆಯಾಗುತ್ತದೆ ಅಥವಾ ಮೀರುತ್ತದೆ, ಅದರ ಚಿಕ್ಕ ಗಾತ್ರದ ಹೊರತಾಗಿಯೂ, ಸ್ಪರ್ಧಾತ್ಮಕ ಗಣಿತ ಮತ್ತು ಆರೋಗ್ಯದಲ್ಲಿ ಅದನ್ನು ಮೀರಿಸುತ್ತದೆ.
gpt-oss ಮಾಡೆಲ್ಗಳು ವೈದ್ಯಕೀಯ ತಜ್ಞರನ್ನು ಬದಲಿಸುವುದಿಲ್ಲ ಹಾಗೂ ರೋಗನಿರ್ಣಯ ಅಥವಾ ಚಿಕಿತ್ಸೆಗಾಗಿ ಉದ್ದೇಶಿಸಲ್ಪಟ್ಟಿಲ್ಲ
ಉದಾಹರಣೆಯ ಬಿಡುಗಡೆಗಳು
gpt-oss-120b ಮಾದರಿ ಬ್ರೌಸಿಂಗ್ ಟೂಲ್ ಬಳಸಿ, ಮುಂದುವರಿಯುವ ಅನೇಕ (10+) ಕ್ವೆರಿಗಳನ್ನು ಸರಣಿಯಾಗಿಸಿ, ಇತ್ತೀಚಿನ ಮಾಹಿತಿಯನ್ನು ತ್ವರಿತವಾಗಿ ಸಂಗ್ರಹಿಸಬಲ್ಲದು.
ನಮ್ಮ ಇತ್ತೀಚಿನ ಸಂಶೋಧನೆಯು ತಾರ್ಕಿಕ ಮಾಡೆಲ್ನ CoT ಅನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುವುದು, ಮಾಡೆಲ್ CoT ಅನ್ನು ಜೋಡಿಸಲು ನೇರ ಮೇಲ್ವಿಚಾರಣೆಯೊಂದಿಗೆ ತರಬೇತಿ ಪಡೆಯದಿದ್ದರೆ, ದುರುಪಯೋಗವನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಸಹಾಯಕವಾಗಬಹುದು ಎಂದು ತೋರಿಸಿದೆ. ಈ ದೃಷ್ಟಿಕೋನವನ್ನು ಉದ್ಯಮದಲ್ಲಿರುವ ಇತರರು ಸಹ ಹಂಚಿಕೊಂಡಿದ್ದಾರೆ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ). OpenAI o1‑ಪ್ರಿವ್ಯೂ ಪ್ರಾರಂಭಿಸಿದಾಗಿನಿಂದ ನಮ್ಮ ತತ್ವಗಳಿಗೆ ಅನುಗುಣವಾಗಿ, ನಾವು gpt-oss ಮಾಡೆಲ್ಗಳಲ್ಲಿ CoT ಮೇಲೆ ಯಾವುದೇ ನೇರ ಮೇಲ್ವಿಚಾರಣೆಯನ್ನು ಇರಿಸಿಲ್ಲ. ಮಾಡೆಲ್ನ ತಪ್ಪು ವರ್ತನೆ, ವಂಚನೆ ಅಥವಾ ದುರ್ಬಳಕೆಯನ್ನು ಗಮನದಲ್ಲಿಡಲು ಇದು ಅತ್ಯಂತ ಮುಖ್ಯವೆಂದು ನಾವು ನಂಬುತ್ತೇವೆ. ನಮ್ಮ ನಿರೀಕ್ಷೆ ಏನೆಂದರೆ, ಮೇಲ್ವಿಚಾರಣೆಯಿಲ್ಲದ ಚೈನ್-ಆಫ್-ಥಾಟ್ ಹೊಂದಿರುವ open model ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡುವುದರಿಂದ, ಡೆವಲಪರ್ಗಳು ಮತ್ತು ಸಂಶೋಧಕರು ತಮ್ಮದೇ CoT ನಿಗಾದ ವ್ಯವಸ್ಥೆಗಳನ್ನು ಸಂಶೋಧಿಸಿ ಅನುಷ್ಠಾನಗೊಳಿಸುವ ಅವಕಾಶವನ್ನು ಪಡೆಯುತ್ತಾರೆ.
ಡೆವಲಪರ್ಗಳು ತಮ್ಮ ಅಪ್ಲಿಕೇಶನ್ಗಳಲ್ಲಿ ಬಳಕೆದಾರರಿಗೆ CoT ಗಳನ್ನು ನೇರವಾಗಿ ತೋರಿಸಬಾರದು. ಅವುಗಳಲ್ಲಿ ಕೃತಕವಾಗಿ ಸೃಷ್ಟಿಸಲಾದ ಅಥವಾ ಹಾನಿಕರ ವಿಷಯವಿರಬಹುದು, ಇದರಲ್ಲಿ OpenAI ಯ ಮಾನದಂಡದ ಸುರಕ್ಷತಾ ನೀತಿಗಳನ್ನು ಪ್ರತಿಬಿಂಬಿಸದ ಭಾಷೆಯೂ ಸೇರಿರಬಹುದು, ಮತ್ತು ಮಾದರಿಯನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ಅಂತಿಮ ಔಟ್ಪುಟ್ನಲ್ಲಿ ಸೇರಿಸಬಾರದೆಂದು ಕೇಳಲಾಗಿರುವ ಮಾಹಿತಿಯೂ ಇರಬಹುದು.
gpt-oss-120b ತನ್ನ ಔಟ್ಪುಟ್ನಲ್ಲಿ ಸಿಸ್ಟಮ್ ಸೂಚನೆಗಳನ್ನು ದೃಢವಾಗಿ ಅನುಸರಿಸುತ್ತದೆ, ಆದರೆ CoT (ಚೈನ್-ಆಫ್-ಥಾಟ್) ನಲ್ಲಿ ಸೂಚನೆಗಳನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ಉಲ್ಲಂಘಿಸುವ ಸಂದರ್ಭಗಳು ಹೆಚ್ಚಾಗಿರುತ್ತವೆ.
gpt-oss ಮಾಡೆಲ್ಗಳು ಸುರಕ್ಷತೆ ತರಬೇತಿಗಾಗಿ ನಮ್ಮ ಅತ್ಯಾಧುನಿಕ ವಿಧಾನಗಳನ್ನು ಬಳಸುತ್ತವೆ. ಪೂರ್ವ-ತರಬೇತಿ ಹಂತದಲ್ಲಿ, ನಾವು ರಾಸಾಯನಿಕ, ಜೈವಿಕ, ಕಿರಣೋತ್ಪಾದಕ ಮತ್ತು ಅಣು (CBRN) ಸಂಬಂಧಿಸಿದ ಕೆಲವು ಅಪಾಯಕಾರಿ ಡೇಟಾವನ್ನು ಹೊರತುಪಡಿಸಿದ್ದೇವೆ. ನಂತರದ ತರಬೇತಿ ಸಮಯದಲ್ಲಿ, ನಾವು ಮಾಡೆಲ್ ಅನ್ನು ಅಸುರಕ್ಷಿತ ಪ್ರಾಂಪ್ಟ್ಗಳನ್ನು ನಿರಾಕರಿಸಲು ಮತ್ತು ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ಗಳ ವಿರುದ್ಧ ರಕ್ಷಿಸಲು ಕಲಿಸಲು ಉದ್ದೇಶಪೂರ್ವಕ ಜೋಡಣೆ ಮತ್ತು ಸೂಚನೆ ಶ್ರೇಣೀಕರಣ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ವನ್ನು ಬಳಸಿದ್ದೇವೆ.
ಒಂದು ಓಪನ್ ವೆಯ್ಟ್ ಮಾಡೆಲ್ ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದ ನಂತರ, ವಿರೋಧಿಗಳು ಅದನ್ನು ದುರುದ್ದೇಶಗಳಿಗಾಗಿ ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡಲು ಸಾಧ್ಯವಾಗಬಹುದು. ನಾವು ಈ ಅಪಾಯಗಳನ್ನು ನೇರವಾಗಿ ಅಳೆಯಲು, ಮಾಡೆಲ್ ಅನ್ನು ಜೈವಿಕಶಾಸ್ತ್ರ ಮತ್ತು ಸೈಬರ್ಸುರಕ್ಷತೆ ಸಂಬಂಧಿತ ವಿಶೇಷ ಡೇಟಾದ ಮೇಲೆ ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡಿದ್ದೇವೆ — ಹೀಗಾಗಿ ಪ್ರತಿ ಡೊಮೇನ್ಗೆ ಆಕ್ರಮಣಕಾರಿಯೊಬ್ಬನು ಮಾಡಬಹುದಾದ ರೀತಿಯ ನಿರಾಕರಿಸದ ಆವೃತ್ತಿಯನ್ನು ರಚಿಸಿದ್ದೇವೆ. ನಂತರ ಈ ಮಾದರಿಗಳ ಸಾಮರ್ಥ್ಯವನ್ನು ಆಂತರಿಕ ಮತ್ತು ಬಾಹ್ಯ ಪರೀಕ್ಷೆಗಳ ಮೂಲಕ ಮೌಲ್ಯಮಾಪನ ಮಾಡಲಾಯಿತು. ಈ ಪರೀಕ್ಷೆ, ನಮ್ಮ ಸುರಕ್ಷತಾ ಪತ್ರದಲ್ಲಿ ವಿವರಿಸಿದಂತೆ, OpenAI ನ ಕ್ಷೇತ್ರ-ಪ್ರಮುಖ ತರಬೇತಿ ಸ್ಟ್ಯಾಕ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ದೃಢವಾದ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಮಾಡಿದರೂ, ಈ ದುರುದ್ದೇಶಪೂರಿತವಾಗಿ ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡಿದ ಮಾಡೆಲ್ಗಳು ನಮ್ಮ ಸಿದ್ಧತೆ ಚೌಕಟ್ಟಿನ ಪ್ರಕಾರ ಹೆಚ್ಚಿನ ಸಾಮರ್ಥ್ಯದ ಮಟ್ಟವನ್ನು ತಲುಪಲು ಸಾಧ್ಯವಾಗಲಿಲ್ಲ ಎಂದು ತೋರಿಸಿತು. ಈ ದುರುದ್ದೇಶಪೂರಿತ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ವಿಧಾನವನ್ನು ಮೂರು ಸ್ವತಂತ್ರ ತಜ್ಞ ಗುಂಪುಗಳು ಪರಿಶೀಲಿಸಿದವು, ಮತ್ತು ತರಬೇತಿ ಪ್ರಕ್ರಿಯೆ ಹಾಗೂ ಮೌಲ್ಯಮಾಪನವನ್ನು ಸುಧಾರಿಸಲು ಹಲವು ಶಿಫಾರಸುಗಳನ್ನು ಮಾಡಿದ್ದು, ಅವುಗಳಲ್ಲಿ ಬಹುಪಾಲುಗಳನ್ನು ನಾವು ಅಳವಡಿಸಿಕೊಂಡಿದ್ದೇವೆ. ಈ ಶಿಫಾರಸುಗಳ ವಿವರಗಳನ್ನು ನಾವು ಮಾಡೆಲ್ ಕಾರ್ಡ್ನಲ್ಲಿ ನೀಡಿದ್ದೇವೆ. ಈ ಕ್ರಮಗಳು ಮುಕ್ತ ಮಾಡೆಲ್ಗಳ ಸುರಕ್ಷತೆ ಕ್ಷೇತ್ರದಲ್ಲಿ ಅರ್ಥಪೂರ್ಣ ಪ್ರಗತಿಯನ್ನು ಸೂಚಿಸುತ್ತವೆ. ಈ ಶೋಧನೆಗಳು gpt-oss ಮಾಡೆಲ್ಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡುವ ನಮ್ಮ ನಿರ್ಧಾರಕ್ಕೆ ಆಧಾರವಾಗಿವೆ. ನಾವು ಈ ಮಾಡೆಲ್ಗಳು ಕೈಗಾರಿಕೆಯಲ್ಲಿ ಸುರಕ್ಷತೆ ತರಬೇತಿ ಮತ್ತು ಅಲೈನ್ಮೆಂಟ್ ಸಂಶೋಧನೆಗೆ ವೇಗ ನೀಡಲು ಸಹಾಯ ಮಾಡುವುದಾಗಿ ಆಶಿಸುತ್ತೇವೆ.
ಮುಕ್ತ ಮೂಲ ಪರಿಸರವನ್ನು ಇನ್ನಷ್ಟು ಸುರಕ್ಷಿತಗೊಳಿಸಲು, ನಾವು ಪ್ರಪಂಚದಾದ್ಯಂತದ ಸಂಶೋಧಕರು, ಡೆವಲಪರ್ಗಳು ಮತ್ತು ಉತ್ಸಾಹಿಗಳನ್ನು ನವೀನ ಸುರಕ್ಷತಾ ಸಮಸ್ಯೆಗಳನ್ನು ಗುರುತಿಸಲು ಪ್ರೋತ್ಸಾಹಿಸಲು ರೆಡ್ ಟೀಮಿಂಗ್ ಚಾಲೆಂಜ್(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಅನ್ನು ಆಯೋಜಿಸುತ್ತಿದ್ದೇವೆ. ಈ ಚಾಲೆಂಜ್ಗೆ OpenAI ಮತ್ತು ಇತರ ಪ್ರಮುಖ ಪ್ರಯೋಗಾಲಯಗಳ ತಜ್ಞರಿಂದಾದ ನ್ಯಾಯಾಧೀಶ ಮಂಡಳಿಯ ಪರಿಶೀಲನೆಯ ಆಧಾರದ ಮೇಲೆ ನೀಡಲಾಗುವ $500,000 ಬಹುಮಾನ ನಿಧಿಯಿದೆ. ಚಾಲೆಂಜ್ ಮುಗಿದ ನಂತರ, ನಾವು ಪರಿಶೀಲಿಸಲಾದ ಪತ್ತೆಗಳನ್ನು ಆಧರಿಸಿದ ವರದಿಯನ್ನು ಪ್ರಕಟಿಸಿ, ಮೌಲ್ಯಮಾಪನ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಓಪನ್-ಸೋರ್ಸ್ಆಗಿ ಬಿಡುಗಡೆ ಮಾಡುತ್ತೇವೆ — ಹೀಗಾಗಿ ವಿಸ್ತೃತ ಸಮುದಾಯ ತಕ್ಷಣವೇ ಅದರಿಂದ ಪ್ರಯೋಜನ ಪಡೆಯಬಹುದು. ಇಲ್ಲಿ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಇನ್ನಷ್ಟು ತಿಳಿಯಿರಿ ಮತ್ತು ಭಾಗವಹಿಸಿ.
gpt-oss-120b ಮತ್ತು gpt-oss-20b ಎರಡೂ ಮಾಡೆಲ್ಗಳ ವೇಟ್ಗಳು Hugging Face ನಲ್ಲಿ ಉಚಿತವಾಗಿ ಡೌನ್ಲೋಡ್ ಮಾಡಲು ಲಭ್ಯವಿದ್ದು, ಅವು ಮೂಲತಃ MXFP4 ಕ್ವಾಂಟೈಜ್ಡ್ ರೂಪದಲ್ಲಿ ಬರುತ್ತವೆ. ಇದರ ಮೂಲಕ gpt-oss-120B ಮಾಡೆಲ್ 80GB ಮೆಮೊರಿಯೊಳಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸಬಹುದು, ಮತ್ತು gpt-oss-20b ಕೇವಲ 16GB ಮೆಮೊರಿಯಷ್ಟೇ ಅಗತ್ಯಪಡಿಸುತ್ತದೆ.
ಮಾಡೆಲ್ಗಳನ್ನು ನಮ್ಮ harmony ಪ್ರಾಂಪ್ಟ್ ಸ್ವರೂಪ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ)ದಲ್ಲಿ ನಂತರದ ತರಬೇತಿ ಮಾಡಲಾಗಿದೆ, ಮತ್ತು ಅಳವಡಿಸಿಕೊಳ್ಳುವುದನ್ನು ಸುಲಭಗೊಳಿಸಲು Python ಮತ್ತು Rust ಎರಡರಲ್ಲೂ harmony ರೆಂಡರರ್(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಅನ್ನು ನಾವು ಓಪನ್-ಸೋರ್ಸಿಂಗ್ ಮಾಡುತ್ತಿದ್ದೇವೆ. ನಾವು PyTorch ಮತ್ತು Apple ನ Metal ಪ್ಲಾಟ್ಫಾರ್ಮ್ನಲ್ಲಿ ಊಹೆ ಮಾಡಲು ಅಗತ್ಯವಾದ ರೆಫರೆನ್ಸ್ ಇಂಪ್ಲಿಮೆಂಟೇಶನ್ಗಳನ್ನು ಮತ್ತು ಮಾಡೆಲ್ಗಾಗಿ ಉದಾಹರಣಾ ಉಪಕರಣಗಳ ಸಂಗ್ರಹವನ್ನು ಬಿಡುಗಡೆ ಮಾಡುತ್ತಿದ್ದೇವೆ.
ನಾವು ಈ ಮಾಡೆಲ್ಗಳನ್ನು ಎಲ್ಲೆಡೆ—ಸ್ಥಳೀಯವಾಗಿ, ಸಾಧನದಲ್ಲಿ ಅಥವಾ ಮೂರನೇ ವ್ಯಕ್ತಿ ಊಹೆ ಪೂರೈಕೆದಾರರ ಮೂಲಕ—ಸುಲಭವಾಗಿ ಮತ್ತು ಸುಲಭವಾಗಿ ರನ್ ಮಾಡುವಂತೆ ವಿನ್ಯಾಸಗೊಳಿಸಿದ್ದೇವೆ. ಇದನ್ನು ಬೆಂಬಲಿಸಲು, ನಾವು ಬಿಡುಗಡೆಗೆ ಮುನ್ನ Azure, Hugging Face, vLLM, Ollama, llama.cpp ಮುಂತಾದ ಪ್ರಮುಖ ನಿಯೋಜನೆ ಪ್ಲಾಟ್ಫಾರ್ಮ್ಗಳೊಂದಿಗೆ ಪಾಲುದಾರಿಕೆ ಮಾಡಿಕೊಂಡಿದ್ದೇವೆ. LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare ಮತ್ತು OpenRouter ಮಾಡೆಲ್ಗಳನ್ನು ಡೆವಲಪರ್ಗಳಿಗೆ ವ್ಯಾಪಕವಾಗಿ ಲಭ್ಯವಾಗುವಂತೆ ಮಾಡುತ್ತದೆ. ವಿವಿಧ ಸಿಸ್ಟಮ್ಗಳಲ್ಲಿ ಅತ್ಯುತ್ತಮ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಖಚಿತಪಡಿಸಲು—ಹಾರ್ಡ್ವೇರ್ ಭಾಗದಲ್ಲಿ, ನಾವು NVIDIA, AMD, Cerebras ಮತ್ತು Groq ಮುಂತಾದ ಕೈಗಾರಿಕಾ ಮುಂಚೂಣಿ ಕಂಪನಿಗಳೊಂದಿಗೆ ಸಹಕರಿಸಿದ್ದೇವೆ.
ಇಂದಿನ ಬಿಡುಗಡೆಯ ಭಾಗವಾಗಿ, Microsoft ಕೂಡ gpt-oss-20b ಮಾದರಿಯ GPU-ಆಪ್ಟಿಮೈಸ್ ಮಾಡಿದ ಆವೃತ್ತಿಗಳನ್ನು Windows ಸಾಧನಗಳಿಗೆ ತರಲಿದೆ. ONNX Runtime ನಿಂದ ರನ್ ಆಗುವ ಈ ಮಾಡೆಲ್ಗಳು ಸ್ಥಳೀಯ ಇನ್ಫರೆನ್ಸ್ಗೆ ಬೆಂಬಲ ನೀಡುತ್ತವೆ ಮತ್ತು Foundry Local ಹಾಗೂ VS Code ನ AI Toolkit ಮೂಲಕ ಲಭ್ಯವಿವೆ — ಇದರಿಂದ Windows ಡೆವಲಪರ್ಗಳು open models ಜೊತೆಗೆ ಸುಲಭವಾಗಿ ನಿರ್ಮಾಣ ಮಾಡಬಹುದು.
ತಮ್ಮದೇ ಪರಿಸರದಲ್ಲಿ ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡಿ ನಿಯೋಜಿಸಬಹುದಾದ ಪೂರ್ಣವಾಗಿ ಕಸ್ಟಮೈಸ್ ಮಾಡಬಹುದಾದ ಮಾಡೆಲ್ಗಳನ್ನು ಬಯಸುವ ಡೆವಲಪರ್ಗಳಿಗೆ gpt-oss ಅತ್ಯುತ್ತಮ ಆಯ್ಕೆಯಾಗಿದೆ. ಮಲ್ಟಿಮೋಡಲ್ ಬೆಂಬಲ, ಅಂತರ್ನಿರ್ಮಿತ ಉಪಕರಣಗಳು ಹಾಗೂ ನಮ್ಮ ಪ್ಲಾಟ್ಫಾರ್ಮ್ನೊಂದಿಗೆ ಸೌಮ್ಯ ಏಕೀಕರಣ ಬಯಸುವವರಿಗೆ, ನಮ್ಮ API ಪ್ಲಾಟ್ಫಾರ್ಮ್ನಲ್ಲಿ ಲಭ್ಯವಿರುವ ಮಾಡೆಲ್ಗಳು ಅತ್ಯುತ್ತಮ ಆಯ್ಕೆಯಾಗಿವೆ. ಡೆವಲಪರ್ಗಳ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ನಾವು ಎಚ್ಚರಿಕೆಯಿಂದ ಕೇಳುತ್ತಿದ್ದು, ಭವಿಷ್ಯದಲ್ಲಿ gpt-oss ಗೆ API ಬೆಂಬಲವನ್ನು ಪರಿಗಣಿಸಬಹುದು.
ನೀವು ಮಾಡೆಲ್ಗಳನ್ನು ಪ್ರಯತ್ನಿಸಲು ಬಯಸಿದರೆ, ನಮ್ಮ open model Playground(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಗೆ ಹೋಗಿ. ಮಾಡೆಲ್ಗಳನ್ನು ವಿಭಿನ್ನ ಪರಿಸರ ಪೂರೈಕೆದಾರರೊಂದಿಗೆ ಹೇಗೆ ಬಳಸುವುದು ಅಥವಾ ಮಾಡೆಲ್ಗಳನ್ನು ಹೇಗೆ ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡುವುದು ಎಂಬುದರ ಕುರಿತು ಇನ್ನಷ್ಟು ತಿಳಿಯಲು, ನಮ್ಮ ಮಾರ್ಗದರ್ಶಿಗಳನ್ನು ಪರಿಶೀಲಿಸಿ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ).
gpt-oss-120b ಮತ್ತು gpt-oss-20b ಬಿಡುಗಡೆ ಓಪನ್ ವೆಯ್ಟ್ ಮಾಡೆಲ್ಗಳ ಅಭಿವೃದ್ಧಿಯತ್ತ ಒಂದು ಪ್ರಮುಖ ಹೆಜ್ಜೆಯಾಗಿದೆ. ತಮ್ಮ ಗಾತ್ರದ ಮಟ್ಟದಲ್ಲಿ, ಈ ಮಾಡೆಲ್ಗಳು ತಾರ್ಕಿಕತೆಯ ಸಾಮರ್ಥ್ಯ ಮತ್ತು ಸುರಕ್ಷತೆ ಎರಡರಲ್ಲೂ ಅರ್ಥಪೂರ್ಣ ಪ್ರಗತಿಯನ್ನು ತೋರಿಸುತ್ತವೆ. Open models ನಮ್ಮ ಹೋಸ್ಟೆಡ್ ಮಾಡೆಲ್ಗಳನ್ನು ಪೂರಕವಾಗಿದ್ದು, ಡೆವಲಪರ್ಗಳಿಗೆ ಮುಂಚೂಣಿ ಸಂಶೋಧನೆಯನ್ನು ವೇಗಗೊಳಿಸಲು, ನಾವೀನ್ಯತೆಯನ್ನು ಉತ್ತೇಜಿಸಲು ಮತ್ತು ವಿವಿಧ ಉಪಯೋಗ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಹೆಚ್ಚು ಸುರಕ್ಷಿತ ಹಾಗೂ ಪಾರದರ್ಶಕ AI ಅಭಿವೃದ್ಧಿಯನ್ನು ಸಾಧ್ಯಮಾಡಲು ವಿಶಾಲ ಶ್ರೇಣಿಯ ಟೂಲ್ಗಳ ಆಯ್ಕೆಯನ್ನು ಒದಗಿಸುತ್ತವೆ.
ಈ open models ಹೊಸ ಮಾರುಕಟ್ಟೆಗಳು, ಸಂಪನ್ಮೂಲ-ಸೀಮಿತ ಕ್ಷೇತ್ರಗಳು ಮತ್ತು ಬಜೆಟ್ ಅಥವಾ ಸ್ವಾತಂತ್ರ್ಯವಿಲ್ಲದ ಸಣ್ಣ ಸಂಸ್ಥೆಗಳಿಗೂ ಸ್ವಾಮ್ಯದ ಮಾಡೆಲ್ಗಳನ್ನು ಅಳವಡಿಸಲು ಅಡೆತಡೆಗಳನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತವೆ. ತಮ್ಮ ಕೈಯಲ್ಲಿ ಶಕ್ತಿಶಾಲಿ ಮತ್ತು ಸುಲಭವಾಗಿ ಲಭ್ಯವಾಗುವ ಉಪಕರಣಗಳಿದ್ದಾಗ, ವಿಶ್ವದಾದ್ಯಂತದ ಜನರು ನಿರ್ಮಿಸಬಹುದು, ನಾವೀನ್ಯತೆ ತರಬಹುದು ಮತ್ತು ತಮ್ಮ ಹಾಗೂ ಇತರರಿಗಾಗಿ ಹೊಸ ಅವಕಾಶಗಳನ್ನು ಸೃಷ್ಟಿಸಬಹುದು. ಅಮೆರಿಕಾದಲ್ಲಿ ನಿರ್ಮಿಸಲಾದ ಈ ಶಕ್ತಿಶಾಲಿ ಓಪನ್ ವೆಯ್ಟ್ ಮಾಡೆಲ್ಗಳಿಗೆ ವ್ಯಾಪಕ ಪ್ರವೇಶ ನೀಡುವುದರಿಂದ ಜನತಾಂತ್ರಿಕ AI ಅಭಿವೃದ್ಧಿಯ ಹಾದಿಗಳನ್ನು ವಿಸ್ತರಿಸಲು ಸಹಾಯವಾಗುತ್ತದೆ.
ಆರೋಗ್ಯಕರ open model ಇಕೋಸಿಸ್ಟಮ್ ಎನ್ನುವುದು AI ಯನ್ನು ಎಲ್ಲರಿಗೂ ವ್ಯಾಪಕವಾಗಿ ಲಭ್ಯವಾಗುವ ಹಾಗೆ ಮತ್ತು ಉಪಯುಕ್ತವಾಗುವ ಹಾಗೆ ಮಾಡಲು ನೆರವಾಗುವ ಒಂದು ಪ್ರಮುಖ ಅಂಶವಾಗಿದೆ. ಡೆವಲಪರ್ಗಳು ಮತ್ತು ಸಂಶೋಧಕರು ಈ ಮಾಡೆಲ್ಗಳನ್ನು ಪ್ರಯೋಗಿಸಲು, ಸಹಕರಿಸಲು ಮತ್ತು ಸಾಧ್ಯತೆಯ ಗಡಿಗಳನ್ನು ವಿಸ್ತರಿಸಲು ನಾವು ಆಹ್ವಾನಿಸುತ್ತೇವೆ. ನೀವು ನಿರ್ಮಿಸುವುದನ್ನು ನೋಡಲು ನಾವು ಕಾತರರಾಗಿದ್ದೇವೆ.
ಲೇಖಕ
ಉಲ್ಲೇಖಗಳು
ಕೊಡುಗೆದಾರರು
Zoran Martinovic, Zhuohan Li, Zhiqing Sun, Zach Johnson, Yu Yang, Yu Bai, Yang Song, Xin Wang, Wenting Zhan, Volodymyr Kyrylov, Vlad Fomenko, Tyler Bertao, Tong Mu, Timur Garipov, Tarun Gogineni, Suvansh Sanjeev, Steve Mostovoy, Song Mei, Shengjia Zhao, Sebastien Bubeck, Scott McKinney, Scott Lessans, Sandhini Agarwal, Sam Toizer, Sam Altman, Saachi Jain, Romain Huet, Rahul K. Arora, Philippe Tillet, Olivia Watkins, Nivedita Brett, Nikhil Vyas, Miles Wang, Michihiro Yasunaga, Michelle Pokrass, Mia Glaese, Max Schwarzer, Mark Chen, Mario Lezcano-Casado, Marat Dukhan, Lukas Gross, Ludovic Peran, Ludovic Peran, Lindsay McCallum, Lin Yang, Lily (Xiaoxuan) Liu, Leher Pathak, Lama Ahmad, Kristian Georgiev, Kristen Ying, Kimmy Richardson, Kevin Whinnery, Kevin Weil, Kevin Lu, Kevin Fives, Kendal Simon, Katia Gil Guzman, Karan Singhal, Karan Singhal, Kai Chen, Josh McGrath, Jordan Liss, Jongsoo Park, John Hallman, Johannes Heidecke, Jiancheng Liu, Ji Lin, Jason Kwon, Jason Ai, James Park Lennon, Jakub Pachocki, Jacob Huh, Jackie Hehir, Irina Kofman, Huida Qiu, Hongyu Ren, Harshit Sikchi, Hannah Wong, Haitang Hu, Haitang Hu, Haiming Bao, Hadi Salman, Guillaume Leclerc, Greg Brockman, Gideon Myles, Giambattista Parascandolo, Gaby Raila, Foivos Tsimpourlas, Filippo Raso, Eugene Brevdo, Eric Wallace, Enoch Cheung, Elizabeth Proehl, Elaine Ya Le, Edwin Arbus, Eddie Zhang, Dominik Kundel, Dmitry Pimenov, David Robinson, Dane Stuckey, Dana Palmie, Dan Cook, Cyril Zhang, Chris Lu, Chris Koch, Che Chang, Cedric Whitney, Casey Dvorak, Carolina Paz, Brian Zhang, Bowen Baker, Bob Rotsted, Boaz Barak, Ashley Pantuliano, Andy Applebaum, Amy Wendling, Ally Bennett, Alexander Neitz, Alex Paino, Alex Nichol, Alec Helyar, Aidan McLaughlin, Aidan Clark, Adam Goucher


