gpt-ossను పరిచయం చేస్తున్నాము
gpt-oss-120b మరియు gpt-oss-20b ఓపెన్-వెయిట్ రీజనింగ్ మోడల్స్ సరిహద్దులను మరింత ముందుకు నెడుతున్నాయి.
మేము gpt-oss-120b మరియు gpt-oss-20b విడుదల చేస్తున్నాం—తక్కువ ఖర్చుతో బలమైన వాస్తవ ప్రపంచ పనితీరు అందించే రెండు స్టేట్-ఆఫ్-ది-ఆర్ట్ ఓపెన్-వెయిట్ లాంగ్వేజ్ మోడల్స్. ఫ్లెక్సిబుల్ Apache 2.0 లైసెన్స్ కింద అందుబాటులో ఉన్న ఈ మోడల్స్, సమాన పరిమాణం గల ఇతర ఓపెన్ మోడల్స్ కంటే రీజనింగ్ పనుల్లో మెరుగ్గా పనిచేస్తాయి, బలమైన టూల్ వినియోగ సామర్థ్యాలను ప్రదర్శిస్తాయి, మరియు వినియోగదారుల హార్డ్వేర్పై సమర్థవంతమైన డిప్లాయ్మెంట్ కోసం ఆప్టిమైజ్ చేయబడ్డాయి. ఇవి రీఇన్ఫోర్స్మెంట్ లెర్నింగ్ మరియు OpenAI యొక్క అత్యంత ఆధునిక ఇంటర్నల్ మోడల్స్, o3 సహా ఇతర ఫ్రంటియర్ సిస్టమ్స్ నుండి ప్రభావితం అయిన టెక్నిక్స్ మిశ్రమంతో శిక్షణ పొందినవి.
gpt-oss-120b మోడల్ కోర్ రీజనింగ్ బెంచ్మార్క్స్లో OpenAI o4-miniతో నియర్-పారిటీ స్థాయిని సాధిస్తుంది, అలాగే ఒకే 80 GB GPUపై ఎఫిషెంట్గా రన్ అవుతుంది. gpt-oss-20b మోడల్ కామన్ బెంచ్మార్క్స్లో OpenAI o3‑miniకు సమానమైన ఫలితాలు ఇస్తుంది మరియు కేవలం 16 GB మెమరీతో ఎడ్జ్ డివైసులపై నడపగలదు, అందువల్ల ఇది ఆన్-డివైస్ ఉపయోగాల కోసం, లోకల్ ఇన్ఫరెన్స్ కోసం లేదా ఖరీదైన ఇన్ఫ్రాస్ట్రక్చర్ అవసరం లేకుండా వేగవంతమైన పునరావృతాల కోసం అనుకూలంగా ఉంటుంది. రెండు మోడల్స్ కూడా టూల్ వాడకం, ఫ్యూ-షాట్ ఫంక్షన్ కాలింగ్, CoT రీజనింగ్ (టావ్-బెంచ్ ఏజెంటిక్ ఇవాల్యుయేషన్ సూట్ ఫలితాల్లో కనిపించినట్లుగా) మరియు హెల్త్బెంచ్లో బలంగా ప్రదర్శిస్తాయి — OpenAI o1 మరియు GPT‑4o వంటి ప్రొప్రైటరీ మోడల్స్ను కూడా మించిపోతాయి.
ఈ మోడల్స్ మా Responses API(కొత్త విండోలో తెరుచుకుంటుంది) తో అనుకూలంగా ఉంటాయి మరియు ఏజెంటిక్ వర్క్ఫ్లోల్లో ఉపయోగించేందుకు రూపొందించబడ్డాయి, ఇవి అద్భుతమైన సూచన అనుసరణ, వెబ్ సెర్చ్ లేదా పైథాన్ కోడ్ ఎగ్జిక్యూషన్ వంటి టూల్ వినియోగం, మరియు రీజనింగ్ సామర్థ్యాలతో కూడుకున్నవి—ఇవి క్లిష్టమైన రీజనింగ్ అవసరం లేని పనుల కోసం లేదా చాలా తక్కువ లేటెన్సీ ఫైనల్ అవుట్పుట్ల లక్ష్యంగా ఉన్నప్పుడు తర్క ప్రయత్నాన్ని సర్దుబాటు చేసే సామర్థ్యాన్ని కలిగి ఉంటాయి. ఇవి పూర్తిగా కస్టమైజ్ చేయగలిగేవి, పూర్తి చైన్-ఆఫ్-థాట్ (CoT) అందిస్తాయి, మరియు నిర్మాణాత్మక అవుట్పుట్లు(కొత్త విండోలో తెరుచుకుంటుంది) కు సపోర్ట్ చేస్తాయి.
మా అన్ని మోడల్స్ విడుదలలో సేఫ్టీ పునాది, మరియు ఓపెన్ మోడల్స్కు ఇది ప్రత్యేకంగా ముఖ్యమైనది. సమగ్ర సేఫ్టీ ట్రైనింగ్ మరియు ఈవాల్యూషన్లను పూర్తి చేయడంతో పాటు, మా Preparedness Framework(కొత్త విండోలో తెరుచుకుంటుంది) క్రింద gpt-oss-120b యొక్క adversarially fine-tuned వెర్షన్ను పరీక్షించడం ద్వారా మరో అదనపు ఈవాల్యుయేషన్ లేయర్ను కూడా ప్రవేశపెట్టాము.gpt-oss మోడల్స్ మా ఫ్రంట్ియర్ మోడల్స్లా అంతర్గత సేఫ్టీ బెంచ్మార్క్స్లో సమాన స్థాయి పనితీరు చూపిస్తాయి. దీంతో డెవలపర్లకు మా ఇటీవలి స్వంత మోడల్స్ లాంటి సేఫ్టీ స్టాండర్డ్స్ అందుతాయి.మేము ఆ పనికి సంబంధించిన ఫలితాలు మరియు మరిన్ని వివరాలను రిసెర్చ్ పేపర్లో(కొత్త విండోలో తెరుచుకుంటుంది) మరియు మోడల్ కార్డ్లో(కొత్త విండోలో తెరుచుకుంటుంది) పంచుకుంటున్నాం. మా మెథడాలజీని ఎక్స్టర్నల్ ఎక్స్పర్ట్స్ సమీక్షించారు మరియు ఇది ఓపెన్-వెయిట్ మోడల్స్ కోసం కొత్త సేఫ్టీ ప్రమాణాలను స్థాపించడంలో ముందడుగు సూచిస్తుంది.
మేము AI Sweden(కొత్త విండోలో తెరుచుకుంటుంది), Orange(కొత్త విండోలో తెరుచుకుంటుంది), Snowflake(కొత్త విండోలో తెరుచుకుంటుంది) వంటి ప్రారంభ భాగస్వాములతో కలిసి పనిచేస్తున్నాము. మా ఓపెన్ మోడల్స్ను నిజ జీవితంలో ఎలా ఉపయోగిస్తున్నారో తెలుసుకోవడానికి—డేటా సెక్యూరిటీ కోసం మోడల్స్ను ఆన్-ప్రెమైసెస్లో హోస్ట్ చేయడం నుండి, ప్రత్యేకమైన డేటాసెట్స్పై ఫైన్-ట్యూన్ చేయడం వరకు.మేము ఈ బెస్ట్-ఇన్-క్లాస్ ఓపెన్ మోడల్స్ను అందించడం ద్వారా, వ్యక్తిగత డెవలపర్స్ నుండి పెద్ద ఎంటర్ప్రైజెస్ వరకు, ప్రభుత్వాల వరకు—ప్రతిఒక్కరికి తమ స్వంత ఇన్ఫ్రాస్ట్రక్చర్పై AIను రన్ చేసి, కస్టమైజ్ చేసుకునే శక్తిని ఇవ్వడం పట్ల మేము ఉత్సాహంగా ఉన్నాం. మా APIలో అందుబాటులో ఉన్న మోడల్స్తో కలిపి, డెవలపర్లు తమ AI వర్క్ఫ్లోస్కి కావలసిన పనితీరు, ఖర్చు, మరియు లేటెన్సీని ఎంచుకోవచ్చు.
gpt-oss మోడల్స్ మా అత్యాధునిక ప్రీ-ట్రైనింగ్ మరియు పోస్ట్-ట్రైనింగ్ టెక్నిక్స్ ఉపయోగించి శిక్షణ పొందినవి, ప్రత్యేకంగా తార్కికత, సమర్థత, మరియు విస్తృత డిప్లాయ్మెంట్ ఎన్విరాన్మెంట్స్లో వాస్తవ ప్రపంచంలో ఉపయోగకరతపై దృష్టి పెట్టి. Whisper మరియు CLIP వంటి ఇతర నమూనాలను బహిరంగంగా అందుబాటులో ఉంచినప్పటికీ, gpt-oss నమూనాలు GPT‑2 నుండి మా మొదటి ఓపెన్-వెయిట్ భాషా నమూనాలు[1].
ప్రతి మోడల్ ఒక ట్రాన్స్ఫార్మర్, ఇది ఇన్పుట్ను ప్రాసెస్ చేయడానికి అవసరమైన క్రియాశీల పారామితుల సంఖ్యను తగ్గించడానికి మిశ్రమ-ఆఫ్-ఎక్స్పర్ట్స్ (MoE[2]) ను ఉపయోగిస్తుంది. gpt-oss-120b ప్రతి టోకెన్కు 5.1B పారామీటర్స్ను యాక్టివేట్ చేస్తుంది, ఇక gpt-oss-20b 3.6Bను యాక్టివేట్ చేస్తుంది.ఈ మోడల్స్లో మొత్తం పారామీటర్లు వరుసగా 117B మరియు 21B ఉన్నాయి. మోడల్స్ GPT‑3[3] వంటి ఆల్టర్నేటింగ్ డెన్స్ మరియు లోకల్లి బ్యాండెడ్ స్పార్స్ అటెన్షన్ ప్యాటర్న్స్ను ఉపయోగిస్తాయి. అనుమానం మరియు మెమరీ సామర్థ్యం కోసం, నమూనాలు 8 సమూహ పరిమాణంతో సమూహ బహుళ-ప్రశ్న దృష్టిని కూడా ఉపయోగిస్తాయి. మేము స్థానిక ఎన్కోడింగ్ కోసం రోటరీ పొజిషనల్ ఎంబెడ్డింగ్ (RoPE[4]) ను ఉపయోగిస్తాము మరియు 128k వరకు సందర్భ పొడవులకు మద్దతు ఇస్తాము.
"మోడల్" | లేయర్స్ | Total Params | ప్రతి టోకెన్కు యాక్టివ్ పారామ్స్ | టోటల్ ఎక్స్పర్ట్స్ | ప్రతి టోకెన్కు యాక్టివ్ పారామ్స్ | కాంటెక్స్ట్ లెంగ్త్ |
gpt-oss-120b | 36 | 117B | 5.1B | 128 | 4 | 128k |
gpt-oss-20b | 24 | 21B | 3.6B | 32 | 4 | 128k |
మేము మోడల్స్ను ఎక్కువగా ఇంగ్లీష్, టెక్స్ట్-ఓన్లీ డేటాసెట్పై ట్రైన్ చేశాము, ఇందులో STEM, కోడింగ్, మరియు సాధారణ జ్ఞానంపై దృష్టి పెట్టాం. మేము OpenAI o4-mini మరియు GPT‑4o కోసం ఉపయోగించిన మా టోకనైజర్ యొక్క సూపర్సెట్ అయిన o200k_harmonyతో డేటాను టోకనైజ్ చేశాం, దీన్ని కూడా ఈ రోజు ఓపెన్-సోర్స్ చేస్తున్నాం.
మా మోడల్స్ ఆర్కిటెక్చర్ మరియు ట్రైనింగ్ గురించి మరింత తెలుసుకోవాలంటే model card(కొత్త విండోలో తెరుచుకుంటుంది) చదవండి.
మోడల్స్ను o4-miniలో ఉపయోగించినట్లే ఒక సమానమైన ప్రక్రియతో పోస్ట్-ట్రైన్ చేశారు, ఇందులో పర్యవేక్షించబడిన ఫైన్-ట్యూనింగ్ దశ మరియు హై-కంప్యూట్ RL దశ ఉన్నాయి. మా లక్ష్యం ఈ మోడల్స్ను OpenAI Model Spec(కొత్త విండోలో తెరుచుకుంటుంది)కు అనుగుణంగా మార్చడం, అలాగే సమాధానం ఇవ్వడానికి ముందే CoT రీజనింగ్ మరియు టూల్ల వినియోగం ఎలా ఉపయోగించాలో నేర్పడం.మా SoTA ప్రొప్రైటరీ రీజనింగ్ మోడల్స్లో ఉపయోగించిన అదే టెక్నిక్స్తో, ఈ మోడల్స్ పోస్ట్-ట్రైనింగ్ తర్వాత అసాధారణమైన కెపాబిలిటీస్ని ప్రదర్శిస్తున్నాయి.
APIలో ఉన్న OpenAI o-series రీజనింగ్ మోడల్స్లా, ఈ రెండు ఓపెన్-వెయిట్ మోడల్స్ మూడు రీజనింగ్ ఎఫర్ట్స్కి సపోర్ట్ చేస్తాయి—లో, మిడియం, మరియు హై—ఇవి లేటెన్సీ మరియు పనితీరు మధ్య ట్రేడ్ ఆఫ్ను సూచిస్తాయి. డెవలపర్స్ సిస్టమ్ మెసేజ్లో ఒక వాక్యంతోనే రీజనింగ్ ఎఫర్ట్ను సులభంగా సెట్ చేయవచ్చు.
gpt-oss-120b మరియు gpt-oss-20bను స్టాండర్డ్ అకాడెమిక్ బెంచ్మార్క్స్పై ఇవాల్యుయేట్ చేసి, కోడింగ్, కంపిటీషన్ మ్యాథ్, హెల్త్, మరియు ఏజెంటిక్ టూల్ యూజ్లో వీటి కెపాబిలిటీస్ని o3, o3‑mini మరియు o4-mini సహా ఇతర OpenAI రీజనింగ్ మోడల్స్తో పోల్చాము.
gpt-oss-120b కంపిటీషన్ కోడింగ్ (Codeforces), జనరల్ ప్రాబ్లమ్ సాల్వింగ్ (MMLU మరియు HLE), మరియు టూల్ కాలింగ్ (TauBench)లో OpenAI o3‑mini కంటే మెరుగ్గా, మరియు OpenAI o4-miniతో సమానంగా లేదా దాన్ని మించిపోతూ ప్రదర్శిస్తుంది. ఇది ఆరోగ్య-సంబంధిత ప్రశ్నలపై o4-మినీ కంటే ఇంకా మెరుగ్గా చేస్తుంది (HealthBench) మరియు పోటీ గణితం (AIME 2024 & 2025). GPT‑oss‑20b ఈ అదే మూల్యాంకనలలో OpenAI o3‑miniని సరిపోలిస్తుంది లేదా మించిపోతుంది, దాని చిన్న పరిమాణం ఉన్నప్పటికీ, పోటీ గణితం మరియు ఆరోగ్య రంగాలలో కూడా దానిని అధిగమిస్తుంది.
gpt-oss మోడల్స్ ఒక మెడికల్ ప్రొఫెషనల్ను రీప్లేస్ చేయవు మరియు వ్యాధి డయాగ్నోసిస్ లేదా ట్రీట్మెంట్ కోసం ఉద్దేశించబడలేదు
ఉదాహరణ రోల్ఔట్స్
gpt-oss-120b ఒక బ్రౌజింగ్ టూల్ ఉపయోగించి తాజా సమాచారాన్ని వేగంగా అగ్రిగేట్ చేయగలదు, ఇందులో పదులకొద్దీ సబ్సీక్వెంట్ కాల్స్ని కలిపి చైన్ చేయడం కూడా ఉంటుంది.
మా తాజా రీసెర్చ్ చూపించింది: ఒక రీజనింగ్ మోడల్ యొక్క CoTని మానిటర్ చేయడం, మోడల్ను CoTకి అలైన్ చేయడానికి డైరెక్ట్ సూపర్విజన్తో ట్రైన్ చేయకపోతే, మిస్బిహేవియర్ గుర్తించడంలో సహాయపడుతుంది. ఈ దృక్కోణం ఇండస్ట్రీలో ఇతరులచే కూడా షేర్ చేయబడింది(కొత్త విండోలో తెరుచుకుంటుంది). OpenAI o1‑ప్రివ్యూ ప్రారంభించినప్పటి నుండి మా సూత్రాలకు అనుగుణంగా, మేము GPT‑oss నమూనాల కోసం CoT పై ఎటువంటి ప్రత్యక్ష పర్యవేక్షణను ఉంచలేదు. మోడల్ మిస్బిహేవియర్, డిసెప్షన్ మరియు మిస్యూస్ను మానిటర్ చేయడం అత్యంత ముఖ్యమని మేము నమ్ముతున్నాం. నాన్-సూపర్వైజ్డ్ చైన్-ఆఫ్-థాట్తో ఓపెన్ మోడల్ విడుదల చేయడం ద్వారా, డెవలపర్లు మరియు పరిశోధకులు తమ స్వంత CoT మానిటరింగ్ సిస్టమ్స్ను పరిశోధించి, అమలు చేసుకునే అవకాశం పొందుతారని మేము ఆశిస్తున్నాం.
డెవలపర్స్ తమ అప్లికేషన్స్లో యూజర్స్కి CoTsను డైరెక్ట్గా చూపకూడదు. అవి హాల్యూసినేటెడ్ లేదా హానికరమైన కంటెంట్ను కలిగి ఉండవచ్చు, ఇందులో OpenAI యొక్క ప్రామాణిక భద్రతా విధానాలను ప్రతిబింబించని భాష కూడా ఉండవచ్చు, మరియు మోడల్ను తుది అవుట్పుట్లో చేర్చవద్దని స్పష్టంగా అడిగిన సమాచారం కూడా ఉండవచ్చు.
gpt-oss-120b అవుట్పుట్లో సిస్టమ్ ఇన్స్ట్రక్షన్లను బలంగా అనుసరిస్తుంది, కానీ CoTలో మాత్రం కొన్ని ఇన్స్ట్రక్షన్లను స్పష్టంగా అనుసరించకుండా ప్రవర్తిస్తుంది.
gpt-oss మోడల్స్ సేఫ్టీ ట్రైనింగ్ కోసం మా స్టేట్-ఆఫ్-ఆర్ట్ అప్రోచెస్ను ఉపయోగిస్తున్నాయి. ప్రీ-ట్రైనింగ్ సమయంలో, కెమికల్, బయోలాజికల్, రేడియాలాజికల్, మరియు న్యూక్లియర్ (CBRN)కి సంబంధించిన కొన్ని హానికరమైన డేటాను మేము ఫిల్టర్ చేశాం. పోస్ట్-ట్రైనింగ్ సమయంలో, మేము డెలిబరేటివ్ అలైన్మెంట్ మరియు ఇన్స్ట్రక్షన్ హైరార్కీ(కొత్త విండోలో తెరుచుకుంటుంది) విధానాలను ఉపయోగించి, మోడల్కి అసురక్షితమైన ప్రాంప్ట్లను తిరస్కరించడం మరియు ప్రాంప్ట్ ఇంజెక్షన్ల నుంచి రక్షించుకోవడం ఎలా అనేది నేర్పాము.
ఓపెన్-వెయిట్ మోడల్ విడుదలైన తర్వాత, విరుద్ధపక్షాలు దానిని దుష్ట ఉద్దేశాల కోసం ఫైన్-ట్యూన్ చేసే అవకాశం ఉంటుంది.మేము ఈ రిస్క్స్ని డైరెక్ట్గా అసెస్ చేశాం, బయాలజీ మరియు సైబర్సెక్యూరిటీ స్పెషలైజ్డ్ డేటాపై మోడల్ను ఫైన్-ట్యూన్ చేసి, ప్రతి డొమైన్కి అటాకర్ చేయగలిగినట్లుగా డొమైన్-స్పెసిఫిక్ నాన్-రిఫ్యూసింగ్ వెర్షన్ సృష్టించాం. తర్వాత ఈ మోడల్స్కి సంబంధించిన కెపాబిలిటీ లెవెల్ని ఇంటర్నల్ మరియు ఎక్స్టర్నల్ టెస్టింగ్ ద్వారా ఇవాల్యుయేట్ చేశాం. ఈ పరీక్షలు—మా safety paperలో వివరించినట్లుగా—OpenAI యొక్క ఫీల్డ్-లీడింగ్ ట్రైనింగ్ స్టాక్ను ఉపయోగించి బలంగా ఫైన్-ట్యూన్ చేసినా కూడా, దుష్ట ఉద్దేశాలతో ఫైన్-ట్యూన్ చేసిన ఈ మోడల్స్ మా Preparedness Framework ప్రకారం అధిక సామర్థ్య స్థాయులకు చేరుకోలేకపోయాయని సూచించాయి.ఈ హానికరమైన ఫైన్-ట్యూనింగ్ పద్దతిని మూడు స్వతంత్ర నిపుణుల బృందాలు సమీక్షించాయి, వారు శిక్షణ ప్రక్రియ మరియు మూల్యాంకనాలను మెరుగుపరచడానికి సిఫార్సులు చేశారు, వాటిలో చాలా వరకు మేము స్వీకరించాము. ఈ రికమండేషన్స్ను మేము మోడల్ కార్డ్లో వివరించాం. ఈ ప్రాసెస్లు ఓపెన్ మోడల్ సేఫ్టీ కోసం ఒక అర్థవంతమైన అడ్వాన్స్మెంట్ను సూచిస్తున్నాయి. ఈ ఫైండింగ్స్ gpt-oss మోడల్స్ విడుదల చేయాలనే మా నిర్ణయాన్ని ప్రభావితం చేశాయి. ఈ మోడల్స్ సేఫ్టీ ట్రైనింగ్ మరియు అలైన్మెంట్ రీసెర్చ్ను ఇండస్ట్రీ అంతటా వేగవంతం చేయడంలో సహాయపడతాయని మేము ఆశిస్తున్నాం.
మరింత సురక్షితమైన ఓపెన్ సోర్స్ ఎకోసిస్టమ్కు తోడ్పడేందుకు, మేము రెడ్ టీమింగ్ ఛాలెంజ్(కొత్త విండోలో తెరుచుకుంటుంది) ను నిర్వహిస్తున్నాము, ఇది ప్రపంచవ్యాప్తంగా ఉన్న రీసెర్చర్స్, డెవలపర్స్, మరియు ఎన్థూసియాస్ట్స్ను కొత్త సేఫ్టీ సమస్యలను గుర్తించడంలో సహాయపడేందుకు ప్రోత్సహిస్తుంది. ఈ ఛాలెంజ్లో $500,000 ప్రైజ్ ఫండ్ ఉంది, ఇది OpenAI మరియు ఇతర ప్రముఖ ల్యాబ్స్ నుండి నిపుణుల జడ్జెస్ ప్యానెల్ సమీక్ష ఆధారంగా అందజేయబడుతుంది. ఛాలెంజ్ ముగిసిన తర్వాత, మేము ఒక రిపోర్ట్ను ప్రచురించి, వాలిడేటెడ్ ఫైండింగ్స్ ఆధారంగా ఒక ఇవాల్యుయేషన్ డేటాసెట్ను ఓపెన్-సోర్స్ చేస్తాము, తద్వారా విస్తృత కమ్యూనిటీ వెంటనే లాభపడుతుంది. మరింత తెలుసుకోండి మరియు పాల్గొనండి (కొత్త విండోలో తెరుచుకుంటుంది)ఇక్కడ.
gpt-oss-120b మరియు gpt-oss-20b రెండింటి వెయిట్స్ Hugging Faceలో ఉచితంగా డౌన్లోడ్ చేసుకోవడానికి అందుబాటులో ఉన్నాయి, మరియు ఇవి సహజంగానే MXFP4లో క్వాంటైజ్ చేయబడ్డాయి. దీని వల్ల gpt-oss-120B మోడల్ 80GB మెమరీలో రన్ అవుతుంది, gpt-oss-20b కి కేవలం 16GB అవసరం.
మోడల్స్ను మా హార్మనీ ప్రాంప్ట్ ఫార్మాట్(కొత్త విండోలో తెరుచుకుంటుంది) పై పోస్ట్-ట్రైనింగ్ చేశాము. అలాగే Python మరియు Rust రెండింటిలోనూ పనిచేసే హార్మనీ రెండరర్(కొత్త విండోలో తెరుచుకుంటుంది) ను ఓపెన్-సోర్స్గా విడుదల చేసి దాని వినియోగాన్ని మరింత సులభం చేస్తున్నాము.PyTorchతో మరియు Apple యొక్క మెటల్ ప్లాట్ఫారమ్ లో ఇన్ఫరెన్స్ రన్ చేయడానికి రిఫరెన్స్ ఇంప్లిమెంటేషన్స్తో పాటు, మోడల్ కోసం ఉదాహరణ టూల్స్ కలెక్షన్ని కూడా మేము రిలీజ్ చేస్తున్నాం.
ఈ మోడల్స్ను ఫ్లెక్సిబుల్గా, ఎక్కడైనా సులభంగా రన్ అయ్యేలా మేము డిజైన్ చేశాం—లోకల్లీ, ఆన్-డివైస్, లేదా థర్డ్-పార్టీ ఇన్ఫరెన్స్ ప్రొవైడర్స్ ద్వారా. దీనికి మద్దతు ఇవ్వడానికి, మేము ప్రారంభానికి ముందే అజూర్, Hugging Face, vLLM, Ollama, llama.cpp వంటి ప్రముఖ డిప్లాయ్మెంట్ ప్లాట్ఫారమ్లతో భాగస్వామ్యం చేసాము, నమూనాలను డెవలపర్లకు విస్తృతంగా అందుబాటులో ఉంచడానికి ఎల్ఎం స్టూడియో, AWS, ఫైర్వర్క్స్, టుగెదర్ AI, బేసెటెన్, డేటాబ్రిక్స్, వెర్సెల్, క్లౌడ్ఫ్లేర్ మరియు ఓపెన్రూటర్. హార్డ్వేర్ వైపు, NVIDIA, AMD, Cerebras, మరియు Groq వంటి ఇండస్ట్రీ లీడర్స్తో కలిసి పనిచేసి, వివిధ సిస్టమ్స్లో ఆప్టిమైజ్డ్ పనితీరు నిర్ధారించాం.
ఈరోజు విడుదలలో భాగంగా, Microsoft కూడా gpt-oss-20b మోడల్ యొక్క GPU-ఆప్టిమైజ్డ్ వెర్షన్స్ని Windows డివైసులకి తీసుకువస్తోంది. ONNX Runtime ద్వారా నడిచే ఈ మోడల్స్ లోకల్ ఇన్ఫరెన్స్కి సపోర్ట్ చేస్తాయి, మరియు Foundry Local మరియు AI Toolkit for VS Code ద్వారా అందుబాటులో ఉన్నాయి, దీని వల్ల Windows డెవలపర్స్ ఓపెన్ మోడల్స్తో బిల్డ్ చేయడం సులభమవుతుంది.
తమ స్వంత ఎన్విరాన్మెంట్స్లో ఫైన్-ట్యూన్ చేసి, డిప్లాయ్ చేయగలిగే ఫుల్ కస్టమైజబుల్ మోడల్స్ కావాలనుకునే డెవలపర్స్కి, gpt-oss ఒక గొప్ప ఎంపిక. మల్టీమోడల్ సపోర్ట్, బిల్ట్-ఇన్ టూల్స్, మరియు మా ప్లాట్ఫారమ్తో సీమ్లెస్ ఇంటిగ్రేషన్ కావాలనుకునే వారికి, మా API ప్లాట్ఫారమ్లో అందుబాటులో ఉన్న మోడల్స్ ఉత్తమమైన ఆప్షన్గా ఉంటాయి. మేము డెవలపర్ ఫీడ్బ్యాక్ని దగ్గరగా వింటూ కొనసాగిస్తున్నాం, భవిష్యత్తులో gpt-ossకి API సపోర్ట్ని పరిగణించవచ్చు.
మీరు మోడల్స్ని ప్రయత్నించాలనుకుంటే, మా ఓపెన్ మోడల్ ప్లేగ్రౌండ్(కొత్త విండోలో తెరుచుకుంటుంది)కి వెళ్లండి. మోడల్స్ను వివిధ ఎకోసిస్టమ్ ప్రొవైడర్స్ ఉపయోగించే విధానం లేదా మోడల్స్ను ఫైన్-ట్యూన్ చేయడం గురించి మరింత తెలుసుకోవడానికి, మా గైడ్స్ను చూడండి(కొత్త విండోలో తెరుచుకుంటుంది).
gpt-oss-120b మరియు gpt-oss-20b విడుదల, ఓపెన్-వెయిట్ మోడల్స్కి ఒక ముఖ్యమైన ముందడుగును సూచిస్తుంది. వాటి సైజ్లోనే, ఈ మోడల్స్ రీజనింగ్ కెపాబిలిటీస్ మరియు సేఫ్టీలో అర్థవంతమైన అడ్వాన్స్మెంట్స్ను అందిస్తాయి. ఓపెన్ మోడల్స్ మా హోస్టెడ్ మోడల్స్ను పూరకంగా ఉండి, డెవలపర్లకు లీడింగ్-ఎడ్జ్ రీసెర్చ్ను వేగవంతం చేయడానికి, ఇన్నోవేషన్ను ప్రోత్సహించడానికి, మరియు విస్తృత యూజ్ కేసులలో సురక్షితమైన, మరింత పారదర్శకమైన AI అభివృద్ధిని సాధించడానికి విస్తృతమైన టూల్స్ను అందిస్తాయి.
ఈ ఓపెన్ మోడల్స్, ప్రొప్రైటరీ మోడల్స్ను అంగీకరించడానికి బడ్జెట్ లేదా సౌలభ్యం లేని ఎమర్జింగ్ మార్కెట్లకు, వనరుల పరిమితి ఉన్న రంగాలకు, మరియు చిన్న సంస్థలకు అడ్డంకులను తగ్గిస్తాయి. శక్తివంతమైన, సులభంగా అందుబాటులో ఉండే టూల్స్ తమ చేతుల్లో ఉన్నప్పుడు, ప్రపంచవ్యాప్తంగా ప్రజలు బిల్డ్ చేయగలరు, ఇన్నోవేట్ చేయగలరు, మరియు తమకు, ఇతరులకు కొత్త అవకాశాలను సృష్టించగలరు. అమెరికాలో సృష్టించిన ఈ కెపబుల్ ఓపెన్-వెయిట్స్ మోడల్స్కి విస్తృత యాక్సెస్, డెమోక్రటిక్ AI రైల్స్ని విస్తరించడంలో సహాయపడుతుంది.
ఒక ఆరోగ్యకరమైన ఓపెన్ మోడల్ ఎకోసిస్టమ్, AIని విస్తృతంగా అందుబాటులోకి తెచ్చి, ప్రతి ఒక్కరికి లాభదాయకంగా మార్చడంలో ఒక ముఖ్యమైన దిశ. డెవలపర్స్ మరియు రీసెర్చర్స్ ఈ మోడల్స్ను ఉపయోగించి ప్రయోగాలు చేయాలని, కలబోరేట్ కావాలని, మరియు సాధ్యమయ్యే సరిహద్దులను మరింత ముందుకు నెట్టాలని మేము ఆహ్వానిస్తున్నాం. మీరు ఏమి బిల్డ్ చేస్తారో చూడడానికి మేము ఆసక్తిగా ఎదురుచూస్తున్నాం.
రచయిత
సూచనలు
సహకారులు
Zoran Martinovic, Zhuohan Li, Zhiqing Sun, Zach Johnson, Yu Yang, Yu Bai, Yang Song, Xin Wang, Wenting Zhan, Volodymyr Kyrylov, Vlad Fomenko, Tyler Bertao, Tong Mu, Timur Garipov, Tarun Gogineni, Suvansh Sanjeev, Steve Mostovoy, Song Mei, Shengjia Zhao, Sebastien Bubeck, Scott McKinney, Scott Lessans, Sandhini Agarwal, Sam Toizer, Sam Altman, Saachi Jain, Romain Huet, Rahul K. Arora, Philippe Tillet, Olivia Watkins, Nivedita Brett, Nikhil Vyas, Miles Wang, Michihiro Yasunaga, Michelle Pokrass, Mia Glaese, Max Schwarzer, Mark Chen, Mario Lezcano-Casado, Marat Dukhan, Lukas Gross, Ludovic Peran, Ludovic Peran, Lindsay McCallum, Lin Yang, Lily (Xiaoxuan) Liu, Leher Pathak, Lama Ahmad, Kristian Georgiev, Kristen Ying, Kimmy Richardson, Kevin Whinnery, Kevin Weil, Kevin Lu, Kevin Fives, Kendal Simon, Katia Gil Guzman, Karan Singhal, Karan Singhal, Kai Chen, Josh McGrath, Jordan Liss, Jongsoo Park, John Hallman, Johannes Heidecke, Jiancheng Liu, Ji Lin, Jason Kwon, Jason Ai, James Park Lennon, Jakub Pachocki, Jacob Huh, Jackie Hehir, Irina Kofman, Huida Qiu, Hongyu Ren, Harshit Sikchi, Hannah Wong, Haitang Hu, Haitang Hu, Haiming Bao, Hadi Salman, Guillaume Leclerc, Greg Brockman, Gideon Myles, Giambattista Parascandolo, Gaby Raila, Foivos Tsimpourlas, Filippo Raso, Eugene Brevdo, Eric Wallace, Enoch Cheung, Elizabeth Proehl, Elaine Ya Le, Edwin Arbus, Eddie Zhang, Dominik Kundel, Dmitry Pimenov, David Robinson, Dane Stuckey, Dana Palmie, Dan Cook, Cyril Zhang, Chris Lu, Chris Koch, Che Chang, Cedric Whitney, Casey Dvorak, Carolina Paz, Brian Zhang, Bowen Baker, Bob Rotsted, Boaz Barak, Ashley Pantuliano, Andy Applebaum, Amy Wendling, Ally Bennett, Alexander Neitz, Alex Paino, Alex Nichol, Alec Helyar, Aidan McLaughlin, Aidan Clark, Adam Goucher


